码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 使用CUDA计算GPU的理论显存带宽


    文章目录

    • 一、显存带宽和理论显存带宽
      • 1. 显存带宽
      • 2. 理论显存带宽
        • 1)计算公式
        • 2)举例
    • 二、利用CUDA计算理论显存带宽


    一、显存带宽和理论显存带宽

    1. 显存带宽

    显存带宽是指显存和GPU计算单元之间的数据传输速率。

    显存带宽越大,意味着数据传输越快,那么GPU整体的计算速度也会越快。所以该指标可以作为我们评估核函数运行速度的评价指标。

    在这里插入图片描述

    2. 理论显存带宽

    1)计算公式

    理论显存带宽由具体硬件所定义。计算公式为:

    理论显存带宽 = 显存频率(Hz) * 显存位宽(bit) / 8 * 2    
    // 这里除以8是因为位宽的单位是bit,我们要转成 byte
    // * 2 是因为 DDR(double data rate)
    
    • 1
    • 2
    • 3

    2)举例

    以我的笔记本电脑为例:

    GPU型号: NVIDIA GeForce RTX 3050 4GB Laptop GPU
    显存频率:7001000 kHz
    显存位宽:64 bit
    
    理论显存带宽 = (7001000 * 1000)Hz * (64 / 8)byte * 2 = 112016000000 byte/s ≈ 112 GB/s
    
    • 1
    • 2
    • 3
    • 4
    • 5

    与鲁大师的检测结果一致:
    在这里插入图片描述


    二、利用CUDA计算理论显存带宽

    主要使用到了cudaGetDeviceProperties()函数。该函数用于获取GPU的相关属性信息。

    具体代码如下:

    #include "cuda_runtime.h"
    #include "device_launch_parameters.h"
    
    void CalTheoreticalBandWidth()
    {
        int deviceCount;
        cudaGetDeviceCount(&deviceCount);               // 获取设备上的GPU个数
    
        for (int i = 0; i < deviceCount; ++i) {
            cudaDeviceProp deviceProp;
            cudaGetDeviceProperties(&deviceProp, i);    // 获取当前GPU的相关属性
    
    
            std::cout << "GPU: " << i << std::endl;
            std::cout << "Name: " << deviceProp.name << std::endl;
            std::cout << "Bit width: " << deviceProp.memoryBusWidth << " bit" << std::endl;
            std::cout << "Memory clock rate: " << deviceProp.memoryClockRate << " kHz" << std::endl;
    
            int bw = static_cast<size_t>(deviceProp.memoryClockRate) * 1000 * deviceProp.memoryBusWidth / 8 * 2 / 1000000000;
            
            std::cout << "Theoretical band width = " << bw << " GB/s" << std::endl;
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23

    运行结果:

    GPU: 0
    Name: NVIDIA GeForce RTX 3050 4GB Laptop GPU
    Bit width: 64 bit
    Memory clock rate: 7001000 kHz
    Theoretical band width = 112 GB/s
    
    • 1
    • 2
    • 3
    • 4
    • 5
  • 相关阅读:
    Python 既是解释型语言,也是编译型语言
    Java线程池ThreadPoolExecutor极简教程
    HTML+CSS静态网页设计:(房地产网站设计与实现6页)
    31、Java高级特性——Math类、Random类、String类、StringBuffer类、StringBuilder类
    洛谷 P4197&&P7834 Peaks 题解
    实战指南:使用 xUnit 和 ASP.NET Core 进行集成测试【完整教程】
    分别用Python和Go实现对文件夹及其子文件夹里的文件进行批量重命名
    1544_AURIX_TC275_CPU子系统_存储寻址以及子系统寄存器
    Java Spring MVC如何编写一个示例程序呢?
    第十天:基于Ubuntu和gec6818开发板的QT图书管理系统完整项目设计
  • 原文地址:https://blog.csdn.net/A_water_/article/details/132757850
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号