记录了NVIDIA_A100_SXM2_40GB加速卡的详细参数
参考链接: https://www.xincanshu.com/gpu/NVIDIA_A100_SXM4_40_GB/canshu.html
主要参数
| 参数 | 值 | 描述 |
|---|
| 核心频率 | 1095 MHz | 核心 一秒内能够进行多少处理周期 |
| Turbo频率 | 1410 MHz | 突发加速频率,类似于CPU睿频 |
| 流处理单元 | 6912 个 | 负责处理图像不同方面的构造 |
| 核心架构 | Ampere | 核心架构代号 |
| GPU代号 | GA100 | 核心架构代号 |
| 生产工艺 | 7 nm | 越小的尺寸代表芯片越新。 |
| TDP功耗 | 400W | 越低的TDP 通常表示它消耗的电量更少。 |
内存参数
| 参数 | 值 | 描述 |
|---|
| 内存频率 | 2.4 Gbps | |
| 内存类型 | HBM2 | |
| 内存位宽 | 5120 bit | |
| 最大显存 | 32 GB | |
参数补充
| 参数 | 值 | 描述 |
|---|
| 代工厂 | TSMC | |
| 核心面积 | 826 mm² | |
| 一级缓存 | 1292 KB | |
| 二级缓存 | 40 MB | |
| 光栅单元 | 432 | |
| 纹理单元 | 160 | |
| SM count | 108 | |
| Tensor cores | 432 | |
| 建议电源 | 800 W | |
| 总线接口 | PCIe 4.0 x16 | |
理论性能
| 参数 | 值 | 描述 |
|---|
| 像素填充率 | 225.6 GPixel/s | |
| 纹理填充率 | 609.1 GTexel/s | |
| 显存带宽 | 1555 GB/s | |
| FP16 | 77.97 TFLOPS (4:1) | 半精度浮点运算次数 |
| FP32 | 19.49 TFLOPS | 单精度浮点运算次数 |
| FP64 | 9.746 TFLOPS (1:2) | 双精度浮点运算次数 |
显卡特性
| 参数 | 值 | 描述 |
|---|
| DirectX | N/A | |
| OpenGL | N/A | |
| OpenCL | 3.0 | |
| Vulkan | N/A | |
| CUDA | 8.0 | |
| Shader model | N/A | |