NVIDIA_A100_SXM2_40GB加速卡详细参数

记录了NVIDIA_A100_SXM2_40GB加速卡的详细参数
参考链接: https://www.xincanshu.com/gpu/NVIDIA_A100_SXM4_40_GB/canshu.html

主要参数

参数	值	描述
核心频率	1095 MHz	核心一秒内能够进行多少处理周期
Turbo频率	1410 MHz	突发加速频率，类似于CPU睿频
流处理单元	6912 个	负责处理图像不同方面的构造
核心架构	Ampere	核心架构代号
GPU代号	GA100	核心架构代号
生产工艺	7 nm	越小的尺寸代表芯片越新。
TDP功耗	400W	越低的TDP 通常表示它消耗的电量更少。

内存参数

参数	值	描述
内存频率	2.4 Gbps
内存类型	HBM2
内存位宽	5120 bit
最大显存	32 GB

参数补充

参数	值	描述
代工厂	TSMC
核心面积	826 mm²
一级缓存	1292 KB
二级缓存	40 MB
光栅单元	432
纹理单元	160
SM count	108
Tensor cores	432
建议电源	800 W
总线接口	PCIe 4.0 x16

理论性能

参数	值	描述
像素填充率	225.6 GPixel/s
纹理填充率	609.1 GTexel/s
显存带宽	1555 GB/s
FP16	77.97 TFLOPS (4:1)	半精度浮点运算次数
FP32	19.49 TFLOPS	单精度浮点运算次数
FP64	9.746 TFLOPS (1:2)	双精度浮点运算次数

显卡特性

参数	值	描述
DirectX	N/A
OpenGL	N/A
OpenCL	3.0
Vulkan	N/A
CUDA	8.0
Shader model	N/A

相关阅读:
邻接表的链表实现——链式前向星
 【华为OD机试python】数字涂色【2023 B卷|100分】
二十四节气-白露 | 白露至，秋实美
 如何将数据库从 CloudKit 迁移到 Firebase
win11 无法登录微软账户终极解决方案
 高效管理和盘点固定资产的办法
 基于Python的医院信息管理系统
 动态规划|【路径问题】|174.地下城游戏
 分类预测 | MATLAB实现WOA-CNN-LSTM-Attention数据分类预测
 Echarts绘制任意数据的正态分布图
原文地址：https://blog.csdn.net/baidu_35848778/article/details/130859868