很多炼丹师不知道自己英伟达显卡支持哪些精度模式,本文整理了NVIDIA官网的数据,为你解开疑惑。
1. 首先了解CUDA计算能力及其支持的精度模式;
2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。
表1 CUDA计算能力及其支持的精度模式
CUDA Compute Capability | TF32 | FP32 | FP16 | INT8 | FP16 Tensor Cores | INT8 Tensor Cores | DLA |
9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
8.9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
8.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
8.6 | Yes | Yes | Yes | Yes | Yes | Yes | No |
8 | Yes | Yes | Yes | Yes | Yes | Yes | No |
7.5 | No | Yes | Yes | Yes | Yes | Yes | No |
7.2 | No | Yes | Yes | Yes | Yes | Yes | Yes |
7 | No | Yes | Yes | Yes | Yes | No | No |
6.1 | No | Yes | Yes | Yes | No | No | No |
6 | No | Yes | Yes | No | No | No | No |
表2 NVIDIA 硬件(包含显卡、嵌入式板卡等)对应的计算能力
通过以上两表,可了解每个硬件支持的精度模式。
参考:
Support Matrix :: NVIDIA Deep Learning TensorRT Documentation