码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • NVIDIA 显卡硬件支持的精度模式


    很多炼丹师不知道自己英伟达显卡支持哪些精度模式,本文整理了NVIDIA官网的数据,为你解开疑惑。

    1. 首先了解CUDA计算能力及其支持的精度模式;

    2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。

    表1 CUDA计算能力及其支持的精度模式

    CUDA Compute CapabilityTF32FP32FP16INT8

    FP16

    Tensor Cores

    INT8

    Tensor Cores

    DLA
    9YesYesYesYesYesYesNo
    8.9YesYesYesYesYesYesNo
    8.7YesYesYesYesYesYesYes
    8.6YesYesYesYesYesYesNo
    8YesYesYesYesYesYesNo
    7.5NoYesYesYesYesYesNo
    7.2NoYesYesYesYesYesYes
    7NoYesYesYesYesNoNo
    6.1NoYesYesYesNoNoNo
    6NoYesYesNoNoNoNo

    表2 NVIDIA 硬件(包含显卡、嵌入式板卡等)对应的计算能力

    GPUCompute Capability
    NVIDIA H1009
    NVIDIA L48.9
    NVIDIA L408.9
    RTX 60008.9
    GeForce RTX 40908.9
    GeForce RTX 40808.9
    GeForce RTX 4070 Ti8.9
    GeForce RTX 40708.9
    GeForce RTX 40608.9
    GeForce RTX 40508.9
    Jetson AGX Orin8.7
    Jetson Orin NX8.7
    Jetson Orin Nano8.7
    NVIDIA A408.6
    NVIDIA A108.6
    NVIDIA A168.6
    NVIDIA A28.6
    RTX A60008.6
    RTX A50008.6
    RTX A40008.6
    RTX A30008.6
    RTX A20008.6
    GeForce RTX 3090 Ti8.6
    GeForce RTX 30908.6
    GeForce RTX 3080 Ti8.6
    GeForce RTX 30808.6
    GeForce RTX 3070 Ti8.6
    GeForce RTX 30708.6
    Geforce RTX 3060 Ti8.6
    Geforce RTX 30608.6
    GeForce RTX 3050 Ti8.6
    GeForce RTX 30508.6
    NVIDIA A1008
    NVIDIA A308
    NVIDIA T47.5
    Quadro RTX 80007.5
    Quadro RTX 60007.5
    Quadro RTX 50007.5
    Quadro RTX 40007.5
    RTX 50007.5
    RTX 40007.5
    RTX 30007.5
    T20007.5
    T12007.5
    T10007.5
    T6007.5
    T5007.5
    T4007.5
    GeForce GTX 1650 Ti7.5
    NVIDIA TITAN RTX7.5
    Geforce RTX 2080 Ti7.5
    Geforce RTX 20807.5
    Geforce RTX 20707.5
    Geforce RTX 20607.5
    Jetson AGX Xavier7.2
    Jetson Xavier NX7.2
    NVIDIA V1007
    Quadro GV1007
    NVIDIA TITAN V7
    Jetson TX26.2
    Tesla P406.1
    Tesla P46.1
    Quadro P60006.1
    Quadro P52006.1
    Quadro P50006.1
    Quadro P42006.1
    Quadro P40006.1
    Quadro P32006.1
    Quadro P30006.1
    Quadro P22006.1
    Quadro P20006.1
    Quadro P10006.1
    Quadro P6206.1
    Quadro P6006.1
    Quadro P5006.1
    Quadro P4006.1
    P6206.1
    P5206.1
    NVIDIA TITAN Xp6.1
    NVIDIA TITAN X6.1
    GeForce GTX 1080 Ti6.1
    GeForce GTX 10806.1
    GeForce GTX 1070 Ti6.1
    GeForce GTX 10706.1
    GeForce GTX 10606.1
    GeForce GTX 10506.1
    Tesla P1006
    Quadro GP1006
    Jetson Nano5.3

    通过以上两表,可了解每个硬件支持的精度模式。

    参考:

    Support Matrix :: NVIDIA Deep Learning TensorRT Documentation

    CUDA GPUs - Compute Capability | NVIDIA Developer

  • 相关阅读:
    推荐模型复现(四):多任务模型ESMM、MMOE
    一个简单好用安全的开源交互审计系统,支持SSH,Telnet,Kubernetes协议
    flume 通过syslog协议读取系统日志
    Docker Compose具体应用
    vue 使用iframe嵌套pdf在h5移动端浏览器中打开的时候自动下载
    速卖通自养号测评:如何规避安全风险?
    JAVA基础(JAVA SE)学习笔记(五)数组
    C++笔记梳理
    作用域的概念及作用?作用域的分类?.js 属于哪种作用域?
    lotus 1.17.1-rc3 calibnet Boost
  • 原文地址:https://blog.csdn.net/chan1987818/article/details/132894362
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号