尽管近年来 Nvidia GPU 确实更频繁地成为新闻,但它们绝不是新事物。事实上,多年来,Nvidia GPU 已经进行了多次迭代,GPU 架构也取得了进步。因此,让我们回顾一下最近的历史,以了解 GPU 是如何随着时间的推移而发展的。我们将通过探索自 2000 年以来发布的每个流行的 Nvidia GPU 微架构来做到这一点。
Tesla GPU 微架构于 2006 年作为居里的继任者发布,为 Nvidia 的 GPU 产品线引入了几项重要变化。除了作为 GeForce 8、9、100、200 和 300 系列 GPU 使用的架构之外,Tesla 还被用于图形处理之外的用例的 Quadro 系列 GPU 使用。
令人困惑的是,Tesla 既是 GPU 微架构的名称,又是 Nvidia GPU 的品牌。 2020 年,英伟达决定停止使用特斯拉这个名称,以避免与流行的电动汽车品牌混淆。
特斯拉的继任者费米于 2010 年发布。费米推出了多项增强功能,包括:
Kepler GPU 微架构作为 Fermi 2012 的继任者发布。对 Fermi 的主要改进包括:
一种新的流式多处理器架构,称为 SMX
支持 TXAA(一种抗锯齿方法)
CUDA 核心增加到 1536 个
耗电量少
支持通过 GPU 加速自动超频
支持 GPUDirect,它允许 GPU(在同一台计算机上或通过网络相互访问)在不访问 CPU 的情况下进行通信
2014 年发布的麦克斯韦是费米的继任者。根据 Nvidia 的说法,第一代 Maxwell GPU 与 Fermi 相比具有以下优势:
由于与控制逻辑分区、时钟门控、指令调度和工作负载平衡相关的增强,多处理器效率更高
每个流式多处理器上有 64KB 的专用共享内存
与 Fermi 使用的锁定/解锁范例相比,本机共享内存原子操作提供了性能改进
动态并行支持
Pascal 在 2016 年接替 Maxwell。这个 Nvidia GPU 微架构提供了对 Maxwell 的改进,例如:
支持 NVLink 通信,与 PCIe 相比具有显着的速度优势
高带宽内存 2 (HBM2) - 4096 位内存总线,提供 720 GB 内存带宽
计算抢占
动态负载平衡以优化 GPU 资源利用率
Volta 是 2017 年发布的一个有点独特的微架构迭代。虽然以前的大多数微架构都用于消费类 GPU,但 Volta GPU 的营销目的是严格用于专业应用程序。 Volta 也是第一个使用张量核心的微架构。
张量核心是一种新型的处理核心,可以执行专门的数学计算。具体来说,张量核心执行支持人工智能和深度学习用例的矩阵运算。