新一代“Ada”GPU 是全新 GeForce RTX 4000 系列的掌舵者,受益于新的雕刻技巧和新技术,可实现爆炸性性能。特别是在光线追踪领域,DLSS 3 有望创造奇迹。
Ada (Lovelace) 架构是 Nvidia 新系列 GPU 的核心,它极大地突破了当前图形计算的极限。在其年度大会上,图形芯片的冠军推出了新一代的两款旗舰产品:RTX 4080 和 RTX 4090。非常高端的产品,充满了晶体管,充满了技术......而且价格简直是爆炸式的。
在设计方面,我们已经知道这一点有一段时间了:新一代芯片不再像RTX 3000那样来自三星工厂的8纳米产品。新批次现在来自世界上最好的工厂,即台湾台积电。但这种技术变革意味着什么呢?简而言之,借助台积电的尖端雕刻技术(4N 工艺,改进的 5 纳米),Nvidia 能够以前所未有的方式填充晶体管。对于芯片“AD102-300» RTX 4090 的芯片由不少于 760 亿个晶体管组成,这使其成为迄今为止推出的最密集的单块消费级处理器。苹果M1 Max(这M1超是两个 M1 Max 芯片组合在一起的芯片,即 2×57=1140 亿个晶体管)。
CUDA 核心的数量正在呈爆炸式增长。继 RTX 3090 的 10,496 个 CUDA 核心之后,RTX 4090 现在提供 16,384 个 CUDA 核心,增益增加了 60%,频率也显着提高。高端型号的频率范围为 1.7 GHz 至 2.5 GHz。再加上仍然管理 24 GB GDDR6X RAM 的 384 位总线,我们获得了一张在性能方面非常强大的显卡。然而,它仍然延续了其祖先的脚步,因为 RTX 4090 保持了 450 W 的 TDP。它很大,很大,但它是一张特殊的卡。该卡应部署 82.6 TFLOPS,这将使其效率比它所取代的 RTX 3090 高 2.3 倍。显然,它的价格与其功能相称:在美国不含税1,599美元。在我们的欧洲纬度地区,含税价格约为 1,900 – 2,000 欧元。
基于相同的架构和精细的雕刻,两种芯片将配备两个版本的 RTX 4080。对于 192 位总线上的 12 GB 版本内存,AD104 芯片开发了 7,680 个 CUDA 核心的强大功能。热封装为 285 W。AD103 是一款 GPU,拥有 9,728 个 CUDA 核心和 16 GB GDDR6X,并将看到其风扇更加强劲地吹出 350 W。第一个售价为 899 美元(不含税)(含税 1,100 – 1,200 欧元?),第二个售价 1,199 美元(含税 1,450 – 1,550 欧元?)。
DLSS 3:轨道上光线追踪性能
上一代 Turing(RTX 2000 系列)和 Ampere(RTX 3000)与这一代 Ada(RTX 4000)之间真正的变化是负责(大致)人工智能计算的“Tensor Core”数量的爆炸式增长。与上一代相比,如果着色器乘以 2.25,RT Core(负责光线追踪)乘以 2.56,Tensor Core 的数量从 320 个增加到 1400 个。乘以 4.4,这正是光线追踪性能爆炸性增长的根源。
是的,因为如果确实是 RT Core 进行“光线追踪”计算,那么 Tensor Core 则负责提高图像质量(特别是去噪)。但最重要的是,他们推动了 Nvidia 出色的扩展技术:DLSS。同类中最先进的,远远领先于AMD的FSR 2.0或Intel的屏幕加速帧速率。然后,无任何损失地放大帧,获得未按4K计算的4K画质的游戏。
这DLSS(深度学习超级样本)3.0 版本到来。它利用 RTX 4090 和 4080 的强大功能来部署一种名为“阿达光流。它只不过是使用硅“神经元”和尖端算法来预测场景的变化。这使得在图像质量恒定的情况下,可以进一步增加每秒的图像数量。新的 DLSS 还受益于一项名为着色器执行重新排序(SER),它根据相似性对任务进行智能排序,以便它们同时执行——GPU 非常擅长快速执行大量相似的任务。正是这个SER让DLSS 3.0如此高效。
如果 Nvidia 可信的话,性能增益范围从“很多”到“绝对巨大”。应用于 RTX 4090 时,该技术已经可以将 4K 每秒帧数增加一倍微软飞行模拟器,一款以这些广阔环境的美味而闻名的游戏。但这增加到四倍以上赛博朋克2077(在一个版本“超速行驶»,由 Nvidia 改进),最高可达 x5门户 RTX!从逻辑上讲,RTX 4080 的增益要少一些,但与 RTX 3080 Ti 的性能相比,它已经 +50% 到 +300%飞行模拟器等赛博朋克!如果这种性能提升不能应用于所有游戏(我们在这里讨论的是使用光线追踪来加速 DLSS 兼容游戏),那么我们仍然有权期望使用简单调用的“旧”游戏会获得显着的提升光栅化。
与任何新一代 GPU 一样,RTX 4000 还隐藏了与纯 3D 无关的改进,例如支持 AV1 硬件编码或本机 8K 视频捕获 (4090) 的新多媒体引擎。但这些显然都是表演赌博将重点审查的内容。
RTX 3000 将保留在目录中
如果这三款新 GPU 的价格令人恐惧,并且似乎直接出自新冠疫情噩梦,那么现实是这些芯片(尚未)还无法取代 RTX 3000。Nvidia 首席执行官已经明确表示:几代显卡将互补彼此有一段时间。这将使 Nvidia 在等待经典版本(4070、4060,也许还有 4050)到来的同时,能够从范围效应中受益。
Nvidia 非常有兴趣继续延长其旧 GPU 的寿命 - 这很好,它还有很多剩余 - 因为到今年年底,AMD 将依次推出其新的 GPU 架构,称为 RDNA 3。几年前,AMD 成功回归“游戏» 感谢 RDNA 和 RDNA 2,这两代 GPU 架构兑现了每次每瓦性能提高 50% 以上的承诺。 AMD 已经在 RDNA 2 上追随 Nvidia,但目前在光线追踪技术方面仍然落后。但它最近的成功使其成为越来越可信的威胁。它必须能够与英伟达刚刚诞生的新怪物竞争。