AMD分享了有关其新的RDNA 4图形体系结构的所有技术细节,并利用机会提供前两张卡片来利用它。 Radeon RX 9070和RX 9070 XT旨在用于上层中段市场,有望与制造商的FSR 4相兼容。
最后。这是AMD正式化的第一个词rDNA 4, 后等待好几个月等最后一分钟的延迟。制造商已经播放了这种新图形体系结构的视频演示,并在3D渲染方面深入揭示了其特征射线跟踪或人工智能能力。这也是一个机会AMD揭示所有使用此rDNA 4架构的前两张卡的详细信息,即Radeon RX 9070 ET RX 9070 XT。
RDNA 4:优化效率的体系结构
由TSMC及其N4P雕刻过程(换句话说,改进了5 nm),这一代的前两个图形芯片组是NAVI 48 XTX和XT。使用RDNA 4架构,AMD选择返回单片设计,放弃方法chiplet用于rDNA 3。因此,Navi 48芯片组将356.5平方米的单个模具汇集在一起,其中539亿晶体管的琐事。

RDNA4体系结构在渲染管道中带来了IT的改进。例如,通过增加每个时钟周期的主动任务数量,并且现在可以从更精确的控制中受益,从而提高了计算单元的有效性,从而可以更有效地处理不同可能的细节(INT4,INT8,FP16或FP32)中的计算。

RDNA 4中动态寄存器的到来代表了建筑的最有趣的创新之一。到目前为止,寄存器的数量 - 接近执行单元的小型内存区域,并且比视频内存甚至不同级别的高速缓存内存 - 可访问 - 在GPU中可用,可以在静态上分配,而没有与执行每个任务的需求的实际通信。从现在开始,寄存器对不同或多或少复杂的计算任务的动态分配使得可以优化图形芯片组中可用的注册表的使用以及效率和整体性能。
这些改进,与改进的内存子系统相关联(无限缓存第三代和较高的操作频率可确保经典3D渲染性能的提高:与以前的Radeon的RDNA 3体系结构相比,AMD的增长约为40%。
具体改进射线跟踪

依靠Simd设计(单个指令,多个数据)比以前更发达的rDNA 4还确保更好地利用射线跟踪。这种类型的渲染需要大量的并行计算,尤其是用于照明模拟和全球照明效应。因此,AMD已经优化了其体系结构,以使计算更有效线程按周期。更好地使用计算单元,尤其是在混合渲染方案中栅格化和射线跟踪合并。
渲染管道的几个更改和新功能射线跟踪,作为根据物质实例转换或定向包含框(OBB),使它们的侧面加速分析场景的同时提高其精度。 m射线的OSHS用于不必要的计算,这减少了全球渲染时间:AMD谈到了性能的增加一倍射线跟踪与rDNA 3相比。

AI计算单元的两倍
专用于人工智能的计算单元和深度学习模型的执行也受益于特定的改进。他们能够以FP16的精度处理两倍的周期操作,现在支持稀疏操作,其中包括忽略多达一半的非必需操作来实现双重性能。但是,AMD仅追赶NVIDIA,自从竞争者中存在的功能以来GeForce RTX 30系列。

RDNA 4体系结构还支持FP8,INT8,BF8和INT4操作,8位计算的速度是16位的两倍,而4位的整体仍将这一数字增加一倍。换句话说,与RDNA 4架构相比,FP8中的计算速度高8倍建筑rDNA 3。
FSR 4:L'升级终于利用机器学习
与FSR的先前版本相比FidelityFX超级分辨率),已经对结构进行了显着改进USPCALING,特别是由于使用高级重建技术,该技术产生了较低分辨率图像的非常详细的最终结果。集成神经元样本模型哪个利用(最终)机器学习重建图像的细节并避免轮廓的模糊性,因此构成了基本创新FSR 4。

与众不同FSR 3.1但是,此新版本是RDNA 4 Architecture独有的,因此只能在新的Radeon上使用。此外,AMD尚未确认新一代木筏的推出是否可以使用神经过度样本模型。制造商仍然表明,FSR 4的新“性能”模式将在4K中提供“比本机更好”的图像质量。
Radeon RX 9070和9070 XT:与RTX 4070/5070竞争的卡片
AMD选择使用这款新一代的图形卡,首先将重点放在上层中段的细分市场上,这些卡是针对大量的,而不是非常高的端和超昂贵的技术展示柜。
Radeon RX 9070 XT |
Radeon RX 9070 |
Geforce RTX |
|
GPU |
NAVI 48 XTX |
Navi 48 XT |
GB2203-300 |
心 |
4096 |
3584 |
8960 |
提升频率 |
〜2.97 GHz |
〜2.52 GHz |
〜2.47 GHz |
记忆 |
16 GO GDDR6 |
16 GO GDDR6 |
16 GO GDDR7 |
内存总线 |
256位 |
256位 |
256位 |
内存速度 |
20 Gbps |
20 Gbps |
28 Gbps |
内存带宽 |
640 GO/s |
640 GO/s |
896 GO/s |
最大消耗 |
304W |
220W |
300W |
接口PCIE |
PCIE 5.0×16 |
PCIE 5.0×16 |
PCIE 5.0×16 |
发行价格(MSRP) |
599 $ |
549 $ |
749 $ |
发布日期 |
6人火星 |
6人火星 |
2月20日 |
Radeon RX 9070 XT具有其48 XTX海军芯片组的最高为2.97 GHz4096执行核心,64个RT加速器和128个ACA堆。她有16 GB的GDDR6内存并从256位内存接口中受益,提供640 GB/s的带宽。消费达到304瓦;因此,AMD建议使用750瓦的电源。
就其部分而言,Radeon RX 9070拥有48个海军芯片组,由3584个执行核心,56个RT加速器和112个AI加速器组成。它也有16 GB的GDDR6内存具有256位内存接口,但其TDP仅为“仅” 220瓦。

RDNA 4体系结构的改进以及操作频率的增加使这两个新的筏子可以达到 - 根据制造商的性能水平,尽管计算单元数量较低,但类似于上一代的RX 7900 XT和RX 7900 XTX。另外,根据AMD,Radeon RX 9070的平均性能比RX 7900 GRE1440p的上一代,而Radeon RX 9070 XT将这一优势扩展到平均40%以上。
RX 9070 XT也应高于RTX 4070 Ti Super,而RX 9070可以以更具吸引力的价格提供可比的RTX 4070 Super的性能。 RX 9070 XT和RX 9070最终将比RTX 3090和RTX 3080分别分别更快26%。

因此,Radeon RX 9070和RX 9070 XT分别为549美元和599美元的公共价格,旨在针对那些首先在1440p中寻找高性能并在4K中接受的球员。他们将于3月6日开始使用;我们只是在等待独立的测试,才能真正知道这些新木筏在腹部中有什么。