2023 年 12 月,AMD 推出了 Instinct MI300 系列加速器;它顺理成章地继承了 AMD Instinct MI200 系列。它包括两个参考:MI300X,配备 304 个 CDNA 3 计算单元的 GPU(AMD 专为 AI 和 HPC 领域,即数据中心而设计的架构); MI300A是该品牌首款同类APU,也就是说同时嵌入CPU和GPU核心的处理器——在本例中,24个Zen 4 CPU核心和228个CDNA 3核心都刻在5个中。以及台积电的 6 nm。
近38万点
因此,AMD 产品组合的当前旗舰产品 MI300X(该公司正在计划推出 MI325X 以及我们将在下面讨论的 MI350 系列)因此可调动 304 个计算单元,即 19,456 个流处理器。为了与最好的 Radeon 消费级显卡 RX 7900 XTX 进行比较,该参考具有 96 个 RDNA 3 计算单元,即 6144 个流处理器;至于上一代Instinct加速器的旗舰产品Instinct MI250X,它拥有220个计算单元,即14,080个流处理器。此外,MI300X GPU支持192GB HMB3;这款贪吃者的 TDP 为 750 瓦。
这个怪物首次出现在 Geekbench 上。结合Supermicro AS -8125GS-TNMR2系统内的一对AMD EPYC 9754处理器(总共256个核心/512个线程),该加速器在OpenCL测试中获得了379,660分的总分(第二名为375,161分) ,并在各种基准测试中表现出色。
多个处理该信息的网站指出,Instinct MI350X 的结果最终让 AMD 解决方案超越了NVIDIA GeForce RTX 4090在这个基准测试中。事实上,平均得分为 319,588 分,GeForce 的旗手,系统地击败了Radeon 7900 XTX(在 Geekbench 6 OpenCL 测试中平均得分为 207,354 分),被击败。
但您会同意,这种比较并不真正相关:这是两种针对完全不同市场的产品。而且,Geekbench 6中最好的NVIDIA解决方案是L40 Ada Lovelace加速器,同样是为数据中心设计的;平均分是352,507分。
回到 RTX 4090 / Instinct MI350X 的对立,让我们也考虑一下价格差距:加速器的交易价格超过 15,000 美元。事实上,将此分数与 Instinct MI250X 所取得的分数进行比较尤其有意义。不幸的是,对 Geekbench 6 数据库的搜索没有得出任何结果。
超级计算机加速器
我们将在未来几周内了解有关 MI300 解决方案性能的更多信息。 MI250 仍然为 6 月 TOP500:Frontier 中最高效的超级计算机提供动力。英特尔尚未成功通过 Aurora 取代 AMD,Aurora 只实现了部分功能;即使他几个月后去世,他也会受到威胁El Capitan,一个正在开发的系统,采用 MI300 系列加速器,这应该会让 AMD 重新获得领导地位。
最后,要知道的是,AMD 在 6 月初公布了 2026 年之前的 Instinct 加速器路线图。
来源 : 极客跑分