超越鲁宾
NVIDIA 当前的解决方案,从 H100 和 H200(Hopper 架构)开始,或者最新的 B100 和 B200(Blackwell 架构),让社会充分利用人工智能带来的兴奋。该公司的未来也一片光明。我们最近了解到,下一代专用于人工智能的芯片,代号为Rubin 最早可能于 2025 年中期抵达。让我们通过 MEI 2024 中提出的设计来进一步展望未来。
NVIDIA 对未来芯片的愿景基于两种被正确认为是克服当前技术限制的重要手段的方法:3D 堆叠(这不再是白日梦)和硅光子学。
AI芯片的草图
硅光子学(缩写为 SiPh)可以取代当前的电气互连。正如其名称所解释的,它基于光的信息传输原理。它必须促进带宽的增加,以及延迟和消耗的减少。正如 Ian Curtress 指出的那样,NVIDIA 正在考虑在其 Turfu AI 加速器中使用 SiPH 进行芯片内和芯片间通信。
这是@NVIDIA对人工智能计算未来的愿景。
硅光子介入
SiPh 片内和片间
12 个 SiPh 连接,每个 GPU 块 3 个
每层 4 个 GPU 块
GPU“层”(GPU on GPU?!?)
3D 堆叠 DRAM,每块 6 个,细粒度从#iedm24。我的猜测是,2028/2029/2030……pic.twitter.com/5IsDkYSWT2
— 𝐷𝑟。 𝐼𝑎𝑛𝐶𝑢𝑡𝑟𝑒𝑠𝑠(@IanCutress)2024 年 12 月 8 日
对于其余部分,该图呈现了基于瓦片的设计(以通用公共示例与最新一代英特尔酷睿一致)GPU / DRAM,但将垂直堆叠放在首位。与住宅建筑一样,这种方法可以在不增加表面积的情况下大幅增加密度。然而,如果您允许我们进行一个烹饪类比,就像法式三明治一样,火腿片在两片三明治面包之间保持温暖,这种 3D 包装带来了与冷却(和能源管理)相关的一些挑战。
在现阶段,特别是对于 SiPH,技术尚未充分掌握,无法考虑大规模生产此处描述的芯片。 Ian Cutress 估计,此处描绘的加速器可能会在本十年末(更准确地说是 2028 年至 2030 年)问世。