超越魯賓
NVIDIA 目前的解決方案,從 H100 和 H200(Hopper 架構)開始,或者最新的 B100 和 B200(Blackwell 架構),讓社會充分利用人工智慧帶來的興奮。該公司的未來也一片光明。我們最近了解到,下一代專用於人工智慧的晶片,代號為Rubin 最快可能在 2025 年中期抵達。讓我們透過 MEI 2024 中提出的設計來進一步展望未來。
NVIDIA 對未來晶片的願景基於兩種被正確認為是克服當前技術限制的重要手段的方法:3D 堆疊(這不再是白日夢)和矽光子學。
AI晶片的草圖
矽光子學(縮寫為 SiPh)可以取代目前的電氣互連。正如其名稱所解釋的,它基於光的信息傳輸原理。它必須促進頻寬的增加,以及延遲和消耗的減少。正如 Ian Curtress 所指出的那樣,NVIDIA 正在考慮在其 Turfu AI 加速器中使用 SiPH 進行晶片內和晶片間通訊。
這是@NVIDIA對人工智慧運算未來的願景。
矽光子介入
SiPh 片內和片間
12 個 SiPh 連接,每個 GPU 區塊 3 個
每層 4 個 GPU 區塊
GPU「層」(GPU on GPU?!?)
3D 堆疊 DRAM,每塊 6 個,細粒度從#iedm24。我的猜測是,2028/2029/2030…pic.twitter.com/5IsDkYSWT2
— 𝐷𝑟。 𝐼𝑎𝑛𝐶𝑢𝑡𝑟𝑒𝑠𝑠(@IanCutress)2024 年 12 月 8 日
對於其餘部分,該圖呈現了基於瓦片的設計(以通用公共範例與最新一代英特爾酷睿一致)GPU / DRAM,但將垂直堆疊放在首位。與住宅建築一樣,這種方法可以在不增加表面積的情況下大幅增加密度。然而,如果您允許我們進行一個烹飪類比,就像法式三明治一樣,火腿片在兩片三明治麵包之間保持溫暖,這種 3D 包裝帶來了與冷卻(和能源管理)相關的一些挑戰。
在現階段,特別是對於 SiPH,技術尚未充分掌握,無法考慮大規模生產此處描述的晶片。 Ian Cutress 估計,此處描繪的加速器可能會在本十年末(更準確地說是 2028 年至 2030 年)問世。