DGX GH200 是專為 ChatGPT 等 LLM 設計的,它是一個怪物,其關鍵組件(CPU、GPU 以及網路晶片)均由 Nvidia 設計,有望為生成式 AI 帶來巨大的動力提升。
功率和能源效率的怪物:這就是 Nvidia 在台北國際電腦展上發布的第一台超級電腦所承諾的。一台名為 DGX GH200 的機器承諾實現所謂的百億億次運算能力,而能耗僅為競爭對手 x86 機器的一小部分......並且以承諾的速度實現無並行。 Nvidia 的創始人兼首席執行官、好鬥的黃仁勳大張旗鼓地展示了這台機器,它是 Nvidia 的一個實現。
身為 GPU 運算領域的 Archi 領導者,Nvidia 在處理器方面卻是個侏儒。如果這位加州人在 CPU 方面擁有公認的專業知識,那麼我們最了解他的就是他的 Tegra 處理器。我們已經在 Windows 8 PC 或著名的 Nintendo Switch 中遇到過 SoC。然而,英偉達為資料中心開發的晶片以及這裡的超級電腦的功率卻完全不同。名為 Grace Hopper Superchip 的主晶片實際上是一個二重奏。一邊是「Grace」晶片,一個 72 核心 ARM Neoverse V2 CPU,另一邊是「Hopper」H100 GPU。兩者均受益於 96 GB 超快 HBM3 記憶體 (GPU) 和 512 GB LPDDR5X (CPU)。
採用 256 個 GH200 卡,結合 CPU、GPU 和 RAM,您最終將獲得這麼多 GPU、18,432 個 ARM CPU 核心和 144TB 共享 DDR5 記憶體。構成 DGX GH200 的套件的優勢在於 Nvidia 已成為高速網路領域的冠軍。
像單一 GPU 一樣運作的超級計算器
自從2019年收購Mellanox(在英特爾眼皮底下,英特爾也想收購這家以色列旗艦店)以來,英偉達已經推出了專為超級電腦設計的高效能網路產品。無需贅述,這些 256 個 GH200 卡結合了 CPU、GPU 和內存,由專用網路晶片(稱為 BlueField-3 和 ConnectX-7 網路適配器的 DPU)控制和互連。一方面,CPU 和GPU 透過一種名為NVLink-C2C 的技術以非常高的速度相互「對話」(是的,有很多名稱和縮寫詞!),這使得它們能夠以900 GB/s 的速度交換數據(是的,你沒看錯)。但最重要的是,其他網路晶片允許無損資料交換,而且速度非常高。
另請閱讀: Nvidia 推出首款專為人工智慧設計的 ARM 處理器 Grace(艾薇兒 2021)
在舞台上,黃仁勳解釋說,他的龐然大物有很多優勢(邏輯上,他是來推銷的)。事實上,其中一個非常特殊:整個超級電腦像單一加速器一樣被控制。當我們知道資訊的分佈和網路節點的各種瓶頸是充分利用晶片的原始能力的主要障礙時,這是一項壯舉。這樣做的好處是開發人員不必做任何特殊的事情:無需進行程式碼調整即可有效地分發它。這個巨人的程式設計和操作就像單一 GPU 一樣。並且展現出令人瘋狂的力量。
如果我們知道品牌總是就適合他們的績效衡量標準進行溝通(我們稱之為« 櫻桃採摘 »(英文術語),一些 Nvidia 圖表令人眼花繚亂。這個由 256 個 Grace Hopper 超級晶片組成的怪物可發送 1 ExaFLOPS 的運算能力,在某些用途上比同等裝置的運算能力高出 244 倍。問題在於細節,有必要詳細說明這些「某些用途」是什麼。
為人工智慧打造的野獸
DGX GH200 有足夠的能力進行許多計算,但其所謂的單位《變形金剛》,他首先是人工智慧執行之王,更具體地說,他是執行人工智慧的國王。大型語言模型。這些著名的法學碩士,其中最著名的是已經必不可少的聊天GPT。在這個領域,它擁有大量的核心以及管理龐大數據的能力。水池從記憶中看,這似乎是相對於競爭對手的關鍵優勢……在這一領域。該機器在科學計算等其他領域的表現如何,以便能夠與英特爾或 AMD 提供的產品進行比較,還有待觀察。
Nvidia 在用於「經典」技術和科學任務的 GPU 領域已經佔據了絕對主導地位,並且已經在大力銷售其產品,現在在所謂的生成人工智慧領域似乎是孤軍奮戰。雖然該領域的所有製造商都已經開始使用 GPU,但 DGX GH200 似乎擁有在競爭對手消失之前將其埋葬的武器。因此,Google雲端、Meta 和微軟將成為這款超級計算器的首批客戶,然後將其出售給其他人。而英偉達的老闆甚至宣佈公司要生下自己的寶寶來繼續進步。並隨著時間的推移使其變得更加強大。
英偉達掌握一切,價值爆炸
DGX GH200 令人印象深刻,因為 Nvidia 掌握了所有重要組件。即CPU、GPU,還有網路處理器。雖然英特爾剛剛進入專業 GPU 市場(憑藉 Ponte Vecchio),而 AMD 目前正在努力將其解決方案強加給 Nvidia,但這個帶有綠色標誌的品牌為其超級計算器設計了所有鏈條。這對這家沒有x86 授權的公司來說是一個小小的報復,而且到目前為止,它還無法與Intel 和AMD(以及在Power 架構仍然大放異彩的某些應用程式中與IBM 競爭) 。
它重達 40 噸,由 240 公里光纜和 2,112 個 60 毫米風扇組成,預計將於年內投入使用。如果結果出現並且人工智慧浪潮加強(但你怎麼能打相反的賭注),那麼這家現在在股市上市值超過 1 兆美元的公司可能會繼續爆炸。誰知道呢,加入價值超過 20000 億美元的精選公司俱樂部。對於一家最初向 PC 遊戲玩家銷售 3D 顯示卡而取得成功的公司來說,這還不錯!