Nvidia 在 GamesCom 上宣布,新款 GeForce 卡將於下週上市。最早推出的兩款產品是超高階 GeForce RTX 2080 Ti 和超高階 RTX 2080。再見 GTX,歡迎來到 RTX,新的 3D 強大怪物,其使命是增強我們的遊戲,但也著眼於未來。
是的,Nvidia 設計 RTX 是為了滿足新的需求、新的用途,而對許多人來說,這些在發佈時並不相關。但這應該會在未來的幾個月和幾年內很快發生。我們特別考慮超現實的光線追蹤渲染(來自 RTX 的 RT),甚至使用人工智慧來進行遊戲的圖形渲染。可能性清單還不止於此。 「智慧型」顯示卡將不再局限於計算三角形,而是具有許多其他功能,足以讓我們不寒而慄。在進一步討論之前,我們先先總結一下這些新 RTX 與 GTX 相比的優點。
RTX 和 GTX:巨大差異
就像Quadro RTX,GeForce RTX 採用圖靈圖形晶片(代號 TU10x),採用 12 nm FFN(FinFet Nvidia)雕刻。上一代主流架構稱為帕斯卡並根據型號以 16 nm 或 14 nm 進行雕刻。
新的圖靈晶片最多由 186 億個電晶體組成(相較之下,GTX 10 系列最多為 120 億個),尺寸為 545 毫米2(與 314 毫米相比2對於帕斯卡)。降低雕刻精度並增加晶片尺寸使 Nvidia 可以在電路中添加更多元件。
第二個重大發展是在晶片的核心。計算單元不再是一種,而是三種,它們都專門從事不同的活動,但在某些情況下能夠一起運行。我們將在下面詳細介紹它們,但要知道迄今為止還沒有 GTX 顯示卡將如此多的不同單元整合到一個電路中。只有基於 Volta 晶片的專業型號才能擁有如此之多。
第三個大變化,放棄GDDR5X顯存和GDDR5,轉而採用GDDR6。這種遷移顯著提高了晶片和儲存模組之間的交換速度。就像儲存更多紋理和資料的可能性一樣,對於以 4K 甚至 8K 格式顯示遊戲很有用。而且由於 Nvidia 進一步改進了壓縮記憶體管道中資料的演算法以及指令在晶片不同部分(快取)中的保存方式,一切都變得更快。因此,GDDR6 的效能比最強大的 Pascal 卡 (GTX 10) 的 GDDR5X 高出 20%。
在其他明顯的變化中,我們要提到的通風系統現在被委託給雙風扇系統,每個系統有 13 個葉片和一個大容量均熱板,並由熱管穿過。據 Nvidia 稱,GTX 1080 可能會造成高達 36 dB 的噪音污染,而 RTX 2080 只會產生 29 dB。在我們下次評估期間進行檢查。
當談到視訊輸出時,Nvidia 已經明確地將 DVI 視訊輸出收了起來。所有 RTX 現在僅具有 1 個 HDMI 輸出 (2.0b)、3 個 DisplayPort(1.4a 相容 60 Hz 的 8K)以及新的相容 USB Type-C 插座虛擬連結(下一個 VR 標準?)。
最後,價格來了。兩年前發佈時,RTX 比 GTX 更貴。此外,正如Nvidia所宣布的那樣,其銷售的Founders Edition版本與其合作夥伴銷售的卡片之間,標籤和技術表上將會存在差異。為了證明這一點,設計師列舉了所選的電子元件,這些元件可以更好地提高GPU Boost晶片的頻率、內部通風系統等。事實仍然是,迄今為止,在顯示卡上市前幾天,所有 GTX 2080 Ti 型號雖然宣布起價為 999 美元,但實際上售價在 1,250 美元(創始人版的價格)到 1300 歐元之間,甚至可以達到1500歐元。這就是一台非常好的、完整的遊戲電腦的價格!
圖靈處理器組織
這是圖靈系列中最先進的 3D 處理器 TU102 的圖表,該處理器出現在某些 Nvidia 專業卡上。
它是為 RTX 2080 Ti 提供動力的 TU102 的稍微修改版,在 2080 上,工作的是 TU104。最後,在 RTX 2070 上,它將是 TU106。
對於每種變體,按照 GPU 領域的慣例,圖形處理器的元件將被停用或簡單地刪除,以達到所需的技術和功率等級(從而細分產品)。
對於更有經驗的人來說,我們注意到圖靈晶片就像 Pascal 一樣總是像嵌套娃娃一樣組織起來。
主要元素為 GPC(圖形處理集群)集。 2080 和 2080 Ti 上有 6 個,而 1080 和 1080 Ti 上有 4 個和 6 個。
每個都包含 TPC(紋理處理叢集)區塊。兩款新 RTX 上有 23 和 34 個,而 GTX 1080 和 1080 Ti 只有 23 和 28 個。
最後,TPC 內託管 SM(流式多處理器)單元,這些單元本身分為 4 個相同的部分。 2080 Ti 上總共有 68 個 SM,2080 上有 46 個,而 1080 Ti 上有 28 個,1080 上有 20 個。
每個SM單元由四個部分組成。它們容納了晶片的三個執行單元系列中的兩個(以及其他元件):CUDA Core (64) 和 Tensor Core (8)。 RT 核心則以每個 SM 單元 1 個的比例存在。
GPC 區塊的外圍是記憶體控制器,其數量或多或少取決於顯示卡上 GDDR6 模組的數量。這會改變記憶體介面的大小以及頻寬速度。接下來是 GigaThread 引擎、PCI-Express 3.0 接口,最後是 NVLink。它繼承自專業領域,是一種通訊接口,直接安裝在晶片中(與使用 PCI-Express 的 SLI 不同),允許兩個或多個卡協同工作,共享 RAM。 NVLink 的特點是比以前的介面更快,但根據晶片的不同,提供的速度也有所不同(Quadro TU102 上最多 100 GB/s,Quadro TU102 上最多 300 GB/s)GV100)。
Turing:Nvidia 的「混合」架構
正如我們上面所說,圖靈架構之所以具有創新性,是因為它建立在三大支柱之上,即CUDA 核心、Tensor 核心和RT 核心,這三個大型運算單元實際上就像基於Volta 晶片的卡。
CUDA 核心:
第一個也是數量最多的單元仍然是 CUDA 計算單元,負責計算(著色器、圖形資料)和 3D 渲染,正如我們長期以來所熟知的那樣。它們繼承自老一代 GeForce 卡,但當然也有所發展。它們現在有兩種類型(INT32、FP32 和第三種 FP64),它們的操作在各個層級上都得到了改進甚至重新設計。從組織到並行運行任務,再到合併和重新組織共享記憶體和 L1 快取等等。與第 10 代 GeForce 相比,一切都改變了。
主要歸功於 CUDA 單元的變化,Nvidia 可以說 RTX 在當前遊戲中比上一代顯示卡的效率提高了 50%。
讓我們具體說明一下,我們認為這些發展構成了 Nvidia 卡自 400 系列以來所經歷的最大的技術變革之一。我們電玩遊戲的傳統渲染(著色/光柵化)。
張量核心:
接下來是 Tensor Core 單元。它們採用 Volta 專業架構引入,專注於與人工智慧相關的所有領域,並利用 Nvidia NGX 工俱生態系統。在圖靈上,他們主要進行“推理”,也就是說,他們知道如何解釋、適應和實施先前在外部神經網路上進行的訓練結果。
Nvidia 聲稱已經採用並改進了 Volta 中的單元,就 RTX 而言,確保它們的潛力首先用於圖形和視頻遊戲服務。第一個具體應用是DLSS(深度學習超級取樣)。
這是一個由AI 提供支援的影像增強過程,可提供卓越的渲染質量,而RTX 2080 Ti 每秒產生的影像數量是GTX 1080 Ti 的兩倍,GTX 1080 Ti 使用相同的時間抗鋸齒(TAA)處理影像。
RT 核心:
現在讓我們來談談 GeForce(和 Quadro)RTX RT 核心。這些單元肩負著促進、支援和加速相容遊戲中即時光線追蹤渲染的重任,使用DirectX 光線追蹤(在 Windows 10 的 10 月更新中發布)、下一個版本的 Vulkan 甚至使用目前的 Nvidia OptiX。
迄今為止,主流 3D 卡幾乎無法實現這一操作。
只有專業模型才能做到這一點,但並不總是即時的,而且條件是,必須將所有精力集中在這項任務上。
CUDA 核心 + RT 核心 + Tensor 核心 = RTX-OPS
為了量化 GeForce RTX 在調動不同系列的裝置時所產生的整體效能,Nvidia 創建了 RTX-OPS 指數。它可以在新 GeForce 的技術表上找到,旁邊還有傳統數據(頻率、核心數、功耗等)。出於資訊目的,Nvidia 還對 10 系列進行了計算,以顯示兩代產品之間的差距有多大。
RTX-OPS 由 Nvidia 建立,是對圖靈晶片的行為進行數小時測試和長期分析的結果。如上圖所示,它是根據使用 CUDA Core(INT32 和 FP32)、RT Core 和 Tensor Core 處理複雜影像時的單位所佔用的一定平均百分比來計算的。
例如,2080 Ti 的 RTX-OPS 在基本型號上為 76,在創始人版 (FF) 上為 78。差異可以透過晶片達到的 GPU Boost 頻率來解釋,我們記得,FF 型號上的頻率高於其他型號。相比之下,GeForce GTX 1080 Ti 的 RTX-OPS 得分為 11.3。
RTX 2080 的經典型號指數為 57,FF 卡的指數為 60(GTX 1080 的指數為 8.9),最後,RTX 2070 的峰值為 42/45,而 GTX 1070 的指數必須為 6.5。
3D 的未來就在這裡
Turing 的到來顯然標誌著 Nvidia 在消費 3D 領域的新起點。然而,這位GPU 設計師並不是從零開始設計他的圖靈架構:它很大程度上受到了Volta 的啟發,Volta 是多年來人工智慧和光線追蹤研究的成果,並結合了設計晶片以滿足不斷增長的算力的需要。
然而,Turing 體現了一個新的、強大的基礎,下一代 GeForce 晶片將由此誕生,就像當時的 Tesla (GeForce 8000) 或 Fermi (GTX 400) 架構一樣。
由於RTX和Turing,Nvidia也希望能進一步拉大目前AMD的GeForce和Radeon之間的差距,以維持在顯示卡市場的領先地位。尤其是紅軍不再是唯一在這方面取得進展和進展必須觀察的球隊!Intel確實有其用意到 2020 年重返專用 GPU 市場。