這Turing des GeForce RTX 複雜架構來自 Nvidia 的技術允許後者為我們的遊戲部署一系列新的渲染技術。當然,即時光線追蹤是發表會中給人印象最深刻的一項,因為它本身就代表了 3D 世界中的一種「聖杯」。
此外,由於晶片中存在 Tensor Core(從人工智慧世界繼承的運算單元),Nvidia 希望鼓勵開發人員使用新方法進一步放大他們的創作。不要忘記,它依賴於圍繞創建場景和/或其中的 3D 元素(著色、光柵化、鑲嵌)的更經典方法開發的所有改進,以提供廣泛且更加完整的工具。即使是 VR 世界也未能“倖免”,並繼續佔據著 Nvidia 的一部分思想,儘管它很難在公眾中找到一席之地。
圖靈:即時和混合光線追踪
純光線追蹤 (RT) 需要大量硬體資源,並且使用的是新 RTX 的 RT 核心。當談到顯示靜態或弱動畫圖像時,可以肯定的是,RTX 能夠即時生成燈光秀。但在遊戲中,一切都發生得非常快,所以情況已經複雜得多。因此,當閱讀Nvidia提供的技術文件時,我們看到一切都呈現出更「混合」的維度。
Nvidia 設想了一種基於傳統技術(光柵化、曲面細分)與 RT 技術相結合的渲染方法。於是誕生了「混合渲染」。顯然,我們首先經典地計算場景並像以前一樣產生陰影和燈光。
然後,在鏈條的末端,我們使用 RT Core,它將大幅加速影像中關鍵位置的光線投射,從而細化、改進陰影和燈光,並賦予影像具有一個真實的角色,而不會讓顯示卡屈服。在所有可以使用 RT 的渲染領域或類型中,我們可以列舉:光的反射和折射、陰影和環境光遮蔽、全域照明甚至與碰撞相關的變形。
從而使遊戲玩家為了評估不同顯示卡之間光線追蹤渲染的效能差異,Nvidia 引入了 Rays Cast 的概念。這是以千兆射線/秒錶示的速度,表示卡片的原始 RT 運算能力。
例如,GTX 2080 Ti 能夠產生每秒 10 Giga Rays 的功率,而 GeForce GTX 1080 Ti 的速度限制為 1.1 GR/s。並且有充分的理由,它沒有專用於光線追蹤的硬體單元,只能透過軟體模擬產生這種類型的渲染。
深度學習超級取樣(DLSS),AA到AI醬
DLSS 是 Tensor Cores 在電玩遊戲中的第一個具體應用。這也是一種渲染技術,起源於深度學習。……顧名思義。簡單來說,DLSS 的承諾如下:讓您擁有比時間抗鋸齒 (TAA) 類型處理更美觀、更銳利、更具浮雕效果的抗鋸齒類型圖形渲染,同時受益於數量的增加每秒顯示的圖像數。顯然,感謝人工智慧,英偉達向我們承諾了黃油和黃油。
它是如何運作的?很簡單。遊戲開發者向 Nvidia 超級電腦上託管的神經網路提交遊戲版本。所述網路將以不同的圖像定義「播放」它,對紋理進行或多或少的處理(高達 64 倍超級採樣),持續數小時、數天、數週。這將使其能夠產生非常高清的影像,推斷多個序列之間的邏輯序列,並整合某些像素相對於其他像素的邏輯位置。
所有學習成果將被編譯成一個配置文件,Nvidia 將提供給開發人員,以便他們可以在自己的遊戲中實現它,然後由玩家啟動。對於已經發布的遊戲,GeForce 設計師保證可以透過驅動程式將其發送給玩家,並在開發人員部署一個小補丁以存取功能後啟動它。
您可能已經猜到了,因為配置文件包含大量可立即由 Tensor Core 使用的信息,因此 CUDA Core(它們)將不會那麼繁忙。因此,他們可以專注於剩餘的計算,從而進一步在螢幕上每秒生成更多幀。
它基於新顯示卡對 DLSS 的使用,Nvidia 在 RTX 發佈時宣稱,在某些情況下,它們的性能高達上一代同類產品的兩倍。
Nvidia 最終考慮在不同領域使用 Tensor Core。例如,設計師希望開發人員能夠發揮他們的潛力,以便敵人可以根據玩家的行為調整其行為。想像一下,您最喜歡的 MMORPG 中的 Boss 可以開發出根據您的遊戲風格改變攻擊週期的能力:這足以為您的突襲之夜增添一點趣味! Nvidia 也提到了使用 Tensor Core 來偵測作弊者或解釋遊戲中語音命令的可能性。
新的著色器渲染技術
Nvidia 為推出圖靈卡而提出的第一個新圖形技術,即網格著色。它匯集了多種技術,所有這些技術都有助於改進遊戲中幾何形狀和著色器的計算、建模和生成,並利用它們。再次強調,它是一個可供開發人員使用的工具,他們可以自由地使用或不使用它。
Mesh Shading的具體應用,如下場景的展示。
有很多小行星,3D元素,都位於不同的平面上。根據船舶的運動,石頭表面的細節程度會有所不同,給人一種高級現實主義的印象。借助網格著色,開發人員能夠列出所有相似的元素以及根據船舶的接近程度應用到它們的不同細節等級。清單是由顯示卡直接提交和處理的,而不是由電腦處理器逐個元素發送到 GPU,就像今天的情況一樣,在「經典」創建過程中。演習的目標?節省時間、避免管道擁堵,最重要的是使用 RTX 強大的運算能力。
當然,為了實現這一結果,Nvidia 重新組織了流程,在三角形和其他著色器的生成鏈中引入了兩個處理階段:網格著色器和任務著色器。它們由卡片的單元並行執行,但不會添加到目前建立鏈中,它們替換或組合步驟,如上圖所示。
另一項備受關注的技術,可變速率著色(VRS)。這涉及將遊戲圖像切割成 16×16 像素的部分,並將它們傳遞給多種演算法,例如,為按區域生成著色器分配或多或少的圖形能力,從而分配給像素的著色(內容自適應著色)。
也可以改變移動物件上著色器(或其定義)的複雜性(運動自適應著色)。或完全減少玩家透過餘光感知到的所有事物的數量(焦點渲染)。請注意,可以將內容自適應著色和運動自適應著色結合起來(注視點渲染將更多地保留給 VR)。
例如,在賽車遊戲中,開發人員可以確保地圖強調玩家在前景和背景中看到的所有內容,例如位於其視野中的車輛、道路和裝飾元素。另一方面,對於所有其他不太明顯的元素,例如儀表或瀝青側塊,無需調動太多資源。
因此,遊戲創建者可以確保該卡不會計算所有著色器,因此僅對兩個像素中的一個進行著色。或四個像素中的一組,等等。然後,演算法負責即時平滑渲染,同時增強顏色,以便對通常不會被輻射著色的像素進行著色。這讓人想起 PlayStation 4 Pro 或 Xbox One X 的 4K 渲染技術(棋盤渲染和/或超級採樣)。
如上圖所示,開發商沒有義務進行大面積的處理。他可以完全瞄準並混合不同級別的處理,並將它們應用到圖像中任何他想要的位置。目前,用肉眼幾乎無法區分所有著色器和像素均以 1x1 比例產生的影像與使用 VRS 處理的影像之間的差異。
然而,透過仔細注意「內容自適應」影像,並透過瞄準「著色率視覺化」上可見的兩個巨大紅色區域,將其與「原始」影像進行比較,我們可以偵測到門上有非常輕微的陰影缺失。有些艙口細節缺失。細節順序有所不同,但很好地說明了 VRS 的工作原理。
終於來了紋理空間著色或 TSS。操作原理也很簡單。對於開發人員來說,這意味著能夠確保重複用於渲染的某些紋理和著色器保留在記憶體中,並且可以快速從一個圖像「呼叫」到另一張圖像。
事實上,本應用於重新計算它們的功率可以分配給其他元素的生成。甚至可以改變所保存的紋理的定義,這樣,如果視角或距離發生變化,地圖只需向上或向下調整,並且可以再次避免重新計算所有內容。 TSS 對於 VR 應用程式和遊戲特別有用,因為卡片必須同時計算兩個圖像(每隻眼睛一個)。
我們對圖靈(GeForce RTX 2070、2080 和 2080 Ti 卡上的新型圖形晶片)的強大功能所提供的可能性的技術介紹已經結束。下一步,也是最重要的一步,測試。敬請關注!