NVIDIA的新GeForce卡在Gamescom宣布,下週將在交易中到達。打開球的前兩個是Les Geforce RTX 2080 Ti,Ultra -High -End和RTX 2080,非常高。告別GTX並歡迎來到新的3D怪物RTX,其任務是增強我們的遊戲,但也將變成未來。
是的,NVIDIA設計了RTX,以便他們可以滿足新需求,而對於許多人來說,在啟動時不會是局部使用的新需求。但這應該在未來幾個月和幾年內快速接近。我們特別考慮到超現實的渲染射線跟踪(RTX的RT)或在我們遊戲的圖形渲染服務時使用人工智能。而且可能性清單不止於此。 “智能”的圖形卡只能限於我們三角形的唯一計算,但能夠獲得許多其他能力,足以給我們帶來寒意。在進一步發展之前,讓我們對這些新RTX與GTX相比帶來的全球全球全球全景。
RTX和GTX:很大的差異
就像Quadro RTX,GeForce RTX啟動了Turing圖形芯片(TU10X代碼名稱),該芯片刻有12 nm FFN(NVIDIA FINFET)。公眾的上一代建築被命名帕斯卡並根據模型在16 nm或14 nm中雕刻。
新的圖靈芯片最多由186億晶體管組成(GTX系列10中最多120億晶體管),尺寸為545毫米2(反對314毫米2對於帕斯卡)。減少雕刻的雕刻並增加芯片的尺寸,使NVIDIA可以在電路中添加更多元素。
第二個主要進化是在芯片的核心中找到的。不再有一個,而是三種類型的計算單元,全部專門從事不同的活動,但在某些情況下可以共同運行。我們將在下面詳細介紹它們,但請注意,到目前為止,沒有GTX圖形卡在一個和同一電路中收集了許多不同的單元。只有專業的Volta Vintage型號才能擁有相同的功能。
第三大變化,遺棄GDDR5X內存和GDDR5,以使GDDR6受益。這種遷移使得有可能顯著提高芯片和內存模塊之間的交換速度。就像存儲更多紋理和數據的可能性一樣,對於以4K(甚至... 8K)顯示遊戲有用。隨著NVIDIA進一步改善了在內存管道中壓縮數據的算法,還可以將指令保存在芯片(緩存)不同部分(緩存)中的方式,一切都會更快。因此,GDDR6比最強大的Pascal卡(GTX 10)提供高達20%的性能。
在其他可見的更改中,我們將提及通風,該通風現在已委託給雙風扇系統,每個葉片處於13葉片,以及一間大容量的蒸汽臥室,並被蓋子交叉。根據NVIDIA的說法,GTX 1080最多可能會引起36 dB的噪聲滋擾,RTX 2080,它只會產生29。汞也將較少達到某些峰的快速,尤其是當您超越卡片時。在我們的下一次評估中進行檢查。
在視頻郊遊方面,Nvidia肯定將DVI視頻版本降級到壁櫥。所有RTX不再超過HDMI(2.0B),三個DisplayPort(1.4a兼容8K時為60 Hz),而新穎的是兼容的USB插座Virtuallink(VR的下一個標準?)。
最後,價格來了。 RTX在兩年前離開時比GTX貴。此外,正如Nvidia所宣布的那樣,在他出售的創始人版本與他的合作夥伴銷售的卡片之間,標籤和技術表將有差異。為了證明這一點,設計師調用了所選的電子組件,從而可以更好地上升GPU增強芯片,家用通風系統等。事實仍然是,迄今為止,在出售卡前幾天,所有GTX 2080 TI型號,但是999美元的宣布實際上是在1250年(創建者版本的價格)和1300歐元之間出售,甚至可以達到1,500歐元。要么是一台非常好的完整遊戲PC的價格!
圖靈處理器組織
這是Turing系列中最多進化的3D處理器的圖表,即Tu102,在NVIDIA的某些專業卡上存在。
這是Tu102的稍微修改的迭代,它使RTX 2080 Ti電動,並且在2080年,是Tu104正在起作用。最後,在RTX 2070上,將是Tu106。
每個版本以及它是GPU世界中的自定義,圖形處理器的元素被停用或純粹,簡單地刪除以達到所需的技術和功率水平(因此分段報價)。
對於經驗豐富的人來說,我們注意到圖靈芯片就像帕斯卡(Pascal)一樣,總是像弦娃娃一樣組織起來。
主要元素是GPC(圖形處理群集)集。在2080和2080 TI中,有六個,而1080和1080 Ti中有六個。
每個都包含TPC(紋理處理群集)塊。兩個新的RTX上有23和34,而GTX 1080和1080 TI僅擁有23和28。
最後,TPC內部由SM(流媒體流)託管,它們本身分為4個相同的部分。總共有2080 Ti上的68 SM,2080中有46個SM,在1080 Ti上為28,在1080上有20個SM。
每個SM單元由四個部分組成。這些房屋的兩個家族中的兩個家族(以及其他元素):Cuda Core(64)和Tensor Core(8)。 RT核心在其部分以每SM單位1的速度存在。
GPC塊的外圍是內存控制器,數量或多或少取決於圖形卡上存在的GDDR6模塊的數量。這會變化內存接口的大小,並通過擴展 - 帶寬的速度。然後是GigAthread引擎,PCI-Express 3.0接口,最後是NVLINK。它是從專業世界繼承的,是一個直接在芯片中建立的通信界面(與使用PCI-Express的SLI不同),允許兩個或更多卡一起操作,以將其RAM與共同點。首先,NVLink具有比以前的接口更快的特殊性GV100)。
圖靈:NVIDIA的“混合”建築
我們在上面說,圖靈建築之所以創新,是因為它建立在三個主要支柱,CUDA核心,張量芯和RT核心上,這是其三個大計算單元,例如基於Volta芯片的卡片。
庫達核心:
第一個和更多單元是CUDA計算單元,負責計算(著色器,圖形數據)和3D渲染,因為我們已經知道了很長時間。它們是從古代的Geforce卡繼承的,但當然已經進化。它們現在是兩種類型(INT32,FP32和第三小群體,FP64),並且它們的操作已在各個級別上得到改進甚至重新設計。從組織到並行執行任務,包括共享內存和L1緩存的合併和重組等。與10 GeForce一代相比,一切都發生了變化。
NVIDIA可以說,這主要要歸功於CUDA單元的變化,RTX在當前遊戲中的效率可能比上一代卡高出50%。
請注意,我們認為,自400系列以來,這些發展是消費者NVIDIA卡所知道的最大的技術變化之一。
張量芯:
然後是張量核心單元。它們是通過Volta專業建築引入的,專門研究對人工智能有吸引力的一切,並利用NVIDIA NGX工俱生態系統。在圖靈(Turing)上,他們主要起作用“推理”,也就是說,他們知道如何解釋,適應和實施以前在外部神經網絡上進行的培訓的成果。
NVIDIA聲稱已經佔用並改善了Volta中存在的單位,並且在RTX的情況下,他們的潛力首先是為圖形和視頻遊戲提供服務。第一個具體應用是DLSS(深度學習超級採樣)。
這是一個在AI上摻雜的圖像改進過程,它提供了較高的渲染質量,它將允許RTX 2080 Ti產生的每秒最多是GTX 1080 Ti的兩倍,該圖像是相同圖像的臨時抗抗血壓處理(TAA)。
RT核心:
現在讓我們談談RTX GeForce(和Quadro)RT核心。這些單位承擔著促進,負責和加速射線在兼容遊戲中的渲染的巨大負擔,呼籲DirectX射線跟踪(將於10月10日更新Windows 10),下一個Vulkan版本,甚至使用當前的NVIDIA OPTIX。
到目前為止,幾乎不可能用3D消費卡生產的操作。
只有專業模型並非總是實時的,而且還提供了將所有力量集中在這項任務上。
CUDA核心 + RT核心 +張量核心= RTX-OPS
為了量化GEFORCE RTX開發的全球力量時,NVIDIA創建了RTX-OPS指數。它可以在新的GeForce的技術表中找到,以及傳統數據(頻率,心臟數量,消費等)。作為指示,NVIDIA還將其在系列10上進行了計算,以顯示兩代之間的間隙程度。
RTX-OPS由NVIDIA建立,是數小時的測試和圖靈芯片行為的長期分析的果實。正如我們在上圖上看到的那樣,根據單元的一定平均百分比,使用CUDA核(INT32和FP32),RT核心和張量芯在復雜的圖像上進行計算。
例如,在基本型號上為76個2080 Ti的RTX-OPS在創始人版(FF)上給出了78。我們記得,芯片達到的GPU增強頻率所解釋的差異,在FF模型上比其他模型更高。相比之下,GeForce GTX 1080 Ti獲得的RTX-OPS得分為11.3。
RTX 2080的常規型號為57分配了指數57,FF卡為60(GTX 1080的8.9),最後,RTX 2070最終達到42/45,如GTX 1070,必須對6.5滿意。
3D的未來正在進行
圖靈的到來清楚地標誌著Nvidia的3D消費者世界的一個新開始。但是,GPU設計師並沒有從空白頁開始設計其Turing架構:它在很大程度上是受Volta的啟發,這是對AI和Ray Tracing多年研究的果實,加上那些用於設計跳蚤以滿足PC上Juicy Gaming Market的力量需求的花費。
但是,圖靈(Turing)體現了一個新的,強大的基礎,下一代的吉夫斯(Geforce)的跳蚤將像在他們的時間 - 特斯拉(Geforce 8000)或費米(GTX 400)體系結構一樣流動。
多虧了RTX和Turing,Nvidia還希望更多地挖掘目前將GeForce和AMD的Radeon分開的溝渠,從而保留其在圖形卡市場上的領先地位。特別是因為紅色不再是唯一必須觀察到該領域進步和進步的人!英特爾有其意圖到2020年返回專用的GPU市場。