英特爾首款 Arc 繪圖晶片終於問世!這第一批一代煉金術士在夏初首款用於塔式 PC 的 PCI Express 顯示卡問世之前,該公司致力於筆記型電腦。
這個所謂的「A」移動系列由三個系列的晶片組成:Arc 3、Arc 5 和 Arc 7(依效能升序排列)。三個系列,但只有兩種不同的晶片:ACM-G11 及其最多 8 個內核,適用於 Arc 3; ACM-G10 及其最大 32 個 Arc 5 和 Arc 7 核心。
差異在於操作核心的數量(由於市場細分或工廠產量的原因,我們不知道)以及頻率、板載記憶體甚至最大 TDP。
所有晶片均由台積電採用 N6 節點製造,這是一種 6 奈米製造工藝,是台灣成熟的 7 奈米製程的一部分。它受益於尺寸的減小、製造成本的節省(使用增強型 EUV,因此製造步驟更少)和能源消耗。
因此,英特爾以比 AMD(7 奈米)或 Nvidia(8 奈米)更精細的晶片進入圖形大戰。這會讓他在成績平平的情況下少找藉口!
每週渲染切片
英特爾已經部分展示了其 GPU 的組織結構。美國人開發了一種基於渲染切片- 字面上地“渲染切片”– 整合四個 Xe HPG 圖形核心 – 核心本身比 iGPU 的核心快一點,這些圖形晶片與主處理器整合。
該架構能夠並行化多達 8 個切片,即最多 32 個核心。在每個「切片」中,每個渲染核心由16個256位元向量渲染引擎(XVE)和16個1024位元矩陣渲染引擎(AI相關計算,表示為XMX)組成。整個系統共享 192 KB 的高速緩存。
英特爾特別打算在其 XMX 矩陣計算單元上做出改變,每個單元每個時脈週期能夠執行 256 次操作 - 是的,這很多。而正如我們稍後將看到的,「AI」計算在這一代晶片中非常重要。
現代圖形晶片要求每個Xe HPG 核心都與光線追蹤計算單元相結合,這個詞彙集了稱為「光線追蹤」(光)的不同技術,能夠更忠實地渲染光的行為(反射、陰影、透明度) ,以及環境。
這是「原始」部分,即與視頻遊戲和 3D 一般相關的計算,我們將在下面討論。但在討論遊戲部分之前,讓我們先談談英特爾真正打算做出改變的兩個元素:媒體引擎及其晶片的整合。
Xe Media Engine:首先在 AV1 上
蘋果透過其 M1 晶片的變體很好地展示了這一點,現代 GPU 的興趣超出了原始 3D 能力,還依賴於(有時「特別」)有時不那麼突出的硬體模組,例如專用於媒體的引擎。
在英特爾,它被命名為“Xe Media Engine”,也正是透過它,該公司希望與目前 PC 世界 GPU 之王 AMD 和 Nvidia 有所區別。
英特爾標記的第一點是首次支援 AV1 編解碼器的解壓縮和壓縮功能。視訊編解碼器開源,AV1在壓縮質量上優於HEVC。對於相同的檔案大小,它提高了圖像品質。在相同的品質下,它創建的檔案更小,因此消耗的頻寬更少。由於Xe Media Engine支援硬體壓縮/解壓縮(不僅是AV1,還支援H.264和H.265/HEVC),因此CPU在這些任務期間幾乎不需要工作。
不僅可以用於編輯和發布視頻,還可以用於廣播(串流媒體)。當我們看到像 Twitch 這樣的平台在遊戲玩家中的重要性時,這是一個強有力的論點。
深度連結打造平台
儘管成為 GPU 供應商,英特爾仍然是 CPU 和完整平台的設計者。此外,雖然完全有可能看到配備 AMD CPU 和英特爾 GPU 的機器,但後者強調了自己的組件。
他開發了多種平台技術深層連結(深層連結,法語)。與AMD的SmartShift一樣,這是一個能夠將CPU和GPU這兩個元件作為一個整體平台進行管理的系統。
由於動態功率共享, 深層連結根據負載類型管理頻率(以及總體消耗)。超編碼他削減了視訊編碼任務,以利用 Arc 晶片的功能以及整合到英特爾處理器中的 iGPU。
最終,超級計算執行相同的分發工作,但用於與 AI 相關的任務。透過利用所有可用的計算單元,英特爾承諾在不增加硬體成本的情況下實現重大改進。
對優化的追求也體現在第一代卡提供的一項重要技術:XeSS。
XeSS:效能提升的升級
與 Nvidia 的 DLSS 和 AMD 的 FSR 一樣,英特爾也致力於擴展技術(升級英文)以提高性能。
“影像品質提高一倍,對運算能力的要求不是翻倍,而是指數級成長”Arc 系列行銷經理 Damien Triolet 解釋道。
“因此,為了提高視覺質量,我們需要減少對一種方法的關注”野蠻的» 比智慧優化更重要,例如可變速率著色。 XeSS 依賴人工智慧模型,就是這樣的一種方法,可以產生令人印象深刻的高品質像素。,他繼續說。
英特爾在這裡並沒有冒太大的風險,因為 Nvidia 的 DLSS 提供了出色的結果。問題顯然是英特爾的計算單元、演算法以及開發人員的技術實作能否勝任這項任務。
無論如何,對於英特爾來說,XeSS 及其 AI 計算單元將走得更遠。
“未來,AI無疑能夠做的不僅僅是計算像素,還能在渲染的不同階段進行幹預”,達米安·特里奧萊 (Damien Triolet) 承諾。
嗯,那是未來的事。
隨著夏季臨近,首先是弧線 3,弧線 5 和弧線 7
如果今天宣布所有三個 GPU 系列(以及五種晶片的規格),那麼首批可用的型號將是 Arc 3,即 A350M 和 A370M GPU。
分別整合1.5和2的晶片渲染切片,並配有 4 GB GDDR6。理論上,Nvidia 入門級解決方案的競爭對手,例如 MX450,或更確切地說是 4 GB 專用 RAM 的 RTX 3050。
我們應該會在華為 Matebook X Pro 型超便攜 PC 中看到 A330M(25-35 W)和 A370M(35-50 W)。足以賦予重量小於或等於1.4公斤的機器真正的遊戲光環。需要更多的空間(和重量!)來消散 Arc 5 和 Arc 7,後者的功率可達 150 W!
與 Nvidia 的小型 MX 和 RTX 相比,Arc 3 的價值是多少?
“我們不想根據競爭來定義自己”,英特爾告訴我們。 “然後當我們發布效能測量結果時,您不相信我們。因此,我們會讓您像平常一樣進行測試!»,美國巨人隊微笑著回答。
然而,儘管英特爾在 Tiger Lake 發布期間足夠大膽(終於!)將自己與 AMD 和 Nvidia 進行比較,但它的態度卻引發了質疑。
無論如何,對於這個入門級批次來說,遊戲中的性能圖表非常有趣。結果是20%(最終幻想14)超過100%(毀滅永恆)高於其 Xe 解決方案已整合到 12 晶片中的產品e一代。
遊戲之間的效能差異不僅取決於資源,還取決於技術。
“如果數百款遊戲已經與我們的 GPU 完美配合,那麼我們已經認證了一百多個遊戲”,英特爾解釋。
「效能差異有時是由某些遊戲對 CPU 的依賴所造成的。然後,當我們在某些遊戲上達到足夠的性能水平時,我們不會在這款遊戲上每秒抓取 5 或 10 幀,而是將精力投入到尚未運行或運行不佳的遊戲上。»,繼續英特爾。
這是合乎邏輯的:我們往往會忘記,如果司機多年來,圖形技術不斷發展,這僅僅是因為一些改進是逐個遊戲完成的。
如果英特爾已經獲得了多年的專有技術來運行大量的點擊數在其整合 GPU (iGPU) 上,美國人現在還必須著眼於高品質和高效能的渲染,而這是迄今為止它還無法聲稱的。
«之前我們優化了司機旋轉反恐精英:全球攻勢,例如。但今天,你還必須知道如何跑步反恐精英:全球攻勢在電競背景下»,達米安·特里奧萊特 (Damien Triolet) 解釋道。
«製作 GPU 相對容易。製造一個可以運行數百種其他遊戲的 GPU 更加困難!“,他繼續說道。
新 GPU 生態系統的推出所帶來的挑戰的規模也決定了不同版本的推出速度:首先是便攜式晶片,其中首先是入門級的兩種型號。
然後在夏季推出塔式顯示卡的中階和高階機型。然後是秋季的專業版本。
«我們一步一步來。在開發方面,我們首先開發了架構,然後加強了軟體團隊的實力司機並支持工作室。我們現在正在擴大我們的團隊進行更基礎的研究。我們也採取同樣的方法,先推出入門級模型,然後再轉向更有效率的模型。», 描述達米安‧特里奧萊 (Damien Triolet)。
英特爾變得謙虛了嗎?
«我們謙虛地去那裡,因為我們是這個領域的挑戰者。但我們有遠大的抱負,我們將投入資源,因為市場賭博距離飽和還很遠»。
AMD、Nvidia,我們已警告過您。
2022 年 3 月 31 日編輯: 本文的第一個版本錯誤地解釋了 Nvidia 的 DLSS 依賴於逐個遊戲的訓練模型,如果 2018 年該技術的 1.0 版本確實如此,自 2020 年推出 DLSS 2.0 以來,這種情況已不再是如此。對於這個錯誤,我們深表歉意。