英特尔首款 Arc 图形芯片终于面世!这第一批一代炼金术士在夏初首款用于塔式 PC 的 PCI Express 显卡问世之前,该公司致力于笔记本电脑。
这个所谓的“A”移动系列由三个系列的芯片组成:Arc 3、Arc 5 和 Arc 7(按性能升序排列)。三个系列,但只有两种不同的芯片:ACM-G11 及其最多 8 个内核,适用于 Arc 3; ACM-G10 及其最大 32 个 Arc 5 和 Arc 7 核心。
差异在于操作核心的数量(由于市场细分或工厂产量的原因,我们不知道)以及频率、板载内存甚至最大 TDP。
所有芯片均由台积电采用 N6 节点制造,这是一种 6 纳米制造工艺,是台湾成熟的 7 纳米工艺的一部分。它受益于尺寸的减小、制造成本的节省(使用增强型 EUV,因此制造步骤更少)和能源消耗。
因此,英特尔以比 AMD(7 纳米)或 Nvidia(8 纳米)更精细的芯片进入图形大战。这会让他在成绩平平的情况下少找借口!
每周渲染切片
英特尔已经部分展示了其 GPU 的组织结构。美国人开发了一种基于渲染切片- 字面上地“渲染切片”– 集成四个 Xe HPG 图形核心 – 核心本身比 iGPU 的核心快一点,这些图形芯片与主处理器集成。
该架构能够并行化多达 8 个切片,即最多 32 个核心。在每个“切片”中,每个渲染核心由16个256位矢量渲染引擎(XVE)和16个1024位矩阵渲染引擎(AI相关计算,表示为XMX)组成。全部共享 192 KB 高速缓存。
英特尔特别打算在其 XMX 矩阵计算单元上做出改变,每个单元每个时钟周期能够执行 256 次操作 - 是的,这很多。而正如我们稍后将看到的,“AI”计算在这一代芯片中非常重要。
现代图形芯片要求每个 Xe HPG 核心都与光线追踪计算单元相结合,这个词汇集了称为“光线追踪”(光)的不同技术,能够更忠实地渲染光的行为(反射、阴影、透明度),以及环境。
这是“原始”部分,即与视频游戏和 3D 一般相关的计算,我们将在下面讨论。但在讨论游戏部分之前,让我们先谈谈英特尔真正打算做出改变的两个元素:媒体引擎及其芯片的集成。
Xe Media Engine:首先在 AV1 上
苹果通过其 M1 芯片的变体很好地展示了这一点,现代 GPU 的兴趣超出了原始 3D 能力,还依赖于(有时“特别”)有时不那么突出的硬件模块,例如专用于媒体的引擎。
在英特尔,它被命名为“Xe Media Engine”,也正是通过它,该公司希望与目前 PC 世界 GPU 之王 AMD 和 Nvidia 有所区别。
英特尔标记的第一点是首次支持 AV1 编解码器的解压缩和压缩功能。视频编解码器开源,AV1在压缩质量上优于HEVC。对于相同的文件大小,它提高了图像质量。在相同的质量下,它创建的文件更小,因此消耗的带宽更少。由于Xe Media Engine支持硬件压缩/解压缩(不仅是AV1,还支持H.264和H.265/HEVC),因此CPU在这些任务期间几乎不需要工作。
不仅可以用于编辑和发布视频,还可以用于广播(流媒体)。当我们看到像 Twitch 这样的平台在游戏玩家中的重要性时,这是一个强有力的论据。
深度链接打造平台
尽管成为 GPU 供应商,英特尔仍然是 CPU 和完整平台的设计者。此外,虽然完全有可能看到配备 AMD CPU 和英特尔 GPU 的机器,但后者强调了自己的组件。
他开发了多种平台技术深层链接(深层链接,法语)。与AMD的SmartShift一样,这是一个能够将CPU和GPU这两个组件作为一个整体平台进行管理的系统。
由于动态功率共享, 深层链接根据负载类型管理频率(以及总体消耗)。超编码他削减了视频编码任务,以利用 Arc 芯片的功能以及集成到英特尔处理器中的 iGPU。
最终,超级计算执行相同的分发工作,但用于与 AI 相关的任务。通过利用所有可用的计算单元,英特尔承诺在不增加硬件成本的情况下实现重大改进。
对优化的追求也体现在第一代卡提供的一项重要技术中:XeSS。
XeSS:性能提升的升级
与 Nvidia 的 DLSS 和 AMD 的 FSR 一样,英特尔也致力于扩展技术(升级英文)以提高性能。
“图像质量提高一倍,对计算能力的要求不是翻倍,而是指数级增长”Arc 系列营销经理 Damien Triolet 解释道。
“因此,为了提高视觉质量,我们需要减少对一种方法的关注”野蛮的» 比智能优化更重要,例如可变速率着色。 XeSS 依赖于人工智能模型,就是这样的一种方法,可以生成令人印象深刻的高质量像素。,他继续说道。
英特尔在这里并没有冒太大的风险,因为 Nvidia 的 DLSS 提供了出色的结果。问题显然是英特尔的计算单元、算法以及开发人员的技术实施能否胜任这项任务。
无论如何,对于英特尔来说,XeSS 及其 AI 计算单元将走得更远。
“未来,AI无疑能够做的不仅仅是计算像素,还能在渲染的不同阶段进行干预”,达米安·特里奥莱 (Damien Triolet) 承诺。
嗯,那是未来的事情。
随着夏季临近,首先是弧线 3,弧线 5 和弧线 7
如果今天宣布所有三个 GPU 系列(以及五种芯片的规格),那么首批可用的型号将是 Arc 3,即 A350M 和 A370M GPU。
分别集成1.5和2的芯片渲染切片,并配有 4 GB GDDR6。理论上,Nvidia 入门级解决方案的竞争对手,例如 MX450,或者更确切地说是 4 GB 专用 RAM 的 RTX 3050。
我们应该会在华为 Matebook X Pro 型超便携 PC 中看到 A330M(25-35 W)和 A370M(35-50 W)。足以赋予重量小于或等于1.4公斤的机器真正的游戏光环。需要更多的空间(和重量!)来消散 Arc 5 和 Arc 7,后者的功率可达 150 W!
与 Nvidia 的小型 MX 和 RTX 相比,Arc 3 的价值是多少?
“我们不想根据竞争来定义自己”,英特尔告诉我们。 “然后当我们发布性能测量结果时,您不相信我们。因此,我们会让您像平常一样进行测试!»,美国巨人队微笑着回答。
然而,尽管英特尔在 Tiger Lake 发布期间足够大胆(终于!)将自己与 AMD 和 Nvidia 进行比较,但它的态度却引发了质疑。
无论如何,对于这个入门级批次来说,游戏中的性能图表非常有趣。结果是20%(最终幻想14)超过100%(毁灭永恒)优于其 Xe 解决方案已经生产的集成到 12 芯片中的产品e一代。
游戏之间的性能差异不仅取决于资源,还取决于技术。
“如果数百款游戏已经与我们的 GPU 完美配合,那么我们已经认证了一百多个游戏”,英特尔解释道。
“性能差异有时是由某些游戏对 CPU 的依赖造成的。然后,当我们在某些游戏上达到足够的性能水平时,我们不会在这款游戏上每秒抓取 5 或 10 帧,而是将精力投入到尚未运行或运行不佳的游戏上。»,继续英特尔。
这是合乎逻辑的:我们往往会忘记,如果司机多年来,图形技术不断发展,这仅仅是因为一些改进是逐个游戏完成的。
如果英特尔已经获得了多年的专有技术来运行大量的点击数在其集成 GPU (iGPU) 上,美国人现在还必须着眼于高质量和高性能的渲染,而这是迄今为止它还无法声称的。
«之前我们优化了司机旋转反恐精英:全球攻势,例如。但今天,你还必须知道如何跑步反恐精英:全球攻势在电子竞技背景下»,达米安·特里奥莱特 (Damien Triolet) 解释道。
«制作 GPU 相对容易。制造一个能够运行数百种其他游戏的 GPU 更加困难!“,他继续说道。
新 GPU 生态系统的推出所带来的挑战的规模也决定了不同版本的推出速度:首先是便携式芯片,其中首先是入门级的两种型号。
然后在夏季推出塔式显卡的中端和高端型号。然后是秋季的专业版本。
«我们一步一步来。在开发方面,我们首先开发了架构,然后加强了软件团队的实力司机并支持工作室。我们现在正在扩大我们的团队进行更基础的研究。我们也采取同样的方法,首先推出入门级模型,然后再转向更高效的模型。», 描述达米安·特里奥莱 (Damien Triolet)。
英特尔变得谦虚了吗?
«我们谦虚地去那里,因为我们是这个领域的挑战者。但我们有远大的抱负,我们将投入资源,因为市场赌博距离饱和还很远»。
AMD、Nvidia,我们已警告过您。
2022 年 3 月 31 日编辑: 本文的第一个版本错误地解释了 Nvidia 的 DLSS 依赖于逐个游戏的训练模型,如果 2018 年该技术的 1.0 版本确实如此,自 2020 年推出 DLSS 2.0 以来,这种情况已不再是这样。对于这个错误,我们深表歉意。