这Turing des GeForce RTX 复杂架构来自 Nvidia 的技术允许后者为我们的游戏部署一系列新的渲染技术。当然,实时光线追踪是此次发布会中给人印象最深刻的一项,因为它本身就代表了 3D 世界中的一种“圣杯”。
此外,由于芯片中存在 Tensor Core(从人工智能世界继承的计算单元),Nvidia 希望鼓励开发人员使用新方法进一步放大他们的创作。不要忘记,它依赖于围绕创建场景和/或其中的 3D 元素(着色、光栅化、镶嵌)的更经典方法开发的所有改进,以提供范围广泛且更加完整的工具。即使是 VR 世界也未能“幸免”,并继续占据着 Nvidia 的一部分思想,尽管它很难在公众中找到一席之地。
图灵:实时和混合光线追踪
纯光线追踪 (RT) 需要大量硬件资源,并且使用的是新 RTX 的 RT 核心。当谈到显示静态或弱动画图像时,可以肯定的是,RTX 能够实时生成灯光秀。但在游戏中,一切都发生得非常快,所以情况已经复杂得多。因此,当阅读Nvidia提供的技术文档时,我们看到一切都呈现出更加“混合”的维度。
Nvidia 设想了一种基于传统技术(光栅化、曲面细分)与 RT 技术相结合的渲染方法。于是诞生了“混合渲染”。显然,我们首先经典地计算场景并像以前一样生成阴影和灯光。
然后,在链条的末端,我们使用 RT Core,它将大幅加速图像中关键位置的光线投射,从而细化、改进阴影和灯光,并赋予图像具有一个真实的角色,而不会让显卡屈服。在可以使用 RT 的所有渲染领域或类型中,我们可以列举:光的反射和折射、阴影和环境光遮挡、全局照明甚至与碰撞相关的变形。
从而使游戏玩家为了评估不同显卡之间光线追踪渲染的性能差异,Nvidia 引入了 Rays Cast 的概念。这是以千兆射线/秒表示的速度,表示卡的原始 RT 计算能力。
例如,GTX 2080 Ti 能够产生每秒 10 Giga Rays 的功率,而 GeForce GTX 1080 Ti 的速度限制为 1.1 GR/s。并且有充分的理由,它没有专用于光线追踪的硬件单元,只能通过软件模拟生成这种类型的渲染。
深度学习超级采样(DLSS),AA给AI打酱油
DLSS 是 Tensor Core 在视频游戏中的第一个具体应用。这也是一种渲染技术,起源于深度学习。……顾名思义。简单来说,DLSS 的承诺如下:让您拥有比时间抗锯齿 (TAA) 类型处理更美观、更锐利、更具浮雕效果的抗锯齿类型图形渲染,同时受益于数量的增加每秒显示的图像数。显然,感谢人工智能,英伟达向我们承诺了黄油和黄油。
它是如何运作的?很简单。游戏开发者向 Nvidia 超级计算机上托管的神经网络提交游戏版本。所述网络将以不同的图像定义“播放”它,对纹理进行或多或少的处理(高达 64 倍超级采样),持续数小时、数天、数周。这将使其能够生成非常高清晰度的图像,推断多个序列之间的逻辑序列,并整合某些像素相对于其他像素的逻辑位置。
所有学习成果将被编译成一个配置文件,Nvidia 将提供给开发人员,以便他们可以在自己的游戏中实现它,然后由玩家激活。对于已经发布的游戏,GeForce 设计师保证可以通过驱动程序将其发送给玩家,并在开发人员部署一个小补丁以访问功能后激活它。
您可能已经猜到了,因为配置文件包含大量可立即被 Tensor Core 使用的信息,因此 CUDA Core(它们)将不会那么繁忙。因此,他们可以专注于剩余的计算,从而进一步在屏幕上每秒生成更多帧。
它基于新显卡对 DLSS 的使用,Nvidia 在 RTX 发布时宣称,在某些情况下,它们的性能高达上一代同类产品的两倍。
Nvidia 最终考虑在不同领域使用 Tensor Core。例如,设计师希望开发人员能够发挥他们的潜力,以便敌人可以根据玩家的行为调整其行为。想象一下,您最喜欢的 MMORPG 中的 Boss 可以开发出根据您的游戏风格改变攻击周期的能力:这足以为您的突袭之夜增添一点趣味! Nvidia 还提到了使用 Tensor Core 来检测作弊者或解释游戏中语音命令的可能性。
新的着色器渲染技术
Nvidia 为推出图灵卡而提出的第一项新图形技术,即网格着色。它汇集了多种技术,所有这些技术都有助于改进游戏中几何形状和着色器的计算、建模和生成,并利用它们。再次强调,它是一个可供开发人员使用的工具,他们可以自由地使用或不使用它。
Mesh Shading的具体应用,如下场景的展示。
有很多小行星,3D元素,都位于不同的平面上。根据船舶的运动,石头表面的细节程度会有所不同,给人一种高级现实主义的印象。借助网格着色,开发人员能够列出所有相似的元素以及根据船舶的接近程度应用到它们的不同细节级别。列表是由显卡直接提交和处理的,而不是由计算机处理器逐个元素发送到 GPU,就像今天的情况一样,在“经典”创建过程中。演习的目标?节省时间、避免管道拥堵,最重要的是使用 RTX 强大的计算能力。
当然,为了实现这一结果,Nvidia 重新组织了流程,在三角形和其他着色器的生成链中引入了两个处理阶段:网格着色器和任务着色器。它们由卡的单元并行执行,但不添加到当前创建链中,它们替换或组合步骤,如上图所示。
另一项备受关注的技术,可变速率着色(VRS)。这涉及将游戏图像切割成 16×16 像素的部分,并将它们传递给多种算法,例如,为按区域生成着色器分配或多或少的图形能力,从而分配给像素的着色(内容自适应着色)。
还可以改变移动对象上着色器(或其定义)的复杂性(运动自适应着色)。或者完全减少玩家通过余光感知到的一切的数量(焦点渲染)。请注意,可以将内容自适应着色和运动自适应着色结合起来(注视点渲染将更多地保留给 VR)。
例如,在赛车游戏中,开发人员可以确保地图强调玩家在前景和背景中看到的所有内容,例如位于其视野中的车辆、道路和装饰元素。另一方面,对于所有其他不太明显的元素,例如仪表或沥青侧块,无需调动太多资源。
因此,游戏创建者可以确保该卡不会计算所有着色器,因此仅对两个像素中的一个进行着色。或者四个像素中的一组,等等。然后,算法负责实时平滑渲染,同时增强颜色,以便对通常不会被辐射着色的像素进行着色。这让人想起 PlayStation 4 Pro 或 Xbox One X 的 4K 渲染技术(棋盘渲染和/或超级采样)。
如上图所示,开发商没有义务进行大面积的处理。他可以完全瞄准并混合不同级别的处理,并将它们应用到图像中任何他想要的位置。目前,用肉眼几乎无法区分所有着色器和像素均以 1x1 比例生成的图像与使用 VRS 处理的图像之间的区别。
然而,通过仔细关注“内容自适应”图像,并通过瞄准“着色率可视化”上可见的两个巨大红色区域,将其与“原始”图像进行比较,我们可以检测到门上有非常轻微的阴影缺失。一些舱口细节缺失。细节顺序有所不同,但很好地说明了 VRS 的工作原理。
终于来了纹理空间着色或 TSS。操作原理也很简单。对于开发人员来说,这意味着能够确保重复用于渲染的某些纹理和着色器保留在内存中,并且可以快速从一张图像“调用”到另一张图像。
事实上,本应用于重新计算它们的功率可以分配给其他元素的生成。甚至可以改变所保存的纹理的定义,这样,如果视角或距离发生变化,地图只需向上或向下调整,并且可以再次避免重新计算所有内容。 TSS 对于 VR 应用程序和游戏特别有用,因为卡必须同时计算两个图像(每只眼睛一个)。
我们对图灵(GeForce RTX 2070、2080 和 2080 Ti 卡上的新型图形芯片)的强大功能所提供的可能性的技术介绍已经结束。下一步,也是最重要的一步,测试。敬请关注!