除了强大的性能之外,NVIDIA GeForce GTX 1080 也是新技术的集合。无论您是在一个还是三个屏幕上玩游戏,还是通过 VR 耳机玩游戏,所有这些都可以让游戏显示速度更快。
你已经能够做到对 GTX 1080 性能的初步了解并开始理解Pascal芯片(GP104)的构成。现在是时候更进一步了,因为原始功率并不是新一代 NVIDIA 卡的唯一资产。
不要害怕,这里毫无疑问会涉及过多的技术考虑,而只是关注(可以理解)NVIDIA 在显卡中采用的所有技术,我们也会在 GTX 1070 中找到这些技术,这些技术应该6月10日发布。

改进的颜色增量压缩
为了使卡上的 GDDR5X 内存和图形处理器能够更快地交换信息,NVIDIA 改进了颜色增量压缩过程。

颜色与三角形一样,是图像任何组成部分的计算机数据。它在到达屏幕之前会经过不同的通道。为了避免占用通道(在这种情况下为内存)过多的空间,NVIDIA 成功开发了能够更精细地分析信息的算法,特别是与不同色块相关的信息。
这些“工人”按颜色甚至相邻颜色压缩颜色,首先是为了更快地传递它们,其次是为了让它们不占用管道中的空间以允许更重要或紧急的信息传递。
一旦到达知道如何解释它们的单位,小包裹就可以轻松解压并更快地进行处理。在实践中,下面的截图(由 NVIDIA 提供)显示了帕斯卡(右)与麦克斯韦(左)相比的压缩能力,麦克斯韦已经不是用石头而是用巨石来建造压缩建筑。
在这两个图像中,我们都看到紫色的所有压缩颜色,因此其处理得到了优化。剩下的黑色对应于卡必须计算和管理的所有颜色。左边是使用 Maxwell 平台(GeForce GTX 980 型卡)获得的结果,右边是在 GTX 1080 上通过 Pascal 算法压缩的相同图像。我们看到可以压缩更多颜色。处理速度更快。
Pascal GP104:敏捷模式下的一点帮助
当今的 PC 视频游戏越来越精美......并且资源密集。出于充分的理由,PC 硬件不断向前发展,开发人员也从中受益。事实上,显卡变得越来越多任务处理,它经常不仅计算图形渲染,而且还执行或多或少远离其主要属性的其他计算。
负责图形的单位比负责其他计算的单位更快地完成任务的情况并不少见。所以,当秒数结束时……第一批已经开始摆弄拇指了。有了帕斯卡,闲散似乎就被搁置了。事实上,根据NVIDIA工程师的说法,当图形部分完成工作后,如果计算部分还有很多工作要做,它就会为计算部分提供帮助。

另一项新技术使 Pascal 芯片比其姊妹芯片甚至竞争对手更高效,像素级抢占(PLP)。
这是一个非常技术性的表达方式,包含许多学术术语,最终使一些内容易于理解。事实上,PLP 允许芯片的辛苦工作单元中断常规或非优先任务,以执行更紧急的任务。

大多数处理器必须先处理完单个数据集的所有组成部分,然后才能解决紧急情况。帕斯卡成功地描绘出了他正在做的事情,像素完美。然后,它将全部或部分资源分配给紧急情况,对其进行处理,然后准确地从几微秒之前停止的地方恢复工作。因为是的,我们在这里谈论的是微秒,而不是秒或分钟。像素级抢占对用户来说完全不可见,但对卡的整体性能可见。

Pascal 可以对 PLP 中的像素进行处理,他也可以对更传统的数据(如其他计算处理器、图形或非图形)进行处理。 “抢占”的原理得到了进一步的完善,但与上面解释的略有不同。
当然,适用于计算数据的方法在更深层次上适用于所有 CUDA 兼容任务(GPGPU:使用 GPU 来处理通常由 CPU 类型处理器执行的计算),即硬写在处理器上的硬件指令。
所有这些对紧急和非紧急任务的改进管理不仅在经典使用中有意义,而且在多屏幕配置中甚至在虚拟现实环境中也有意义,在虚拟现实环境中,图像更大并且必须非常快速地即时生成.
专为多屏和 VR 量身定制的像素
为了增强多个屏幕上的渲染,最重要的是,使其更加流畅且更少失真,NVIDIA 设法在引擎中插入新的图像生成单元多态引擎4.0负责每个大的 SM 单元集群(包含计算单元的集群)。他的名字?同步多投影装置(SMPU) 或同时多个投影单元。它的任务是生成具有主视点的单个场景的最多 16 个几何投影(在 VR 中为 32 个),以及另外两个稍微偏移但始终存在于水平轴上的投影。
当然,实际上,芯片需要得到应用程序的支持才能工作,并且应用程序显然也必须进行优化,但粗略地说,这里有两种可能的应用场景。

环绕屏:多屏显示系统或曲面屏幕的所有者可能会搓手。如今,后者具有平面图像投影,适应弯曲面板的曲率或位于主面板两侧的两个屏幕,以给人一种沉浸式的印象。但图像扭曲或某些形状的复制最终会导致清晰视野非常有限。有了SMPU,先验的,不再有变形!该引擎能够以稍微不同的视角显示图像,最重要的是,避免复制图像的某些组件。

VR耳机:得益于 SMPU,该卡不必计算两个图像(每个镜头一个),然后调整它们(通过根据曲率使它们变形)。
由于图像的视点相同,SMP 只是在两个镜头上复制相同的图像。甚至更进一步,因为它能够粗略地调整像素的生成以适应 VR 耳机镜头的有效尺寸。
因此,该卡只创建一张 2.1 Mpixel 图像,而不是创建两张 2.1 Mpixel 图像,然后通过扭曲它们来粉碎它们以将其显示在镜头上。它会智能地复制和裁剪图像,以便复制的图像显示尽可能接近原始渲染。总共 1.4 Mpixels,显示像素数减少了 50%。因此,GeForce GTX 1080 将保存自身并准备处理其他操作,同时提供接近原始的视觉渲染,而不会失真或卡顿。
GPU Boost 3.0、快速同步和 HDR
我们的演示中缺少三项技术。我们决定在未来的前两篇文章中给它们一个单独的位置,而对于第三篇文章,我们将在这里快速处理它。
这GPU 加速 3.0要求我们认真研究该卡的超频能力,但我们还没有时间去做。
这快速同步是一种新型垂直同步,不同于NVIDIA 的 G-Sync从理论上讲,它提供了经典同步过程的所有优点(无图像失真),而没有缺点(由于缓冲区中的图像流量堵塞而导致高延迟)。最令人信服的结果将通过第一人称射击游戏获得,例如反恐精英:GO。因此,计划在未来几周内举办一次良好的碎片会议来欣赏此功能。
呆在那里高动态范围(高动态范围)。据NVIDIA称,Pascal在这方面与Maxwell具有相同的兼容性。然而,它还提供了对 4K/60 10/12b HEV 解码(针对 HDR 视频)和编码 (10b HEVC) 的支持。还确保了与 DisplayPort 1.4 HDR(适用于带 DP 的 HDR 显示器)的兼容性。此外,据报道,NVIDIA 正在与某些开发商努力合作,在现有或未来的游戏中实现 HDR。我们正在特别谈论《古墓丽影:崛起》、《不法之徒》,模范甚至暗影武士2.