GDC 2022:英特尔详解ARC Alchemist GPU的XeSS与光追性能优势

2022-03-25 10:29:36 来源: 扣丁书屋

0浏览 评论0

(via WCCFTech)

XeSS 的核心原理是通过 ARC Alchemist GPU 的 Xe-Cores 上集成的 XMX AI 加速硬件,来充分发挥机器学习的效用。

英特尔声称 XeSS 优于 Temporal Upscaling 2 方案

该方案与 DirectX 12 完全兼容,且适用于英特尔 ARC SIMD 架构上运行的基于矢量着色语言的神经网络(NN)。

与原始 4K 分辨率相比,使用 XMX 的 XeSS 4K 渲染场景、开销不到前者的一半。该技术还符合 DP4a 标准,这意味着它能够在没有 XMX 等 AI 或 ML 加速引擎的 GPU 上运行,辅以相近的性能和图像质量。

与 TAAU 等升级方案相比,XeSS 以最少的伪影(如闪光)来消除各种重影,带有内置的锐化引擎以取代 TAA 。此外与超级采样或空间升级方案相比,XeSS 能够在不影响质量的情况下实现更高的缩放比例。

英特尔还分享了一个全新的 XeSS Rens 演示,选择了在固定频率的英特尔 ARC Alchemist GPU 上运行光追 / 五档不同的 XeSS 预设分辨率(超性能、性能、平衡、质量、超质量)。

可知在Ultra 性能模式下,其能够带来 2.53 倍的性能提升,Ultra Quality 更是能够在 4K 分辨率下实现较原生高 27% 的性能提升。

英特尔继续深入自家光追方案,及其如何较英伟达 / AMD 的竞争方案更具优势。比如绕过针对命中着色器、纹理的 SIMD 发散,并使用一组硬件分类来处理光线和线程,以最大限度地延长每个通道的正常运行时间。

如此一来,英特尔 ARC Alchemist GPU 的光追方案,本质上就更贴近于自动加速硬件。在一张通过预生产显卡跑出的性能指标 PPT 中,我们看到 GPU 在 RayQuery(relative)vs DXR1.0 对比中具有 0.775 的性能表现。

英特尔还解释了出现这种情况的原因,以及为何会在自家 GPU 上看到这种性能下降。之后该公司讨论了如何在游戏引擎中利用 12 代 Alder Lake CPU 中引入的混合式核心架构设计。

据悉,Intel 与 IO Interactive 一直在 CPU / GPU 优化上努力,以便开发者能够充分利用 AI 加速、角色动画、物理、碰撞、音频处理等后台任务,在适当情况下积极调用单线程性能更具优势的 P 核。

以《Hitman 3:Dartmoor》游戏为例,英特尔展示了在启用高性能 P 核 / 节能 E 核的情况下的对比表现。可知 12 代 Alder Lake CPU 的混合架构具有 +4% 的平均帧速率优势,九成情况下可将 FPS 提升 12%、一成情况下降低了 2% 。

不过最大的改进,还是在其物理框架内 —— 等待时间减少了 55%( 90% @ 1.7 ms),整体帧时间减少了 25% —— 由于需要在渲染线程上等待,较快的帧确实会减慢一点。

当然,上述只是 Intel 官方给出的初步细节。至于更多内容,还请耐心等待 3 月 29 日正式推出首批 ARC Alchemist GPU 后再开展实战检验。

标签: 的情况下 最大限度 机器学习 性能指标 自动加速

[责任编辑:]

相关阅读