在CES 2025年,NVIDIA宣布了许多新事物,以至于很难弄清楚真正值得关注的东西。尽管RTX 5090及其巨大的价格都抓住了所有头条新闻 ,但一件新的技术坐在一边,有很多希望,但没有游戏来展示它 。但是 ,NVIDIA现在发布了用于其RTX神经纹理压缩(RTXNTC)系统的Beta软件工具包,并且在使用它一两个小时后,我对此给我留下了深刻的印象。
目前 ,游戏中的所有纹理都被压缩为通用格式,以节省存储空间和下载要求,然后在渲染中使用时进行解压缩。不过 ,它并不能逃脱您的通知,即当今的3D游戏是&Hellip; wellip; sholdip; sholderive; 100 GB或更多GB并不罕见 。
RTXNTC的工作原理:原始纹理预先转换为小型神经网络的一系列权重。当游戏的引擎向GPU发布指令以将这些纹理应用于对象时,图形处理器会对其进行采样。然后 ,上述神经网络(又称解码)重建了样本点的纹理 。
该系统只能产生一个未过滤的Texel,因此对于样本演示,RTX纹理过滤(也称为随机纹理过滤)用于插入其他texels。
Nvidia使用“样本推断”一词描述了整个事物,至少可以说 ,结果令人印象深刻。没有任何形式的压缩,演示中的纹理内存足迹为272 MB 。随着RTXNTC如火如荼,仅减少到11.37 MB。
抽样和解码的整个过程非常快。但是 ,它的速度不如普通纹理采样和过滤 。在1080p时,非NTC设置的运行量为2,466 fps,但在样品上互动时降至2,088 fps。逐步提高分辨率高达4K ,性能数字分别为930和760 fps。换句话说,RTXNTC在1080p时造成15%的帧速率罚款,而在4K—中造成的纹理记忆降低了96%。
使用RTX 4080 Super实现了这些帧速率 ,低层或较早的RTX图形卡很可能会看到较大的性能下降 。对于这种硬件,NVIDIA建议使用“推理负载 ”(NTC在演示中转移到BCN),其中将预压缩的NTC纹理压缩为游戏(或演示 ,在这种情况下)加载。然后将它们以标准的BCN块压缩格式进行转码,以按正常方式进行采样并过滤。
减少纹理内存并不令人印象深刻,但性能命中率与样本上的互动差不多 。在1080p,2,444 fps时 ,几乎与标准纹理样品和过滤一样快,纹理足迹仅为98 MB。这比未压缩格式降低了64%。
如果纹理重建是垃圾,那么所有这些都将一无所有 ,但是正如您在下面的画廊中看到的那样,RTXNTC生成的texels看起来与原件几乎相同 。即使推断负载也看起来一样。
当然,这是一个演示和简单的beta元素 ,就纹理分辨率和环境复杂性而言,它甚至不像Alan Wake 2。RTXNTC也不适合每种纹理,被设计用于“基于物理的渲染(PBR)材料”而不是单个基本纹理 。
而且 ,这也需要合作矢量支持才能尽快工作,并且基本上仅限于RTX 40或50系列图形卡。愤世嫉俗的PC爱好者可能会很想声称Nvidia仅开发了该系统,以证明将其桌面GPU配备的VRAM也比竞争对手少。
但是技术本身显然具有很大的潜力 ,AMD和英特尔可能正在努力开发自己的系统以实现相同的结果 。虽然三种用于减少纹理内存足迹的专有算法并不是任何人都想看到的,如果开发人员对使用它们表现出足够的兴趣,那么其中一个(或三个的合并)最终可能是Directx和Vulkan的标准方面。
对于每个人来说,这都是最好的结果 ,因此值得关注基于AI的纹理压缩,因为就像NVIDIA的其他第一到市场技术一样(例如,射线追踪加速度 ,AI升级)一样,该行业最终将它们适应为常态。我不认为这意味着我们很快就会看到20 GB版本的Baldur's Gate 3,但未来肯定看起来要小得多。
如果您想在自己的RTX图形卡上尝试NTC演示 ,则可以直接从这里抓住它 。提取ZIP,然后转到bin/windows-x64文件夹,然后单击NTC-Renderer文件。
本文来自作者[bosui]投稿,不代表蝶硕号立场,如若转载,请注明出处:https://baiyifang.cn/news/944.html
评论列表(3条)
我是蝶硕号的签约作者“bosui”
本文概览: 在CES 2025年,NVIDIA宣布了许多新事物,以至于很难弄清楚真正值得关注的东西。尽管RTX 5090及其巨大的价格都抓住了所有头条新闻,但一件新的技术坐在一边,有很...
文章不错《我一直在测试NVIDIA的新神经纹理压缩工具包,令人印象深刻的结果可能是游戏安装尺寸的好消息》内容很有帮助