DLSS 4再进化:Transformer显存瘦身20%,画质性能双突破
6月29日消息,英伟达在推出DLSS4正式版的同时,也在最新的DLSS SDK版本中对显存(VRAM)的使用进行了优化。VideoCardz发现,DLSS310.3.0版本将Transformer模型的显存占用降低了20%。这一改进有助于提升游戏性能,尤其是在显存有限的设备上,能够带来更流畅的体验。对于玩家和开发者而言,这样的优化意味着更高的效率和更广泛的支持可能性。
此次更新后,DLSS的显存使用情况更接近于传统的CNN模型。此前,DLSS所采用的Transformer模型在显存占用方面几乎是其替代的CNN模型的两倍。但经过英伟达的优化后,现在的Transformer模型仅比CNN模型多出40%的显存占用。具体来看,在1080p分辨率下,旧版Transformer模型需要106.9MB显存,而新版则降低至85.77MB,相比之下,CNN模型仅需60.83MB显存。DLSS的显存占用会随着分辨率的提升呈线性增长,例如在4K分辨率下,Transformer模型的显存占用将增加3.5倍,达到307.37MB。
据了解,显存占用的优化在实际应用中往往不容易被察觉。例如,在4K分辨率下,DLSS显存占用的减少仅为80MB,而在1440p和1080p分辨率下,减少的显存容量则更少。对于现代显卡动辄8GB甚至更高的显存容量来说,80MB或更少的减少几乎可以忽略不计。不过,在8K分辨率下,DLSSTransformer模型的显存占用仍然较高,即使经过优化后,其显存占用仍超过1GB。 从技术发展的角度来看,虽然低分辨率下的显存优化效果有限,但随着更高分辨率和更复杂AI模型的应用,显存管理的重要性将日益凸显。这不仅考验着硬件设计的能力,也对软件优化提出了更高要求。未来,如何在保持画质与性能的同时,进一步降低显存消耗,将是提升用户体验的关键方向之一。
尽管如此,Transformer模型的显存占用减少了20%,这一成果依然令人赞叹,尤其是在该模型具备强大功能的前提下。DLSS4中的Transformer模型参数量是其CNN版本的两倍,能够实现接近原生画质的超分辨率效果。此前,英伟达也曾对DLSS3.8.10进行过类似的优化,未来DLSS4的DLL文件有望进一步缩减。
值得注意的是,此次显存优化仅适用于Transformer架构的超分辨率模型,与帧生成模块无关。DLSS4在帧生成方面也实现了显著提升,显存占用降低了30%。相比而言,帧生成部分的显存消耗远高于DLSS的超分辨率模块。例如,英伟达在其一篇博客文章中提到,《战锤40K:暗潮》在4K分辨率下启用DLSS4帧生成功能时,显存占用比DLSS3减少了400MB。