RTX 4060 Ti 8G评测:DLSS 3加持,3A游戏帧数翻倍提升
去年的 RTX 3060 Ti 由于其强悍的性能,一时间成为了主流游戏玩家们的好选择。因此今年发布的基于全新 Ada 架构打造的 RTX 4060 Ti 也同样引人注目。大家关心下一代 RTX 4060 Ti 能否延续 RTX 3060 Ti 的优秀表现、能否继续延续 60 Ti 系列的高性价比。
而 NVIDIA 方面交出的答卷是 NVIDIA GeForce RTX 4060 Ti 8G 和 NVIDIA GeForce RTX 4060 Ti 16G 这两张新卡。它们的性能几乎相同,也都拥有 32MB 的 L2 大缓存,带来更高的读取命中率。两者的区别在于 16G 大显存版更适合加速 AI 内容创作,8G 版则拥有更高的性价比适合 1080P 高帧游戏。它们相比于 RTX 3060Ti GDDR6 都拥有 15%-70% 的性能提升,相比于 2060 SUPER 更是有着 60%-160% 的性能提升。能带来 1080P 分辨率下的高帧率低延迟游戏体验。
IT之家也是提前收到了公版的 NVIDIA GeForce RTX 4060 Ti 8G,在本次测试中,我们将使用一套高配 intel 配置来测试,分辨率也都调整到 1080P,以避免显卡瓶颈。具体配置如下:
外观设计
NVIDIA GeForce RTX 4060 Ti 8G 的外观设计与我们之前测试的 NVIDIA GeForce RTX 4070 非常相似,显卡本体都为标准的 2 槽设计,长度也只有 24cm 左右,整体设计方正紧凑。即便是 A4 结构的 ITX 机箱也可以轻松装下。
整个散热器和 NVIDIA GeForce RTX 4070 唯一的区别在于,旁边的金属包边从枪灰色变成了银灰色,观感更灵动一些。
正面则是厚实的散热鳍片,整张显卡全金属的设计也有利于散热。
显卡风扇采用一左一右一上一下的独特排布方式,能形成垂直风道,更好地带走鳍片上的热量。
显卡外围环绕着一层银灰色的全金属包边,上方印有醒目的 GeForce RTX 标识。
螺丝接口被设计在了右侧,整卡的一体感很强。
供电方面,它采用最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 1*8Pin 转 16Pin 的转接头,这个设计还是比较幽默的,可以看出 NVIDIA 推广 ATX3.0 标准的决心。
事实上,它的 TGP 功耗仅 160W 左右,单 8Pin 的供电完全能带动。因此绝大多数非公版 RTX 4060 Ti 都选择单 8Pin 的供电设计。
I / O 接口挡板采用 RTX 4070 同款的深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 输出。
核心解析
RTX 4060 Ti 基于 AD106 核心打造。整体架构和我们之前测试的 RTX 4070 是差不多的,不过里面的 GPC 从 4 组变成了 3 组,内部共有 4352 个 CUDA 核心、136 个 Tensor 核心、34 个第三代 RT 核心和 51 个 ROP 单元,基本上可以理解为保留了 RTX 4070 75% 的核心规模。招牌的 NVENC 视频编码单元和 NVDNC 视频解码单元也依旧存在,这意味着它也是很适合用来进行内容创作的。
RTX 4060 Ti 的 BOOST 频率是 2535MHz,默认频率为 2250MHz。显存方面是 128-bit 位宽的 8GB GDDR6 海力士显存,功耗和发热都极大的降低了。
至于为什么会选择 128-bit 的闪存,NVIDIA 官方也做出了解释,主要原因在于,全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。英伟达称,从历史上看,显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而,显存位宽本身并不能充分表明存储子系统的性能。相反,更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。
如上图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。
以上这些显存利用效率的提高,都要得益于最新的 NVIDIA Ada 架构,NVIDIA Ada 架构是 NVIDIA 的最新架构,它基于 TSMC 4N NVIDIA 定制工艺打造,从而实现了高达 2 倍的性能功耗比飞跃。它的流式多处理器吞吐量超过上一代产品的 2 倍,第三代 RT Cores 的光线追踪计算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。而 SER 技术为光线追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可高达 25% 的提升。
新的 Ada 架构为各种专业图形、视频、AI 和计算工作负载提供了惊人的性能和能效,也带来了许多创新的特性,例如:
1.新增了光流加速器,能够利用 AI 预测场景中的运动变化,实现了 DLSS 3 的帧生成技术,大幅提升了帧率和图像质量。
2.支持了 AV1 编码器,能够有效压缩视频文件的大小,同时保证更高的画质。这对于视频转码、流媒体、视频会议、增强现实和虚拟现实等应用场景非常有用。
3.引入了 RTX VSR 功能,能够实现实时视频超分辨率,让低分辨率的视频在高分辨率的屏幕上也能呈现出清晰的细节。
值得一提的是,本次 RTX 4060 Ti 8G 采用的接口也发生了变化,从 PCIe 4.0*16,变成了 PCIe 4.0*8,这对于采用新主板的玩家们是不会带来任何影响的。但如果你的主板只支持 PCIe 3.0 的话,那么实际使用中就是以 PCIe3.0*8 运行的,带宽会受到一定影响,建议搭配比较新的平台来装机。
理论性能
我们在导语就有说到,NVIDIA GeForce RTX 4060 Ti 8G 的功耗非常低。具体能有多低呢?我们接下来就进行烤机测试。烤机 15 分钟后,核心温度稳定在 66.8℃左右,显存温度约 78.2℃。整卡功耗仅仅 160W,不仅远低于 RTX 3060 Ti,甚至比 RTX 3060 还更低。如果电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了,不得不说 Ada 架构和 TSMC 4N 定制工艺的能效比真的非常高,RTX 4060 系列也将会是 ITX 玩家们的福音。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 NVIDIA GeForce RTX 4060 Ti 8G 的得分为 99.5%,性能释放极其稳定。
在 3DMark TimeSpy DX12 测试中,显卡分数达到了 13653 分,作为对比,RTX 3060Ti 的成绩为 12277 分,提升大约在 10% 左右,而功耗却低了非常多。
在 3DMark FireStrike Extreme DX11 测试中,NVIDIAGeForce RTX 4060 Ti 8G 显卡分数达到了 16194 分,作为对比,RTX 3060 Ti 的分数为 14553,提升幅度也是在 10% 左右。
而在 3DMark Portal Royal 光追测试中,NVIDIAGeForce RTX 4060 Ti 8G 获得了 8056 分,作为对比,RTX 3060 Ti 的分数为 7158 分,看来 RTX 4060 Ti 8G 的理论性能相比于 RTX 3060 Ti 就是在 10% 左右了。
游戏实测
接下来,我们就进行一下游戏实测,分辨率调整为 1920*1080,画质统一调整为最高,有光追则打开最高档的光追,有 DLSS 就开启到质量档。首先是竞技游戏《CS:GO》,这款游戏可以展现 RTX 4060 Ti 8G 在高帧下的表现。运行自带的 BenchMark 后,平均帧达到了 537 帧,可以满足高帧畅玩的需求,完全能跑满各种电竞屏了。
值得一提的是,目前已有 70 款游戏已支持 NVIDIA Reflex 低延迟技术,其中有 8 款主流竞技射击游戏支持 NVIDIA Reflex,包括:《Apex 英雄》,《使命召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《堡垒之夜》,《守望先锋》”归来”,《彩虹六号:围攻》和《无畏契约》。笔者期待 CS2 能够在更新起源 2 版本后,也能加入 NVIDIA Reflex 的支持,让所有热门的 FPS 游戏都能享受低延迟的优势。
接下来笔者还测试了两款经典 3A 大作。《荒野大镖客 2: 救赎》在开启质量 DLSS 的情况下,能达到平均 115 帧,已经能满足百帧畅玩高画质了,这个 1080P 下的体验无疑是非常出色的。
在另一款经典的 3A 大作《古墓丽影: 暗影》中,我们也得到了类似的答案。在 1080P 最高画质下运行自带的 BenchMark,已经能达到平均 212 帧,如此高的帧数意味着征服 2K 分辨率也不在话下了。
在光追大作《控制》中,开启最高光追的情况下甚至能达到 144 帧,以电竞帧数畅玩光追 3A 大作再也不是梦了。
真正让 RTX 4060 Ti 和 RTX 3060Ti 拉开差距的,是其 DLSS 3 技术,它能够利用 AI 和 GeForce RTX 40 系列 GPU 上的第四代 Tensor Core 和光流加速器,生成更多的高质量帧,从而大幅提升帧数。DLSS 3 是 NVIDIA 深度学习超采样技术的最新版本,也是神经图形技术的革命性突破,能够在保持画质和反应速度的同时,将性能提升高达 4 倍。
简单来说,过去的 DLSS 2 技术是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。而全新的 DLSS 3 技术在兼容 DLSS 2 的基础上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。同时,结合 DLSS 2 的超分辨率功能,AI 能够重建多达八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
目前已经有超过 300 款 DLSS 游戏和应用发布。其中已有超 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信将来有越来越多的游戏适配 DLSS 技术。
我们先来看看压力最大的《赛博朋克 2077》在光追 + 1080P 分辨率下的帧数情况,在默认状态下,RTX 4060 Ti 8G 还是没有办法畅玩的,平均帧数约 45 帧。如果开启 DLSS 2 质量,帧数就可以达到平均 79 帧畅玩了。而如果开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了平均 119 帧,百帧畅玩光追不在话下。
传奇 3A 大作《巫师 3:狂猎》最近也更新了次世代版,配置要求大大提高,当然画质也跟上了潮流,放在如今也毫不落伍。同时它也提供了 DLSS 3 技术的支持,这对于 RTX 40 系列显卡无疑是一个好消息。
《巫师 3:狂猎》次世代版在 1080P 分辨率不开启 DLSS 的情况下,GeForce RTX 4060 Ti 8G 平均仅有 43 帧,如果开启质量档 DLSS 2,就可以达到平均 65 帧流畅游玩。如果开启 AI 加持的 DLSS 3 技术,帧数就能暴涨到平均 102 帧,大部分场景可以实现 1080P 最高特效百帧畅玩了。
在另一款画质爆炸的次世代 3A 大作《瘟疫传说:安魂曲》中,优化相对来说就要好不少了。即便不开启任何 AI 技术,也可以满足 1080P 60 帧流畅游玩,而在 DLSS 3 加持后更是可以以电竞帧数畅玩。
上一篇:设计师如何提高效率和创造力?