NVIDIA GeForce RTX 4070 评测:DLSS 3 加持的狞恶性能小钢炮
寡所周知,NVIDIA GeForce RTX 40 系列 GPU 因为晋级了架构和造程,所以能效比有了不小的提拔。但因为之前发布的高端卡,普及性能也提拔了很多,所以功耗相对来说也是不低的。而实正让笔者曲看的感触感染到 Ada 架构带来的能效比飞跃的,恰是我们今天的配角 GeForce RTX 4070,不只体积更小,性能也有了突飞猛进的进步。2K 辨认率下可称心 100 帧以上畅玩光逃游戏。
IT之家也是提早收到了公版的 NVIDIA GeForce RTX 40 系列 GPU,在本次测试中,我们将利用一套高配 intel 设置装备摆设来测试,尽量制止显卡瓶颈。详细设置装备摆设如下:
外看设想
NVIDIA GeForce RTX 4070 的包拆沿用了之前高端显卡的设想,给人一种“速度穿越”的觉得,但浩荡的包拆内,显卡却变得相当玲珑。
显卡本体为原则的 2 槽设想,长度也只要 24cm 摆布,整体设想朴直紧凑。即使是 A4 构造的 ITX 机箱也能够轻松拆下。
显卡的背板设想照旧延续了公版显卡的 X 型设想,金属风满满,低调不失炫酷。
展开全文
正面则是厚实的散热鳍片,整张显卡全金属的设想也有利于散热。
显卡电扇摘用一左一右一上一下的特殊排布体例,能构成垂曲风道,更好地带走鳍片上的热量。
显卡外围围绕着一层银灰色的全金属包边,上方印有夺目的 GeForce RTX 标识。
螺丝接口被设想在了右侧,整卡的一体感很强。
供电方面,它摘用最新的 ATX3.0 标准的 16Pin 供电接口,随包拆内附赠了 2*8Pin 转 16Pin 的转接头,事实上,它的 TGP 功耗仅 200W 摆布,理论上单 8Pin 的供电也能带动。我们在拆机时,更好利用撑持 ATX 3.0 标准的电源,如许能够让机箱内更美看。假设必然要用转接线的话,用一根一分二 8Pin 的线就能够了。
I / O 接口挡板摘用深灰配色,接口方面装备了 3*DP1.4a 接口和 1*HDMI2.1 接口,更高撑持 8K60Hz 输出。
接口方面,NVIDIA GeForce RTX 4070 照旧是 PCIe 4.0 的接口,搭配支流主板均可释放全数性能。
核心解析
RTX 4070 与 RTX 4070Ti 类似,都是基于 AD104 核心打造的,但细节有所差别。详细的核心代号为 AD104-250。里面完全的 GPC 从 5 组酿成了 4 组,内部共有 5888 个 CUDA 核心、184 个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单位,根本上能够理解为保留了 RTX 4070 Ti 80% 的核心规模。不外招牌的 NVENC 单位从两个酿成了一个。那意味着它的视频编码才能是不如 RTX 4070 Ti 及以上的显卡的,但比拟于上一代 RTX 3070 和 RTX 3070 Ti 则要强十分多。
RTX 4070 的 BOOST 频次是 2475MHz,默认频次为 1920MHz。显存方面与 RTX 4070 Ti 连结一致。都是 192-bit 位宽的 12GB GDDR6X,带宽也都是 21Gbps。从上述定位中我们能够看出,RTX 4070 与 RTX 4070 Ti 一样,都是一张定位 2K 高帧率游戏的中高端显卡。
当然,GeForce RTX 4070 照旧摘用了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定造工艺打造,从而实现了高达 2 倍的性能功耗比飞跃。它的流式多处置器吞吐量超越上一代产物的 2 倍,第三代 RT Cores 的光线逃踪计算才能更是提拔了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处置性能,超越上一代的 5 倍。而 SER 手艺为光线逃踪带来了更高可达 3 倍的性能提拔,整体游戏性能也可高达 25% 的提拔。
新的 Ada 架构在详细功用上带来了许多新的特征:引进了光流加速器使得 DLSS 3 可以揣测场景中帧与帧之间的运动改变,从而通过 AI 实现了帧生成手艺,进步了帧率的同时连结图像量量。此外,新架构还撑持 AV1 编码器的利用,从而降低了视频的体积,并获得更好的画量。同时,RTX VSR 功用的利用也使得实时视频超辨认率成为可能。
理论性能
我们在题目就有说到,RTX 4070 的功耗十分低。详细能有多低呢?我们单烤甜甜圈测试一下就晓得了。烤机 15 分钟后,核心温度不变在 66.4℃摆布,显存温度约 80℃。整卡功耗仅仅 198W,以至比 RTX 3070 还更低。假设电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了。最关键的是,它仅需单根 8Pin 一分二输出线就能够一般利用(一些非公显卡以至有单 8Pin 版本),那意味着有晋级设法的玩家们,完全不需要换电源。因为显卡体积特殊小,机箱也不消换了。
接下来停止 3DMark 压力测试,那个测试能够检测持续跑分下显卡性能有没有发作下降,一般 97% 以上才算合格的显卡。实测 NVIDIA GeForce RTX 4070 的得分为 99.6%,性能释放极其不变。
在 3DMark TimeSpy DX12 测试中,显卡分数到达了 18140 分,那个功效已经超越了 RTX 3080 10G,与 RTX 3080 12G 是根本相当的,能够说 RTX 4070 的 DX12 性能约等于 RTX 30 系列的高端显卡了,而功耗却仅仅只要一半。
在 3DMark FireStrike Extreme DX11 测试中,NVIDIA GeForce RTX 4070 显卡分数到达了 21497 分,同样与 RTX 3080 12G 附近,而功耗却小了 50%。
而在 3DMark Portal Royal 光逃测试中,NVIDIA GeForce RTX 4070 获得了 11116 分,阐明其光逃才能约等于 RTX 3080 10G,也是能畅玩光逃 2K 游戏的程度。
游戏实测
接下来,我们就停止一下流戏实测。值得一提的是,目前十大支流竞技射击游戏中跟着《反恐精英 2》的加进,现已有九款撑持 NVIDIA Reflex,那些游戏包罗:《Apex 英雄》,《任务召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《碉堡之夜》,《守看前锋》”回来”,《彩虹六号:围攻》和《无畏契约》,NVIDIA Reflex 能缩减操做延迟,进步响应速度,让跟枪更灵敏。笔者期看即将更新起源 2 版本的 CS2,也能撑持 NVIDIA Reflex 手艺。
接下来笔者测试了两款典范 3A 高文。《荒野大镖客 2: 救赎》在不开启 DLSS 的情状下,GeForce RTX 4070 能到达均匀 103.6 帧,已经能称心 2K 100 帧以上高帧畅玩了,那个别验无疑长短常超卓的。
假设我们开启量量档的 DLSS,帧数会进一步提拔到均匀 119 帧,而且此时画量几乎没出缺失,体验很超卓。
在另一款典范的 3A 高文《古墓丽影: 阴影》中,我们也得到了类似的谜底。在 2K 更高画量下运行自带的 BenchMark,已经能到达均匀 174 帧,称心 2K165Hz 屏幕的畅玩。
在开启 DLSS 后,帧数表示更佳,能到达均匀 206 帧,帧数提拔了 30 多帧。总的来说,RTX 4070 在传统 3A 高文中的表示是很接近 RTX 3080 的。更别说前代同级的 RTX 3070 Ti、RTX 3070 了。
以上那些只是开胃小菜,而 RTX 4070 的最吸惹人之处在于其 DLSS 3 手艺,可进一步提拔帧率。DLSS 3 是一款由 AI 驱动的性能倍增手艺,摘用了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度进修超等摘样手艺的最新版本,同时具备创始性的光学多帧生胜利能,将为 NVIDIA RTX 神经收集衬着游戏和利用开启新的时代。
简单来说,过往的 DLSS 2 手艺是通过衬着一个低辨认率图像,然后通过 AI 放大至高辨认率,从而提拔画量和帧率。而全新的 DLSS 3 手艺在兼容 DLSS 2 的根底上,新增了帧生胜利能,能够在两个实在帧之间插进 AI 推算出的全新帧,从而实现帧率的倍增。同时,连系 DLSS 2 的超辨认率功用,AI 可以重建多达八分之七的展现像素,与没有 DLSS 比拟,游戏性能更高可提拔 4 倍!
目前已经有超越 280 款 DLSS 游戏和利用发布。此中共有 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自觉布的前六个月中,DLSS 3 的摘用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信未来有越来越多的游戏适配 DLSS 手艺。
我们先来看看压力更大的《赛博朋克 2077》在光逃 + 2K 辨认率下的帧数情状,在默认形态下,RTX 4070 仍是没有办法畅玩的,均匀帧数约 38 帧。假设开启 DLSS 2 量量,帧数就能够到达均匀 69 帧畅玩了。而假设开启 RTX 40 系列专享的黑科技 DLSS 3,霎时暴涨到了均匀 103 帧,同时能称心看感和顺畅。
传奇 3A 高文《巫师 3:狂猎》比来也更新了次世代版,设置装备摆设要求大大进步,当然画量也跟上了潮水,放在现在也毫不落伍。同时它也供给了 DLSS 3 手艺的撑持,那关于 RTX 40 系列显卡无疑是一个好动静。
《巫师 3:狂猎》次世代版在 2K 辨认率不开启 DLSS 的情状下,GeForce RTX 4070 均匀仅有 38 帧,假设开启量量档 DLSS 2,就能够到达均匀 64 帧。假设开启 AI 加持的 DLSS 3 手艺,帧数就能暴涨到均匀 95 帧,大部门场景能够实现 2K 百帧畅玩了。
在另一款画量爆炸的次世代 3A 高文《瘟疫传说:安魂曲》中,优化相对来说就要好很多了。即使不开启任何 AI 手艺,也能够称心 2K 60 帧顺畅玩耍,而在 DLSS 3 加持后更是能够以电竞帧数畅玩。
实测 RTX 4070 在 2K 辨认率就已经能称心 71.2 帧畅玩了。假设开启 DLSS 2 量量档,就能到达均匀 104.5 帧,假设开启 DLSS 3 插帧后,帧数更是会暴涨到均匀 147.2 帧,称心 2K144 高刷展现器的需求。
那么,代与代之间的 GPU 会有多大的提拔呢?笔者那套设置装备摆设换上 RTX 3070 Ti 测试了一套数据,看看隔代之间性能会有几提拔,在 DLSS 3 手艺的加持下又会有几提拔。实测不开启 DLSS 3 的情状下,RTX 4070 大约有 10% 的帧数优势。假设开启 RTX 4070 系列独占的 DLSS 3 手艺,帧数则领先了约 70%,那就是 AI 手艺的魅力呀。
前面我们有提到过,RTX 4070 的功耗是相当低的,现实上一根 8Pin 供电就能带动。因而我们还利用英伟达官方的 FrameView 东西统计了一下各个 3A 高文中的均匀功耗。能够看出,大部门 3A 高文中 RTX 4070 的现实功耗都在 160-190W 摆布,如斯低的功耗,意味着电源的抉择上就很宽裕了,预算又能够省下一大笔,或许会成为万元机器的新抉择。而 ITX 喜好者们或答应以等待一下单电扇的 RTX 4070 小卡了。
创意消费
显存规模上,NVIDIA GeForce RTX 4070 与 RTX 4070Ti 的规格完全一致,都拥有 12G 的大显存,速度也到达了 21Gbps。因而也被付与了必然的创意消费才能。因而该显卡还撑持安拆 NVIDIA Studio 驱动,以加速 110 多款更受欢迎的创意利用。专有的 SDK 能使那些利用的运行速度更快,并供给独家功用,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套创意利用,包罗 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同时大显存的加持也让它具备了必然的生成式人工智能的运算才能,拿来停止简单的 AI 绘画操练也是没有问题的。
在建模和衬着类软件中,NVIDIA GeForce RTX 4070 的 5888 个 CUDA 核心能够供给硬件加速,使得工做效率得以进步。几乎所有的建模软件城市对 NVIDIA 的 GPU 停止优化,因而在效率、不变性和兼容性方面都可以兼顾。例如,在常用的衬着东西 V-Ray 中,能够操纵 RTX 加速的光线逃踪功用,实现高性能的最末帧衬着。此外,搭载了 AI 降噪功用的 GPU 还能够进一步加速交互式衬着,供给愈加顺畅的工做体验。
我们也实测了一下 V-Ray Benchmark 的性能表示,GeForce RTX 4070 获得了 1847 分,能够应对大部门中等规模的建模衬着需求。
得益于光逃性能的提拔,GeForce RTX 4070 在 V-Ray GPU RTX 中的分数也进步到了 2631 分,也能应付一些中等负载的光逃建模衬着需求。
在视频后期那一块,GeForce RTX 4070 同样装备了 NVENC 编码器。而且 RTX 4070 也撑持下一代视频编码手艺 AV1,AV1 可以在占用不异空间情状下,供给愈加快速的视频编码和更高量量的流媒体传输性能。跟着各大视频平台期看节约办事器流量费用,AV1 编码势必成为将来的支流编码体例。
NVIDIA 与多家行业协做伙伴密切协做,确保其 GPU 可以足够撑持当今支流的多媒体利用。目前,国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速撑持。而常用的视频调色剪辑软件 DaVinci 也供给了 AV1 编码的撑持。那意味着 NVIDIA GPU 未来必然能够在处置视频编纂和衬着使命时足够发扬其 AV1 加速功用,供给更高效的性能和更顺畅的工做体验。
IT之家还为各人测试了 PugetBench For Adobe 全家桶,看看它能否胜任视频剪辑工做。实测 GeForce RTX 4070 在创意工做者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后利用 PugetBenchmark 停止测试。最末得分为 1475 分,阅读时间线上的 4K 视频毫无压力。
别的一款压力更大的视频特效软件 Adobe Effects 中,我们同样利用 PugetBenchmark 停止测试。最末得分为 1640 分,能用来造造一些比力复杂的视效。
除了内容消费以外,在内容消费范畴 RTX 4070 也有新功用。那就是 RTX VSR 手艺。全称为 RTX Video Super Resolution(RTX 视频超辨认率手艺)。它能够通过 GPU 的 AI 计算,至多将在线 1080P 视频提拔到 4K 辨认率,实现进步清晰度的效果,目前那一手艺已经适配了 Chrome 阅读器和 Edge 阅读器,后续也会适配以 VLC 为首的当地播放器。
RTX 视频超辨认率的利用十分简单,只要将 RTX 30 系列 / 40 系列的驱动法式更新到 531.14 以上版本,并将 Chrome / Edge 阅读器也更新到最新版本即可以启用。启用途径为:NVIDIA 掌握面板 —— 视频 —— 调整视频图像设置。此选项框下有四个档位可选。档位越精湛辨认率效果更明显,但也会消耗更多的 GPU 资本。目前它已撑持国内的支流视频平台(哔哩哔哩、爱奇艺、斗鱼和虎牙等平台),以及一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)。
鄙人面的测试中,我们播放一条IT之家在哔哩哔哩发布的视频,辨认率调整为 480P,从最右边的原生 480P 辨认率超分后,后面的 1-4 档能看出愈加清晰了,现实看感媲美 4K。
↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4
除了 Edge 和 Chrome 阅读器以外,出名的 VLC 当地播放器也在 Beta 版中供给了 RTX VSR 手艺的适配。和网页一样,只要在驱动掌握面版中翻开就能够了。我们用一个 480P 的当地视频做演示,明显觉得右边更清晰了,后面各人赏识当地片子时,也能够用那个手艺进一步优化画量。
在比来大火的 AI 绘画(生成式 AI)中,RTX 4070 也有一战之地。例如我们运用 stable-diffusion 的 v2-1_768-ema-pruned.ckpt 模子,测验考试绘造 20 张 AI 老黄的图像,RTX 4070 共计用时 2 分 18 秒。
而 RTX 3070 Ti 那边,则用时 2 分 57 秒,比拟于 RTX 4070 的出图速度差距是相当明显的。假设日常平凡只是想简单玩玩 AI 的话,RTX 4070 就足以胜任了。当然假设要复杂的研究的话,那仍是上 RTX 4090 或更高的 GPU 吧。
总结
笔者关于小而强大的工具不断没有对抗力,而 NVIDIA GeForce RTX 4070 恰是如许一张如斯小,又如斯强大的小钢炮。它的体积和功耗都比 RTX 3080 低 50% 摆布,但性能却十分接近。同时 DLSS 3、RTX VSR 等一系列 AI 手艺的加持,能称心 2K 100+ 帧的畅玩,是一张很合适 RTX 3070、RTX 2070Super 那个档位的玩家晋级的一张卡。
假设你诡计拆一台紧凑型主机的话,那么公版的 NVIDIA GeForce RTX 4070 几乎是如今更好的抉择,首发的其它非公版 RTX 4070 都没有体积那么小的。那张显卡将于 4 月 12 日晚出售,定见零售价 4799 元,感兴致的话能够存眷一下。