黑衣武士,暗躲矛头——技嘉GeForce RTX 4070魔鹰OC 12G详尽评测
RTX 4070 Ti先于RTX 4070退场,近日NVIDIA推出的RTX 4070除了兼具Ada架构的新特征、黑科技以及第三代RT Cores、第四代Tensor Cores之外,天然在规格方面也有着一脉相承的RTX 4070 Ti的影子。此次,针对NVIDIA GeForce RTX 4070 GPU,技嘉一共推出了AORUS GeForce RTX 4070 MASTER、GeForce RTX 4070 AERO OC 12G、GeForce RTX 4070 EAGLE OC 12G、GeForce RTX 4070 GAMING OC 12G、GeForce RTX 4070 WINDFORCE OC 12G那五款产物。它们的配色与设想纷歧、各有偏重,因而玩家在挑选技嘉旗下的RTX 4070时,也会有更多样的抉择,在拆机或是打造桌面Mod时天然会更随手。而在我们此次非公版RTX 4070评测中,技嘉方面出场的“选手”即是GeForce RTX 4070 GAMING OC 12G,关于该系列我们也曾停止过屡次评测,其超卓的性能以及拔尖的散热才能给我们留下了深入的印象。闲言少叙,那么搭载着AD104核心、拥有12GB GDDR6X内存,且颠末了预超频处置的技嘉GeForce RTX 4070 GAMING OC 12G(中文名为技嘉GeForce RTX 4070魔鹰OC 12G,后文简称为技嘉RTX 4070魔鹰OC)又会为我们带来如何的故事呢?
技嘉GeForce RTX 4070 GAMING OC 12G产物参数
展开全文
核心架构:Ada Lovelace
核心代号:AD104
造程工艺:TSMC 4N定造
SM单位:46
CUDA核心数(流处置器):5888
光逃核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频次:1920MHz~2565MHz
显存容量:12GB GDDR6X
显存速度:21Gbps
显存位宽:192bit
显存带宽:504GB/s
撑持DLSS版本:DLSS 3
TGP:200W
定见搭配电源额定功率:700W
产物尺寸:300mm×130mm×57.6mm
首发参考价格:5199元
陈词滥调:Ada架构的那些事儿
有关于Ada Lovelace的新特征与新功用,我们在每一次的NVIDIA GeForce RTX 40系列产物解析前,城市频频赘述。当然,除了有凑字数的嫌疑,确实也有搀扶帮助各人加深记忆,抑或是便利新读者们领会它的改变以及该架构为新系列显卡带来前卫提拔的目标。当然,假设读者伴侣们对Ada Lovelace架构以及它的新特征、新功用已经了然于胸,可自行跳过那部门的文字解析,间接来到技嘉RTX 4070魔鹰OC的体验、测试环节。
缓存暴增
Ada架构的变革在缓存部门有了较大改动。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,比拟GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,比拟之前GA102所拥有的6144KB大约是后者的16倍。如斯浩荡的缓存,将为所有GPU相关操做都带来浩荡的收益,出格是光线逃踪、途径逃踪等复杂的操做收益最为明显。
更强的SM
AAD102的每个SM单位包罗128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单位、256KB存放器、128KB的L1/共享内存,和之前的产物一样,L1/共享内存也能够根据利用情状停止设置装备摆设。流式多处置器具有高达 83 TFLOPS 的着色才能,吞吐量超越上一代产物 2 倍。
第三代光逃核心
第三代 RT Cores 的有效光线逃踪计算才能到达 191 TFLOPS,是上一代产物 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处置性能,超越上一代的5倍。
Shader Execution Reordering着色器施行重排序
着色器施行重排序SER能够从头调度着色器的工做排序,从而制止部门着色器在期待中浪费算力和电能,以获得更好的效率和性能。着色器施行重排序 SER 为光线逃踪带来更高可达 3 倍的性能提拔,整体游戏性能提拔可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3更高可带来相关于DLSS 2达2 倍的性能提拔,使 DLSS 3 可以揣测场景中帧和帧之间的运动改变,使神经收集可以在连结图像量量的同时进步帧率。DLSS 3 手艺撑持 GeForce RTX 40 系列 GPU,它包罗 3 个功用:帧生成手艺、超辨认率(DLSS 2 的关键立异)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认撑持 DLSS 2。
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的设置装备摆设,可以将视频导出时间至多缩短一半,并撑持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在摘用 NVENC AV1 编码器。不外对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创做的优良GPU,在加速3D设想创做、视频剪辑处置和AI计算方面,都有十分不错的表示。
同时吗,公用的NVIDIA Studio Driver在顶级创意利用上颠末全面测试,可以更大限度地进步可靠性,好比:
●主播能够用撑持AV1的全新第八代编码器来进步现场曲播量量,操纵 NVIDIA Broadcast AI 特效改进麦克风和收集摄像头,并进进AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI东西性能,视频编纂的输出速度更高可提拔 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设想创做者能够在4K@60fps 下停止创做。
●Modder能够重造典范游戏,并通过RTX Remix开启RTX。
熟悉的魔鹰,科幻既视感
▲技嘉RTX 4070魔鹰OC外壳外表设想了多样的线条、清楚的棱角,类似于规则电路纹理的粉饰
▲RTX 4070魔鹰OC的顶部处的背光Logo除了能够装点外看、提拔颜值,还能彰显其身份
谈到正主,技嘉RTX 4070魔鹰OC就和它的兄弟们一样,在整体设想上仍然延续了该系列惯有的设想特征,外看方面次要以科幻风气为主,并在配色方面以灰、黑等电竞产物常用搭配,让其耐看的同时也多了几分设想。细节方面,RTX 4070魔鹰OC的正面并不是是中规中矩的,它在外壳外表设想了多样的线条、清楚的棱角,类似于规则电路纹理的粉饰更是凸起了它的硬核风气,让人可以一眼就能感触感染到它来自于技嘉的设想。与此同时,RTX 4070魔鹰OC还在正面电扇处以及顶部右侧设想幻彩背光区域——正面三环灯效RGB幻彩光轮得以闪现出光芒耀眼的视觉享受,顶部处的背光Logo除了能够装点外看、提拔颜值,还能彰显其身份。别的,玩家能够通过技嘉智能管家(GCC)来对其背光停止自定义或是抉择与其他硬件设备达成同步。
▲技嘉RTX 4070魔鹰OC摘用撑持PCIe 5.0标准的ATX 3.0原则16Pin供电接口,且接口旁设想一个Bios切换开关。
▲接口方面,RTX 4070魔鹰OC装备了3DP 1.4a+1DMI 2.1的组合
▲背部与正面连结了一致的风气,且尾部设想了浩荡的镂空区域,辅助散热。
做为面向中高端玩家的显卡产物,硬实的金属背板也是当下不成或缺的部件,而技嘉RTX 4070魔鹰OC的背部拥有一块外表颠末阳极氧化处置的金属背板,它的细节设想就和正面拆甲一样,同样设想了大面积的线路粉饰。除了可以为产物提拔颜值之外,还起到了不变PCB,可以在运输和安拆过程中庇护显卡的组件,在利用中也能有效避免PCB弯曲,庇护内部组件和电路。同时,背板尾部的缕空设想还有助于提拔显卡的散热效率。
典范风之力,包管不变性
▲90mm导流电扇外表设想了3D条纹曲线用以提拔进风量
▲RTX 4070魔鹰OC的散热器内部装备了曲触式铜底并搭配8根复合式热管。
每次的大型非公版显卡评测中,假设要论及谁的性能最强、外看设想更讨巧,各人都能一教高低,争奇斗艳。但论及散热方面,技嘉老是能排名前列,为何如斯?天然也与技嘉旗下显卡摘用的风之力三电扇散热系统息息相关——它为显卡带来了十分显著的散热效率,即使是在经OC处置的显卡产物中,也能轻松压制其火力。而技嘉RTX 4070魔鹰OC仍然摘用了该散热系统,只是在部门细节方面有所差别——它的正面摘用三个撑持3D智能启停手艺、正逆转设想的90mm导流电扇。同时,电扇处设想了3D条纹曲线用以更好地引导气流,增加散热效率。电扇的轴承处则添加了纳米石墨烯光滑油,从而让其更为平静、耐用。而在技嘉RTX 4070魔鹰OC的散热器内部,大面积的铜板可以紧贴GPU和显存部门,再搭配8根复合式热管、大面积散热鳍片以及进气格栅等设想,可以为显卡内部带来足够高效的散热才能。
▲PCB板上摘用8+3相供电
不只如斯,技嘉RTX 4070魔鹰OC的PCB通过全主动化造造过程,可以有效制止因人工焊接招致的焊点影响,避免玩家在自行组拆时手指被划伤和握持不妥形成的不测损坏。别的,其内部摘用数字供电设想,可以有效降低MOSFET的工做温度,并且每个MOSFET都有供给过温庇护设想和负载平衡,再加上长命命固态电容、合金电感、2oz铜PCB与低电阻式晶体管等超耐久用料,显卡在包管高性能的同时,也能庇护更长的利用寿命。
▲技嘉RTX 4070魔鹰OC搭载了拥有5888个CUDA核心的AD104-250-A1核心。
▲该显卡装备了6颗容量为2GB的美光GDDR6X显存
性能实测,轻松超越RTX 3070 Ti,DLSS 3如虎添翼
核心方面,搭载了基于Ada Lovelace架构的AD104核心,其拥有46个光逃核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。其默认频次为1920MHz,bosst频次为2565MHz,较公版RTX 4070多出90MHz,纸面实力更强。同时,AD104核心四四周绕着6颗容量为2GB的美光GDDR6X显存,且其参数与RTX 4070 Ti连结一致,显存位宽为192bit,总带宽为504GB/s。就内部散热与用料来看,超规格的技嘉RTX 4070魔鹰OC应该在后续测试中拥有更出彩的发扬。根据NVIDIA的想象,RTX 4070是一颗能称心100fps+的全特效光逃游戏利用的GPU,技嘉RTX 4070魔鹰OC能否胜任呢?
▲技嘉RTX 4070魔鹰OC颠末了出厂预超频处置,其Boost频次到达了2565MHz,超出跨越官方批示Boost频次2475MHz一小截。
测试平台
GPU:技嘉RTX 4070魔鹰OC、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部门测试)
CPU:英特尔酷睿i9-13900K
主板:AORUS Z790 MASTER
内存:AORUS DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
展现器:戴尔UP3218K(7680×4320@60Hz)
操做系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 531.42
GPU基准性能测试
从3DMark成果来看,技嘉RTX 4070魔鹰OC的现实功效颇为亮眼——比拟RTX 3070时,它均匀有32%以上的性能提拔,因为Ada Lovelace架构晋级到了第三代RT Cores,在测试光逃性能的Port Royal上,技嘉RTX 4070魔鹰OC比拟RTX 3070的性能增幅到达了40%摆布。而比照RTX 3070 Ti,在3DMark测试中,技嘉RTX 4070魔鹰OC仍然包管了成功姿势,整体性能比拟RTX 3070 Ti领先24%摆布。不外相关于RTX 4070 Ti,技嘉RTX 4070魔鹰OC综合功效均匀落后约22%,那也是二者的综合硬件规格差距招致的。
传统光逃游戏性能测试
在传统光逃游戏性能测试环节,技嘉RTX 4070魔鹰OC的表示可圈可点,出格是在对显卡性能要求较高的1440p辨认率下,相关于RTX 3070,拥有36%以上的均匀游戏性能增幅。哪怕是面临性能更强悍的RTX 3070 Ti,技嘉RTX 4070魔鹰OC与之比拟也仍然有25%摆布的综合游戏帧率涨幅,出格是在部门对显卡性能要求更高的游戏高文中,技嘉RTX 4070魔鹰OC的领先水平更为显眼。当然,在参考测试的部门游戏中,RTX 4070比拟RTX 4070 Ti受限于硬件规格仍然仍是有不小差距。
当我们调低画面辨认率至1080p之后,技嘉RTX 4070魔鹰OC在应对RTX 3070、RTX 3070 Ti的挑战时,同样没有呈现任何压力——在我们本次测试的所有游戏中,均呈现了一边倒的情状,技嘉RTX 4070魔鹰OC别离综合领先二者34%、23%以上。当然那仍是仅有DLSS 2的情状下,为此我们也非常等待技嘉RTX 4070魔鹰OC开启DLSS 3之后的游戏性能表示。
DLSS 2/3比照性能测试
我们前面提到过,Ada Lovelace架构可以搀扶帮助玩家更好地体验游戏,不只是因为它拥有更超卓的光逃性能,同时它还撑持DLSS 3那个能让帧率量变的“黑科技”——而DLSS 3则包罗光学帧生成手艺、超等辨认率和 NVIDIA Reflex。特殊是光学帧生成手艺,可以让游戏帧率在DLSS 2的根底之上得到更高的提拔,从而让本来卡顿的画面顺畅无比。在DLSS 2/3比照性能测试方面,技嘉RTX 4070魔鹰OC的表示同样让人感应非常兴奋——比拟起原生帧率,均匀提拔幅度超越130%,将画面辨认率提拔至1440p之后,DLSS 3的现实帧率表示比拟原生帧率的均匀提拔有所进步,超越了150%。
而当我们将RTX 3070 Ti纳进比照对象之后,能够发如今DLSS 3的搀扶帮助下,技嘉RTX 4070魔鹰OC与前者之间的帧率差距拉得更大,后者在1080p、1440p辨认率综合帧率涨幅放别离到达了71%、73%以上。当然,除了帧率方面的提拔之外,NVIDIA Reflex的加进也是DLSS 3之中值得存眷的一点,那么在开启DLSS 3之后,技嘉RTX 4070魔鹰OC的系统延迟与1%L fps又会有如何的改变呢?
PCL、1%L fps测试
通过Frameview挠取现实测试数据,我们可以清晰地看到,技嘉RTX 4070魔鹰OC在开启DLSS 3之后,可以大幅度提拔帧率、提拔1%L fps的同时,进一步有效降低系统延迟,可谓一举三得。就《霍格沃茨之遗》而言,在开启DLSS 3的情状下,1440p辨认率下系统延迟从107ms降低至38ms,1%L fps从55提拔至144;将画面辨认率降低到1080p之后,在开启DLSS 3的情状下,系统延迟从76ms降低至35ms,1%L fps从46提拔至99。从以上数据不难看出,在DLSS 3的搀扶帮助下,玩家能够垂手可得得获得帧率与延迟方面的双重“BUFF”,从而让操做体验更温馨。
Studio创做性能测试
Ada Lovelace架构对Studio创做利用方面的优化使得NVIDIA GeForce RTX 40系显卡拥有更为超卓的消费力,特殊是关于那些经常破费时间停止画面衬着的用户而言,有了NVIDIA GeForce RTX 40系显卡,天然也是事半功倍,可节约很多时间。我们在那个环节摘用了Davinci resolve 18、Blender Opendata、Blender 3.5、V-Ray benchmark等多款软件对技嘉RTX 4070魔鹰OC停止了深进测试,而该显卡在Studio创做利用的表示也确实没有让我们失看,在Blender Opendata的Monster、Junkshop、classroom三项测试中,技嘉RTX 4070魔鹰OC别离得到了3105、1542、1550分,而RTX 3070别离得到了1787、1107、963分,RTX 3070 Ti别离得到了1953、1202、1003分。在V-ray benchmark的GPU RTX形式与GPU CUDA形式的测试中,技嘉RTX 4070魔鹰OC别离得到了2611、1876分,而RTX 3070别离得到了1778、1419分,RTX 3070 Ti别离得到了1949、1497分。不只如斯,在应对视频转码、图像处置方面,技嘉RTX 4070魔鹰OC的综合表示同样稳压RTX 3070 Ti、RTX 3070,整体性能表示领先前一代对位产物30%以上,博得了实至名回的全面成功。
Stable Diffusion AI图片生成计算
AI图像生成计算并不是是降生于今日,但跟着硬件水准的进步以及相关算法的优化、完美,它在比来期得到了大范畴地存眷,无论是资深玩家、绘图巨匠,仍是“野生”UP主、都在此中玩得不亦乐乎。而AI绘画的原理天然也不是单纯地对多个图片的数据停止拼接,它的过程次要是通过对操练数据的进修,让AI可以理解和提取图像的根本特征、构造和款式,从而再构成新的图片, Stable-Diffusion的原理也是如斯。而在利用过程中,它会根据给定的描述或关键词,测验考试在新的图像中合成和组合那些特征,便利检索、模仿、生成相关的图像或图案。我们在现实利用 Stable-Diffusion停止测试时,也需要输进特定的关键词,然后期待衬着成果。从我们现实测试数据来看,显卡的效率完全盖过了处置器,哪怕是本次测试中性能最差的RTX 2070S,其衬着速度以及出片数量均碾压了目前的高端处置器。而在本次测试的诸多显卡之中,尤以拥有第四代Tensor Core且SM架构更新进化之后的RTX 4070最为超卓,AI图片生成才能领先RTX 3070 Ti约25%摆布,领先RTX 3070则到达了35%。
RTX VSR,清晰播放视频娱乐
除了应对游戏、创做之外,NVIDIA还在近期的驱动中为用户们带来了一个小欣喜——RTX Video Super Resolution功用(简称RTX VSR),它可以削减视频纹理缺失、锐化边沿和丰富细节,从而提拔画面清晰度。通过NIVIDA掌握面板开启该功用之后,用户能够在撑持RTX VSR功用的阅读器或播放器(目前撑持VSR手艺的阅读器次要是最新版的Chrome和Edge)中得以享受更清晰的视频娱乐。当然要利用RTX VSR功用,用户们还必需拥有RTX 30系以上的GPU,并得到最新驱动法式的撑持。根据现实播放的视频画面来看,RTX VSR将感化于整个画面,特殊是在细节处,可以起到降噪的感化,让本来糊成一团的细节得以闪现出更清楚的轮廓,从而让用户感触感染到细节满满的视频画面。
▲在利用RTX VSR功用之前,用户需要翻开NIVIDA掌握面板,抉择调整视频图像设置,并在此中勾选RTX视频加强选项下的“超辨认率”(框选的内容),就能在撑持VSR功用的阅读器中开启RTX 视频加强。
▲通过利用RTX VSR功用,在线视频在播放时可以更好地凸显画面细节,好比截图处的框选位置,字样轮廓明显更清晰一些。左图为Chrome阅读器播放VSR加强,右图为FireFox阅读器播放原生视频。
散热、超频测试
通过加进散热测试,我们可以在探究显卡性能之余,更好地领会它们的不变性以及更大能耗比,因而那个环节同样重要。从现实的功耗测试来看,技嘉RTX 4070魔鹰OC在现实利用中的功耗表示较前代产物确实有了很大的改进。在次要察看光逃游戏性能的3DMark Port Royal测试中,技嘉RTX 4070魔鹰OC的功耗释放均匀约为215W。而旨在察看DX12传统游戏的TimeSpy Extreme测试中,技嘉RTX 4070魔鹰OC的功耗释放均匀约为205W,其能耗比均比RTX 3070 Ti、RTX 3070得到显著提拔。而在几个游戏的现实运行功耗测试中,技嘉RTX 4070魔鹰OC的均匀游戏功耗约为187W摆布,在能耗比的优势上远远超越了RTX 3070 Ti和RTX 3070。
此外,我们还对技嘉RTX 4070魔鹰OC停止了现实的烤机测试,以察看其散热性能。在室温25℃的情状下,颠末半小时Furmark烤机之后,技嘉RTX 4070魔鹰OC最末温度掌握在61℃,在日渐炎热的当下,它的核心温度仍然比力“清冷”,由此可见三电扇散热系统的过人之处。
▲最末,我们将技嘉RTX 4070魔鹰OC的核心bosst频次不变至2750MHz。
▲颠末超频后的技嘉RTX 4070魔鹰OC胜利完成了3DMark Time spy Extreme的测试,并得到9250的显卡得分。
在散热测试完成之后,我们进一步通过技嘉智能管家(GCC)对技嘉RTX 4070魔鹰OC停止手动超频——即使是那款显卡已经颠末了预超频处置,在屡次测验考试之后,我们仍然将它的核心bosst频次不变至2750MHz,较超频前多出了185MHz。同时,在如许的形态下,技嘉RTX 4070魔鹰OC胜利完成3DMark Time spy Extreme的测试,且得到了9250的显卡得分,较超频之前的8805分多出了5%,关于脱手才能强的玩家而言,那款显卡可玩性不错。别的,有鉴于它的功耗较公版产物超出跨越些许,因而各人在抉择电源时,更好搭配额定功率为700W的高操行电源。
小结
略有遗憾的是,NVIDIA从RTX 4070 Ti到RTX 4070,老黄的“那一刀”略微有点“下手狠”,纸面规格差距大也招致RTX 4070在性能上比拟RTX 4070 Ti要逊色很多。或许那是NVIDIA吸收了上一代RTX 3070 Ti与RTX 3070之间价位差与性能差不婚配,招致二者都十分为难的体味而做出的调整吧。不外从价格上来看,RTX 4070的首发价格比拟RTX 4070 Ti,倒也根本契合规格与性能的差距,玩家们就各取所需吧。
整体测试成果来看,技嘉RTX 4070魔鹰OC仍是很好地担任起了1440p@100fps光逃游戏畅玩的重任,在所有参与测试游戏的体验中,技嘉RTX 4070魔鹰OC在开启DLSS之后,根本都实现了100+fps的1440p全特效光逃游戏畅玩目标。在Ada Lovelace以及它的新特征、新功用的搀扶帮助下,技嘉RTX 4070魔鹰OC在面临上代显卡产物时完全构成了碾压的态势,其性能提拔十分显著,特殊是在借助DLSS 3之后,哪怕敌手是RTX 3070 Ti,综合帧率提拔也能到达75%以上。即便在传统游戏性能上,技嘉RTX 4070魔鹰OC的性能也领先RTX 3070 Ti和RTX 3070到达了20%、30%以上。
别的需要强调的时,在能耗例如面,技嘉RTX 4070魔鹰OC也有十分显著的优化,可以发作出更强劲的实力。不但是游戏场景,Studio创做利用以及AI造图方面,技嘉RTX 4070魔鹰OC都同样有着上代产物难以比肩的优势,完全做到了“既要还要”的多重目标。当然,就显卡自己而言,科幻的外看加之多样的背光部位仍是令其具备不错的辨识度,硬派的风气也能俘获很多玩家的芳心。特殊是内部豪华的用料以及表示仍然给力的风之力散热系统,那使得技嘉RTX 4070魔鹰OC显卡成为了一位十分全面的“六边形兵士”,关于大大都拆机预算在万元摆布的游戏玩家来说,它是一款值得你拥有的万能产物。