1440p@100fps+光追游戏甜点GPU,NVIDIA GeForce RTX 4070 FE首发评测

近些年NVIDIA的新显卡发布总是遵循从旗舰形象产品到高端市场布局,然后逐渐推出面向主流级游戏市场的产品,最后再视市场反应以新一代的入门级市场产品收尾。对新一代的RTX 40系GPU来说,从RTX 4090到RTX 4070 Ti,NVIDIA逐渐完成了面向中高端及旗舰市场的产品布局,所以接下来自然就是真正主流级游戏市场的大拼杀。在这一市场上,按照NVIDIA的产品定位,无疑就应该是70和60系扛着大旗前进。所以在RTX 4070 Ti上市之后没隔太久的时间,NVIDIA又将GeForce RTX 4070 GPU推到了台前。
图片
虽然在今年1月发布RTX 4070 Ti时,NVIDIA官方宣称RTX 4070 Ti的定位在于1440p游戏市场,但首发价格以及规格配置,使得RTX 4070 Ti更像是定位介于4K与1440p游戏之间摇摆的定位,也就是我们平时所说的中高端产品。不过对于主流游戏玩家的需求痛点——价格适中,性能不错,1080p~1440p全特效游戏来说,NVIDIA显然需要一款或几款性价比更高、定位真正的主流游戏市场的产品来抓住大多数普通玩家的心。尤其是对于追求1440p分辨率100+fps光追游戏体验的玩家来说,有没有一款“价格便宜量又足”的产品来满足他们的需求呢?要能基本实现100+fps的光追游戏体验,还要比RTX 4070 Ti更便宜?对这个问题,NVIDIA显然早已有了答案,作为餐前甜点级别的RTX 4070 GPU在三个月后就自然地来了。
在具体的评测之前,作为要了解传承NVIDIA Ada Lovelace架构的GeForce RTX 4070 GPU的技术核心,我们还是要先复习一下NVIDIA Ada Lovelace架构的核心要点(好像这句话在我们每次首发评测RTX 40系GPU时都要说一遍……如果你已经对其非常熟悉,可直接略过进入后文的评测部分。)。
来自Ada架构的RTX 40系GPU技术创新
RTX 40 系列 GPU 具有一系列新的技术创新,包括: 
缓存暴增
图片
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
图片
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。 
第三代光追核心
图片
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。 
第四代AI核心
图片
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
图片
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
图片
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
新一代NVIDIA编码器(NVENC)
图片
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
图片
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。 
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。 
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
RTX 4070 Ti小精简,TGP低至200W
图片
从规格上来看,GeForce RTX 4070 GPU可以看作是RTX 4070 Ti的小精简版本。RTX 4070一共搭配了4个GPC,不过其中一个GPC砍掉了1个TPC,也就是减少了2组SM单元,所以RTX 4070一共拥有23个TPC,46组SM单元。按照这样的配置计算下来,RTX 4070就拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。在核心规格配置上,相比RTX 4070 Ti精简了大约四分之一,也就是25%。不过在显存方面仍然保持了RTX 4070 Ti的12GB GDDR6X配置,显存位宽仍然为192bit,总带宽为504GB/s,与RTX 4070 Ti保持一致。因此从硬件规格方面来推测,RTX 4070与RTX 4070 Ti应该存在着20%~25%的性能差距。
与前一代的对位产品RTX 3070相比,二者在核心纸面规格方面相差不大,SM单元和CUDA核心数量都完全一致,不过RTX 4070的显存容量、速率以及核心频率的配置上都要明显超过RTX 3070,因此在性能上应该是比RTX 3070会超出很多。和前一代定位高一档的RTX 3070 Ti相比,虽然在核心的纸面规格数据上略逊色,但显存容量、带宽、核心频率都完胜RTX 3070 Ti,再加上全新的SM架构、更大的L2缓存和新一代的光追核心、AI核心,仍然可以期待RTX 4070在性能方面将完胜RTX 3070 Ti。
图片
TGP功耗设定为200W,因此RTX 4070 FE在板型设计上采用了类似RTX 3070 FE的“小卡”设计,整体感觉非常轻盈。在外观结构上,仍然是我们非常熟悉的,传承了RTX 40系公版显卡的风格——X形的金属中框搭配正反交错的散热风扇,而散热片仍然是外露的分布式散热片。虽然在外观结构上相对于RTX 4080 FE有了明显的“瘦身”,从三槽卡变为了双槽卡,散热片部分也有所薄弱,但考虑到200W的TGP和FE显卡一贯不俗的散热能力,我们还是对RTX 4070 FE的温度控制有着不错的信心。
图片
图片
▲RTX 4070 FE公版显卡采用了极简的实用风格设计,没有配置RGB灯效,只为实用与性能而生。
图片
▲电源接口仍然是RTX 40系的特色标配——ATX 3.0电源规范支持的PCIe 5.0 16Pin 12VHPWR接口供电接口。
图片
图片
▲输出接口配置仍然是标准的3个DP 1.4a+1个HDMI 2.1
NVIDIA GeForce RTX 4070 Founders Edition产品参数
核心架构:Ada Lovelace
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2475MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:200W
建议搭配电源额定功率:650W
显卡厚度:双槽
首发参考价格:4799元
游戏性能实测,远超RTX 3070 Ti
按照NVIDIA的官方定位,RTX 4070主要面向的是1440p及1080p全特效游戏市场,因此我们也主要在这两个分辨率下测试RTX 4070 FE的光栅、光追游戏性能表现,同时还会测试它在设计创作方面的性能。当然,作为玩家们都非常关心的能耗比和每瓦性能上,我们也会在不同的应用场合进行详细的评测。另外作为NVIDIA Ada Lovelace核心架构最重要的DLSS 3技术,我们也会对其进行详细的专项测试,并对比同代产品DLSS 2/3的差距以及跨代产品间DLSS 2/3的性能差异。
作为性能对比的产品选择,我们主要选择了RTX 3070 Ti、RTX 3070i和前两代的RTX 2070 SUPER三款产品来作为参考,衡量RTX 4070与上一级同代产品、前一代高一档产品以及前两代的对位产品之间的性能优劣。另外,我们也在部分测试中加入了RTX 4070 Ti的成绩,通过评测成绩,大致了解一下RTX 4070与RTX 4070 Ti之间的性能差距。
按照惯例,我们首先提出想要通过测试来解决的疑问:
1.RTX 4070 GPU在综合游戏性能表现上是否能明显胜过RTX 3070 Ti?
2.RTX 4070+DLSS 3相对于RTX 3070 Ti+DLSS 2的表现是否足够优秀?
3.在设计创作性能上,RTX 4070能否有比RTX 3070 Ti更好的表现?
4.秉承NVIDIA Ada Lovelace核心架构的RTX 4070在能耗比上表现如何?相比前一代和前两代的产品,是否有明显优势?
测试平台
GPU:NVIDIA GeForce RTX 4070 FE、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:技嘉AORUS Z790 MASTER
内存:影驰名人堂DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 531.42
DLSS 3性能,一骑绝尘
作为RTX 40系GPU的核心重头技术,DLSS 3从一出现开始就为RTX 40系披上了“官方外挂”,也给诸多游戏玩家带来了暴涨的性能免费提升。所以我们将DLSS 3性能的考察放在了所有测试的前面。在这部分测试中,我们选择了包括《原子之心》《霍格沃茨之遗》《漫威蜘蛛侠:迈尔莫拉斯》等最新热门游戏在内的一共13款DLSS 3游戏对RTX 4070 FE进行了细致的考核。
图片
图片
图片
我们用RTX 4070 FE实际测试了13款DLSS 3游戏,最后的结果也完全在预料之中。同样在RTX 4070 FE显卡下,开启DLSS 2时,13款游戏测试中的平均帧率相对于关闭DLSS时提升幅度在56%(1080p)和85%(1440p)。而在开启帧生成功能打开DLSS 3之后,13款游戏的平均帧率相对于关闭DLSS时的提升幅度则达到了137%(1080p)和168%(1440p),性能表现非常优秀。比如在《传送门》RTX版游戏中,1440p分辨率下关闭DLSS时游戏帧率仅有19fps,开启DLSS 2之后游戏帧率也不足60fps,但是在开启DLSS 3之后,游戏帧率则猛增到了84fps,已经能够绝对流畅地愉快游戏了。
之前也多次说过,DLSS 3带来的另一优势是由于集成了NVIDIA Reflex,因此开启DLSS 3之后,将会带来更低的游戏延迟,对MOBA、大逃杀或FPS类游戏玩家来说,其意义也是非常重大的。
图片
图片
图片
图片
图片
图片
图片
图片
测试选取了9款DLSS 3游戏进行。从整体测试结果来看,开启DLSS 3之后,所有测试游戏的PCL系统延迟都得到了极大幅度的降低,最高降低程度甚至超过了80%,显然这会给游戏玩家带来更顺畅丝滑的游戏体验。同时,开启DLSS 3之后,随着平均帧率的大幅度上升,影响游戏卡顿与否的1%L fps也得到了极大的提升,进一步增强了玩家的愉悦游戏体验。
在DLSS 3相关的测试部分,我们想最后解决的一个问题是:和前一代的对位产品,甚至是跨档次的对位产品相比,RTX 40系GPU独占的DLSS 3相比前一代的DLSS 2,性能增幅有多大?在DLSS 3的加持下,RTX 4070 FE相比RTX 3070 Ti又会有怎样的强势表现?
图片
图片
测试仍然基于13款支持DLSS 3的游戏进行。在这部分测试中,我们选择了在相同的平台配置下用RTX 3070 Ti开启DLSS 2对比RTX 4070 FE开启DLSS 3时的游戏性能,看一下RTX 4070 FE是否能实现跨代次的“降维打击”。
从测试结果来看,RTX 4070 FE的DLSS 3性能表现确实非常完美,相对于RTX 3070 Ti开启DLSS 2的情况,开启DLSS 3的RTX 4070在整体游戏性能上平均达到了RTX 3070 Ti的1.75倍左右,部分游戏中甚至达到了2倍性能。换句话说,在开启DLSS 3之后,相比开启DLSS 2的RTX 3070 Ti,RTX 4070 FE的平均游戏性能领先程度已经达到了75%甚至更高。
传统游戏性能测试
在传统游戏性能测试部分,我们着重考察RTX 4070 FE的普遍性游戏性能表现,也是衡量其与前一代对位产品之间的真实性能差距的重要测试手段。在这部分游戏中我们选择了一共19款热门游戏进行,其中大部分为支持实时光线追踪的游戏,通过这些游戏的实际体验测试,我们将来看看RTX 4070 FE在1440p和1080p分辨率下会交出怎样的成绩答卷。
图片
图片
图片
首先来看1440p分辨率下的游戏性能表现。从测试结果可以清晰地看到,开启DLSS 2之后,RTX 4070 FE已经能够在1440p分辨率下完美地运行所有参测游戏,帧率都能保持在60fps+。
和前一代的RTX 3070 Ti相比,RTX 4070 FE在1440p分辨率下整体性能领先前者约22%,对比RTX 3070,平均性能领先更是达到了33%左右。尤其是在新推出的游戏中,RTX 4070 FE的性能领先程度更高,比如在《最后的生还者:第一季》中,RTX 4070 FE相对于RTX 3070 Ti的领先程度甚至接近50%。而相对于更前一代的RTX 2070 SUPER来说,RTX 4070 FE的游戏性能已经实现了翻倍的提升。在这部分测试中,我们也在部分游戏中加入了RTX 4070 Ti的数据用以对比参考,整体来看RTX 4070 FE在游戏性能上落后RTX 4070 Ti约25%~30%,与纸面规格的差距比较相符。
图片
图片
图片
1080p分辨率下的游戏性能测试情况基本与1440p分辨率下一致,RTX 4070 FE仍然保持了相对RTX 3070 Ti和RTX 3070约22%和33%的性能领先,相对于RTX 2070 SUPER的性能领先程度仍然达到了翻倍提升的程度。
3DMark理论3D性能测试
图片
图片
图片
最后来看理论3D性能测试项目3DMark。在这一测试中,RTX 4070 FE的性能表现基本符合之前游戏性能测试的整体表现,相对于RTX 3070 Ti来说,3DMark理论性能非光追环境下的成绩领先约17%,光追环境下则领先约28%,平均在22%左右。相对于RTX 3070而言,非光追环境下性能领先约25%,光追环境下性能领先约35%。而相对于前两代的RTX 2070 SUPER来说,RTX 4070的整体成绩已经接近翻倍的提升。
设计创作与AI,RTX 4070不只是游戏
对RTX 40系GPU来说,其存在的意义不仅仅是游戏战场,全新的SM架构、第三代光追核心与第四代AI核心赋予了它在设计创作以及AI计算方面同样出色的性能表现。在之前的测试中我们已经体验了RTX 4090、RTX 4080和RTX 4070 Ti在设计创作上的性能,今天我们再来看看RTX 4070 FE会有怎样的表现。
视频转码剪辑处理
图片
图片
RTX 4070 FE搭配的是单NVENC(第八代)和单NVDEC(第五代),不过凭借效率更高的第八代NVENC和对AV1编码的GPU加速支持,RTX 4070仍然在视频转码性能上表现出了强势的一面。Davinci Resolve 18测试中,在H.264的编码性能上领先RTX 3070 Ti和RTX 3070约15%,在H.265的编码性能上领先程度更是达到了25%~50%。而在剪映Pro的4K视频转1080p编码测试中,RTX 4070 FE的H.264编码性能领先RTX 3070 Ti和RTX 3070约40%,在这一测试设置下AV1的编码性能更是达到了200%的领先程度(RTX 3070 Ti、3070和2070S不支持AV1 GPU硬件编码加速,应该是采用的剪映内置的AV1编码软算法)。
当然,RTX 4070 FE在视频转码方面的另一大优势是实现了对AV1格式视频的GPU硬件编码加速支持。相比传统的H.264或H.265格式视频,AV1视频拥有相同码率、分辨率下更小体积的视频和更好的视频质量,也代表着未来主流视频的趋势。
我们在测试平台上用OBS录制了一段相同长度下的《生死轮回》游戏中的相同场景,并在NVIDIA ICAT软件中对比了两段录像的质量。
图片
图片
▲在ICAT软件中仔细对比两段视频,可以发现AV1编码的视频在细节上更丰富,视频质量更好一些。(上图左为AV1编码,右为H.264编码)
3D渲染
图片
图片
图片
在3D渲染能力测试部分,我们选择了V-Ray Benchmark, Blender Opendata Benchmark和Blender 3.5实际模型渲染三种方式进行了评测。最终测试结果显示,在Blender模型渲染能力测试中,根据模型精度、大小的设置不同,RTX 4070 FE的性能领先RTX 3070Ti达到了30%~137%,越是渲染负荷大的模型,RTX 4070 FE的领先优势越明显。即使除去可能导致“爆显存”的斑斓星系渲染之外来看,RTX 4070 FE的3D渲染性能也领先RTX 3070 Ti达到了45%以上,领先RTX 3070更是达到了55%以上。
AI计算与处理
第四代Tensor Core AI核心也为RTX 40系GPU带来了不俗的热门AI计算性能。同时,伴随RTX 4070的发布NVIDIA也正式公布实装了其自身的RTX VSR(RTX Video Super Resolution,RTX视频超级分辨率)。因此在这一部分的测试中,我们将通过三个应用来体验RTX 4070的AI运算能力。
ON1 Resize AI 2022图片AI缩放处理
图片
首先来看图片AI智能处理的ON1 Resize AI 2022。在软件中,我们选择了5张5K照片,并将其等比无损缩放到200%(10K+级精度照片)。从测试结果来看,RTX 4070 FE的图片AI处理性能明显遥遥领先,相对RTX 3070 Ti、RTX 3070和RTX 2070 SUPER的领先程度分别达到了30%、36%和71%。
RTX VSR,让视频更清晰
早在RTX 4070 Ti发布时,NVIDIA就公布了RTX VSR的相关信息,这是一种基于RTX GPU之上的视频缩放增强技术。简单来说,它可以通过细节增强让视频播放更加清晰。
目前要实现VSR需要两个硬性条件,其一是必须基于RTX 30系以上的GPU并得到驱动程序的支持,其二则是需要支持VSR功能的浏览器或播放器。我们测试所用的Game Ready Driver 531.42驱动程序已经开放了对VSR的支持,同时我们也通过NVIDIA拿到了今晚将正式发布的,支持VSR的VLC播放器预览版(支持VSR的VLC播放器将在今晚于VLC官网提供下载)。我们将通过浏览器和播放器两种方式,来体验一下VSR的表现。
首先我们用OBS录制了一段4K分辨率,120Mbps码率的《赛博朋克2077》游戏录像以及一段1440p分辨率,120Mbps码率的《生死轮回》游戏录像,用作VSR体验的素材。
其次,在驱动控制面板中开启VSR。
图片
▲勾选RTX视频增强选项下的“超分辨率”,就能在支持VSR功能的浏览器中开启RTX 视频增强。
目前支持VSR技术的浏览器主要是最新版的Chrome和Edge(请更新到最新版本),其他浏览器暂不支持。所以我们首先用FireFOX浏览器打开待测视频、全屏播放,并用OBS抓取全屏播放窗口录像,生成非VSR增强的对比视频A。
然后我们开启最新版的Chrome浏览器(支持VSR),并在其中全屏播放同一段录制的游戏视频,同样用OBS抓取全屏播放录像,生成带VSR增强的对比视频B。
最后我们打开NVIDIA ICAT软件,将A、B视频同时拉入ICAT中播放逐帧对比,来观察开启VSR增强前后的视频质量。
图片
▲在《赛博朋克2077》游戏录像播放对比可以看出,在支持VSR的Chrome浏览器播放时(右),游戏录像的清晰度和细节呈现相比FireFOX浏览器播放时(左),都得到了不同程度的加强。
▲在《生死轮回》的游戏录像播放中的情况一样,Chrome浏览器播放(图左)下游戏录像的清晰度和细节也同样受益于RTX VSR而得到了一定的增强。
图片
我们还在测试中特别针对国内的视频网站进行了VSR的体验。在视频网站哔哩哔哩上,我们搜索了NVIDIA GeForce官方账号上传的一段《暗黑破坏神4》的DLSS 3 1080p宣传片,分别在FireFox和Chrome浏览器中对其进行了播放录屏,并同样用ICAT软件对其进行了视频的质量对比分析。
图片
图片
图片
以上三张视频效果对比图,左为Chrome浏览器+VSR播放OBS录屏,右为FireFox浏览器内播放OBS录屏。从视频的逐帧对比可以看出,在VSR的支持下,Chrome浏览器内播放同一段B站是视频时,清晰度更好,细节呈现更好。这也说明目前VSR+支持的浏览器的确能为网络视频的观看带来更好的体验。感兴趣的玩家不妨一试。
从整体的测试结果来看,RTX VSR确实对视频带来了一定程度的增强,在清晰度和细节表现上相对原视频有了一定的进步。我们认为,VSR作为新出现的技术,就跟DLSS最初亮相时一样,会随着NVIDIA后续对其的逐渐优化改进,它应该会变得越来越好,最终就像从DLSS 1到DLSS 3一样,带来焕然一新的跨越式换代更新。到那时,或许我们就能肉眼所见1080p秒变4K!
Stable Diffusion AI图片生成计算
对Stable Diffusion来说,或许很多玩家都不陌生,至少应该多多少少听说过。这是一种基于AI计算的图像生成人工智能模型,支持通过文本描述来自动生成图片。当前基于SD-WEB UI的AI图片生成模型相信不少玩家也接触过。本次测试中我们选择了NovelAI-WEBUI-AKI的国内玩家封装版整合包,并手动安装了最新的NVIDIA cuDNN以实现对RTX 4070 GPU的加速计算支持。(关于Stable Diffusion的安装使用教程,玩家们可以在网上搜索相关资料。)
图片
在测试中,我们选择了“一座都铎风格的房子,在水边,美丽渲染图,日落,梦幻森林,照片般逼真,电影般构图,电影般高细节,超高逼真,电影般的照明,景深,超精细,色彩编码精美,8k,多细节,明暗错落,梦幻”作为构图的关键词(注意Stable Diffusion目前只能识别英文关键词),分别按照这样的关键词生成20、16张高精度AI图片。图片生成规范设置数据如上图所示(16张图设置为批次2-每批数量8,20张图渲染设置为批次10-每批数量2)。通过相同关键词和设置下,对比RTX 4070、RTX 3070 Ti、RTX 3070、RTX 2070 SUPER以及酷睿i9-13900K的AI运算能力。(我们将渲染的关键词总结为“落日下的海景房”,特此注明)
测试结果也显示出了RTX 4070较为优秀的AI运算性能。在渲染“落日下的海景房”时,平均能达到约9.1张图片/分钟左右的计算速度,而RTX 3070 Ti和RTX 3070分别只能达到约6.81张/分钟和6.64张/分钟的计算速度。相对于更前一代的RTX 2070 SUPER来说,RTX 4070的AI图片生成计算性能更是达到了前者的1.9倍之多。当然,对于当前的顶级处理器酷睿i9-13900K而言,RTX 4070的AI计算加速性能更是它的180倍以上,几乎没有任何可比性。
功耗探讨与研究
RTX 4070的TGP官方数据为200W,这显卡的理论功耗上限。但在实际应用场景中,不同的显卡却有不同的表现,比如4K游戏状态、1440p游戏状态、视频编辑处理状态,3D建模渲染状态等等,都有不同的功耗表现。在不同的应用场景下,RTX 4070在功耗上又会有怎样的表现呢?
图片
图片
图片
图片
图片
我们在3DMark、Blender渲染、《原子之心》游戏、《赛博朋克2077》游戏、《生死轮回》游戏以及Furmark烤机等多个应用场景下,用NVIDIA PCAT V2功耗测试套件对RTX 4070以及对比GPU的功耗进行了细致的测量。最后的结果表明,RTX 4070的平均游戏功耗仅有174W左右,与200W的TGP相距甚远。相比之下,RTX 3070 Ti则达到了245W左右,RTX 3070为225W,RTX 2070 SUPER也高达197W左右,同样的情况在Blender渲染测试中也表现出了相似的结果。从数据中可以清楚地了解到RTX 4070在能耗比方面确实有着极其巨大的优势。
图片
如果用应用下的成绩除以该应用下的平均功耗,我们就能得到一个简易的能耗比参考指数(不绝对准确,仅供参考)。从表中我们可以看到,在游戏应用下,RTX 4070的能耗比达到了RTX 3070 Ti的1.77倍左右,达到了RTX 3070的约1.6倍左右。在进行3D渲染时,RTX 4070的能耗比更是达到了RTX 3070 Ti和RTX 3070的2倍,相比RTX 2070 SUPER,能耗比更是提升了近150%。由此也能印证,RTX 40系GPU,当然也包括RTX 4070,在能耗比的表现上,确实非常出色。
图片
得益于优秀的能耗比,RTX 4070在温度控制方面也做得非常优秀,室温25摄氏度环境下,RTX 4070的待机功耗仅为12W左右,在经过Furmark烤机30分钟之后,GPU核心温度也堪堪达到65℃。相比RTX 3070 Ti、RTX 3070和RTX 2070 SUPER,再次显示出它有着绝对的能耗比优势。
全能的RTX 40系甜点,就是它
首先对整体的测试结果做一个简单的总结,方便懒人们直接索取:
1.RTX 4070的性能相比RTX 3070 Ti有25%左右领先幅度,相对于RTX 3070的领先幅度约为35%左右。与RTX 4070 Ti相比,性能落后约25%~30%。
2.DLSS 3毫无疑问地再次成了RTX 40系GPU的加分项,在DLSS 3的支持下,RTX 4070能表现出平均游戏性能相对RTX 3070 Ti领先达75%的高度(支持DLSS 3的游戏中,DLSS 3 Vs DLSS 2)。而DLSS 3对未来的游戏来说,几乎会成为一个“必选项”,也就意味着RTX 40系GPU将在更广阔的舞台上展现自己。
3.RTX 4070尽管只采用了单NVENC的配置,但在传统格式视频转码性能上仍然有非常不错的表现,领先RTX 3070 Ti和RTX 3070约15%~25%,而且支持AV1格式编码的它拥有更广的应用空间。
4.174W的平均游戏功耗以及142W的3D渲染平均功耗,使RTX 4070其拥有了非常出色的能耗比表现,远超RTX 3070 Ti和RTX 3070。
5.RTX 4070在新兴的前沿AI计算方面表现也非常优秀,在热门AI应用Stable Diffusion中,RTX 4070的AI图片生成计算能力领先RTX 3070 Ti约35%~40%,更是达到了目前顶级处理器酷睿i9-13900K的180倍以上。
一直以来,NVIDIA的GeForce RTX GPU的70和60系都是面对主流游戏市场的甜点产品,而作为甜点中的高端,70系面向的则是中高端的游戏市场。从本次RTX 4070 Founders Edition显卡的测试情况来看,相对于前一代对位产品的明显领先幅度、对DLSS 3的支持、优秀的能耗比与AI计算能力……这些特色的加持再加上599美元的首发价格,在保持首发价格与RTX 3070 Ti当初一致的情况下,性能的领先也达到了25%以上。虽然相对于RTX 4080 Vs RTX 3080 Ti有40%以上的性能增幅而言,RTX 4070相对于RTX 3070 Ti的性能增幅多少有一点“美中不足”,不过考虑到它的定位和市场价格,这倒也是能够接受的,毕竟旗舰GPU和主流级GPU面向的应用场合差别较大。
从我们的测试结果来看,RTX 4070毫无疑问是当前5000元级别市场上的一个好选择,无论是游戏、设计创作还是AI运算都能通吃的它,有足够的能力成为这一市场上的全能甜点选择,有DLSS 3,才能战未来!
目前标频版和公版的RTX 4070显卡NV官方指导价格为4799元起,当然AIC的非公版超频版产品的价格肯定会有一定程度的上浮,但相信不会太夸张。对于装机预算在万元左右的游戏玩家来说,要让电脑能流畅进行1440p@100+fps的光追游戏体验,在“显卡预算占一半”的游戏主机搭配“潜规则”下,RTX 4070毫无疑问是一个非常合适的选择,甚至可以说是首选——不但性能表现出色,支持DLSS 3,而且拥有高性能低功耗的巨大能耗比优势。尤其是对于追求机箱小型化的玩家来说,超高能耗比的特色也使得RTX 4070极有可能会出现的大量的双槽与双风扇的短卡产品,这无疑进一步强化了RTX 4070的市场价值。
所以,如果你想要为游戏电脑或设计电脑更新换代,面向1440p全能光追游戏甚至偶尔触摸一下4K游戏,那么我们认为RTX 4070确实是一个好选择。甚至纵观这个价位段的显卡市场,它就是“the one”!