GeForce RTX 3070显卡天梯榜首发评测:上代旗舰被挑落马下

NVIDIA在9月2日的发布会上带来三款显卡RTX 3090、RTX 3080和RTX 3070,前面两张显卡在9月份就已经解禁,关心的人估计都看过我们的同步评测了,全新NVIDIA Ampere架构所带来的新特性也在此前的文章里做了详细的解析,RTX 3090与RTX 3080的性能非常强劲,在4K分辨率下能流畅的运行光追游戏,RTX 3090所拥有的24GB海量显存也让它拥有8K分辨率游戏的本钱,GA102 GPU强大的运算性能也带来了强劲的生产力。虽然说这两款显卡性能很强,但他们的售价都很高,RTX 3080售价是5499元起,RTX 3090更是要11999元,高昂的售价让不少人望而却步,而发布会上最后登场的RTX 3070只需要3899元起,会有更多的消费者能接受它,另外会上老黄说它的比上代旗舰RTX 2080 Ti更快,真有这么强吗?

全新的GA104 GPU

GeForce RTX 3070与上个月发布的RTX 3090/3080不同,用的不是GA102核心,而是用了相对小一点的GA104 GPU,核心面积从628mm2缩小到392.5mm2,晶体管数量也从283亿变成了174亿,芯片面积和晶体管数量都缩小了40%左右,生产工艺依然是三星为NVIDIA定制的8nm工艺,更小的核心换来的当然是更低的发热量与更低的功耗。

完整的GA104拥有6组GPC,但每组的TPC数量从6组减少到4组,一共24组TPC,每组TPC包含2组SM,所以总共拥有48个SM单元,每组SM有128个CUDA,一共有6144个CUDA,8组32位的显存控制器组成256bit的显存位宽。

但RTX 3070所用的GA104-300核心屏蔽了两组SM单元,只启用了46组SM,5888个CUDA,GPU核心基础频率1500MHz,Boost频率1725MHz,显存位宽是完整的256bit,搭配8GB GDDR6显存,等效数据频率14Gbps,显存带宽和上代的RTX 2080/2070一样是448GB/s,显卡TGP是220W,比RTX 3080的320W低得多,比上代的RTX 2070的185W高出不少,介于RTX 2080和RTX 2070 SUPER之间。

NVIDIA Ampere架构简介

而RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。

大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。

负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。

Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。

而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。

将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。

再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。

最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,所以最快我们也要等到明年才能看到这项技术的具体应用。

NVIDIA Reflex

伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。

硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。

而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。

NVIDIA Broadcast

NVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。

在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。

而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。

GeForce RTX 3070 Founder Edition显卡介绍

NVIDIA GeForce RTX 3070 Founder Edition显卡的设计和RTX 3090/3080差别其实是有点大的,但整体外观风格和散热风道是类似的,RTX 3070 Founder Edition和之前两张最大的不同就是两把风扇都在显卡的正面,不像两位老大哥一前一后来安装,前风扇的主要出风口还是视频输出口那边,能把热量直接排出机箱外面,后风扇下方是没有PCB的,背板在那个位置也是镂空的,风能直接吹透显卡改善机箱的风道。

显卡的厚度是标准的双槽,长度以及高度分别242mm及99mm,和RTX 3080 FE比起来要短很多,高度则是一样的,RTX 3090 FE的尺寸则要比它大整整一圈。

上一代的RTX 2070 Founder Edition其实还要比RTX 3070 FE要长一些,尺寸应该和RTX 2070/2060 FE差不多。

RTX 3070 FE配备两把85mm风扇,有智能启停功能,在低温时可以停转来减少噪音,RTX 3080/3090 FE显卡上GeFroce RTX的位置是有灯的,但RTX 3070 FE并没有,此外12pin供电接口的安装方式也由比较特殊的竖直于PCB并倾斜45°安装,改成比较传统的水平安装在PCB上的设计,显卡尾部的显卡支架螺丝位还有保留,但现在预装了两颗螺丝堵住了螺丝孔。

显卡配备金属背板,而显卡尾部是完全镂空的,可以直接看到散热器的散热鳍片,后风扇的风能直接穿过整块显卡,这样散热效果更好,而且有利于整个机箱的散热。

RTX 3080/3090 FE显卡风扇四周是被金属框完全包裹住的,风基本上无法从显卡的上下边缘吹出,RTX 3070 FE虽然大体上沿用了这一设计,但它的边框不是完全包裹着风扇的,风是可以从显卡上下两个小开口喷出,虽然说整体的影响不会很大,但风道还是和RTX 3080/3090 FE略有不同。

视频接口依然是3个DP 1.4与一个HDMI 2.1接口,不过挡板的并没有采用此前RTX 3080/3090 FE的大开口设计,而是比较传统的网格开口。

由于RTX 3070的耗电比RTX 3090/3080低得多,所以配送的电源转接线也从双8pin转12pin变成了单8pin转12pin,而且12pin接口那边有一半是没接线的,基本上就是8pin转6pin,我们实际测试果,即使使用双8pin转12pin那根线,也是有一个8pin接口是没有输出的,也就是说显卡PCB上的12pin接口有一半是没接线的。

显卡拆解

由于GA104核心发热要比GA102小得多,RTX 3070 FE所配备的散热器规格也相对没这么高,这散热器没有用均热板了,不过依然有4根8mm直径的热管,3根通向显卡后部,一根则弯曲到显卡前部。

相比于RTX 3090/3080 FE的“异型”PCB,RTX 3070 FE的PCB正经得多了,不过也不是标准长方形的PCB,尾部还是有个内凹的设计,显卡采用8+2相供电设计,8相GPU核心供电在PCB左侧,2相显存供电在右侧, 基本上都是一个电感配一个Mosfet,GPU供电用的是AOSMD的DrMOS,显存供电用的是Sinopower的SM7342EKKP,八颗三星的GDDR6显存围绕着GA104 GPU。

相比于庞大的GA102,RTX 3070使用的GA104真的小巧许多

测试平台与说明

因为NVIDIA Ampere架构支持PCI-E 4.0,目前只有AMD锐龙平台支持,测试使用AMD Ryzen 9 3900X处理器,主板是华硕 ROG CROSSHAIR VIII HERO,使用芝奇皇家戟DDR4-3600 16GB*2双通道套装,对比的对象包括上一代的旗舰显卡RTX 2080 Ti Founder Edition,和它对位的RTX 2070/2070 SUPER,还有高一级的RTX 3080,以及AMD的RX 5700XT。

通过GPU-Z还可以看到显卡的BIOS中有关温度与功耗的相关信息,温度方面,默认的温度上限是83摄氏度,可以向上解锁至90摄氏度,功耗方面,默认功耗上限是220W, 并且可以解锁至240W,以获取更好的超频能力。

显卡基准性能测试

我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、FireStrike Ultra、Time Spy、Time Spy Extreme和Port Royal六个项目,具体成绩见下表,表中所列成绩均为3DMark显卡得分。

如果对比上一代的RTX 2070/2070 SUPER的话,RTX 3070性能光追和非光追的性能都暴增了30%,基本上和RTX 2080 Ti不相上下,不过在光线追踪的Port Royal中比RTX 2080 Ti落后了8%,这个差距就点大了。

和高一级的RTX 3080对比的话,Fire Strike和Time Spy的测试大概落后30%左右,而带光追的Port Royal则落后40%,两者之间差距还蛮大的。

AMD的RX 5700XT只是供大家对比的一个参照物,毕竟AMD的新卡还没出来,只能拿它撑下场面。

游戏测试

由于RTX 3080的定位,在单机大作的游戏实测部分会测试2K和4K两个分辨率,NVIDIA RTX显卡还会加测实时光线追踪游戏,故将游戏测试分为两组,分别设置为传统光栅化游戏画面(即没有光线追踪效果)和开启实时光追游戏画面的测试。

传统光栅化游戏测试

传统光栅化游戏画面测试这部分均将游戏画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。

在2K分辨率下,RTX 3070的性能大概是RTX 2080 Ti的96%左右,基本上相差不大,与上一代对位的RTX 2070相比性能提升了47%,与高一级的RTX 3080相比落后大概20%,从帧数来看RTX 3070在最高画质下流畅运行2K分辨率的游戏一点问题都没有。

分辨率提升到4K,RTX 3070性能基本等于RTX 2080 Ti,两者互有胜负,但帧数基本只有个位数的差别,和RTX 2070相比性能提升了49%,与高一级的RTX 3080相比落后22%。

实时光追游戏测试

光追游戏的测试部分就没有RX 5700XT什么事儿了,所测几款游戏仍然采用预设最高画质(《地铁:离去》选择Ultra画质),光追效果选项可选的均开为“高”设置,开DLSS的测试中DLSS选项可选的均开为“性能”设置。《光明记忆》和《边境》均为独立的Benchmark测试结果。

光追游戏的话,RTX 3070和RTX 2070的差距就拉得更开了,《光明记忆:无限》里面甚至有100%的提升,整体提升幅度有65%,和RTX 2080 Ti相比的话就略微好一点,不过基本上差距不大,和高一级的RTX 3080相比落后了18%,两者的差距还是蛮大的,不过在2K分辨率下RTX 3070还是能很好的胜任流畅运行光追游戏的。

分别提达到4K级别的话,RTX 3070的表现还是稍微比RTX 2080 Ti好一点点,不过基本上还是能直接画等号,比RTX 2070提升还是有58%,而且RTX 2070在4K分辨率下已经说不上流畅了,RTX 3070在4K开光追的情况下流畅度还行,当然想完全流畅运行的话还是得上RTX 3080。

温度测试

我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为25℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Fire Strike压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

NVIDIA GeForce RTX 3070 Founder Edition显卡待机时风扇停转,不过RTX 30系列FE版的散热鳍片基本都直接外露的,散热面积其实非常的大,待机温度最高38℃。满载的话,最终温度稳定在75℃,换用GA104核心后发热明显低了不少, 虽然散热规模比RTX 3080 Founder Edition小了许多但温度一点都不高,风扇转速最高大概1900RPM,转速不算高。

而显卡的实际工作频率如下图所示,基本上最终GPU会稳定在1845MHz附近:

功耗测试

显卡功耗测试使用的是NVIDIA提供的PCAT工具,可以精确测量显卡PCI-E与外接电源接口的实际功率。显卡满载功耗在3DMark Time Spy Extreme压力测试中获得,待机功耗则是在进入系统后记录10分钟取平均值。

待机功耗方面,RTX 2070、RTX 2070 SUPER、RTX 2080 Ti、RTX 3070、RTX 3080和RX 5700XT的待机功耗均值依次为9.6、9.4、12.0、8.6、10.1、11.9,使用更少晶体管的GA104核心RTX 3070比采用GA102核心的RTX 3080相对来说待机功耗还是要低一点点,当然这里还有显存的功耗差异,与上代产品相比,采用8nm工艺的RTX 3070待机功耗也是要低一点。

满载功耗方面,RTX 2070、RTX 2070 SUPER、RTX 2080 Ti、RTX 3070、RTX 3080和RX 5700XT的满载功耗均值依次为209、205、262、220、330、215,RTX 3070的平均功耗比RTX 3080低了110W,比RTX 2080 Ti也低了42W,性能差不多功耗却降低了,NVIDIA安培架构的能耗比确实要比上代的图灵提升不少。

至于瞬时峰值功耗,RTX 2070、RTX 2070 SUPER、RTX 2080 Ti、RTX 3070、RTX 3080和RX 5700XT的峰值分别为229、240、294、244、362、268,可见RTX 3070对电源的需求比RTX 3080低多了,和RTX 2070 SUPER差不多,一个650W的电源其实也足够了,预算充裕的话搭配更高规格的电源也是更好的。

超频测试

超频测试时把显卡的TPD和温度都提到上限值,最终在显卡核心频率只能+100MHz, 不过显存频率能超得比较高,能从1750MHz超到2025MHz,等效数据频率16.2Gbps,超频后能通过3DMark Port Poyal、Time Spy Extreme还有Fire Strike Ultra测试,此时显卡得分分别为8679、7241、9093分,分别提升了7.8%、8.4%、9.8%,超频 收益还是不错的。

下图是显卡超频后运行Fire Strike测试时的频率曲线,最高频率能到2085MHz:

总结:性能和RTX 2080 Ti画等号

从性能测试结果来看,RTX 3070的性能几乎可以直接和RTX 2080 Ti画个等号,而且在新游戏以及光追游戏中确实有比RTX 2080 Ti更好的表现,预计随着新游戏的发布,RTX 3070和RTX 2080 Ti的性能差距会逐渐增大,毕竟NVIDIA Ampere架构拥有Turing所没有的新特性,有不少东西还是得新游戏去发掘的。

与RTX 3090/3080上所用的GA102核心相比,RTX 3070所用的GA104核心更为小巧,所以发热与功耗得到了更好的控制,它的平均功耗只有220W,比RTX 3080的330W低了1/3,搭配650W的电源也足够了,功耗的降低直接让RTX 3070的发热也大幅降低,也不需要这么多相供电,结果就是RTX 3070 Founder Edition尺寸比RTX 3080短了很多,不过呢,大家能买到的非公版大多数还是尺寸比较巨大的。

显卡迷你天梯榜 (完整显卡天梯榜)

RTX 3070用RTX 3080 70%的功耗发挥出了它80%的性能,可见能耗比其实增加了不少,当然在性能面前能耗比只是次要的,RTX 3070在4K分辨率下游戏流畅度确实没RTX 3080那么好,毕竟它所配备的8GB显存在4K分辨率下确实有可能出现容量不足的问题,不然NVIDIA也不会考虑RTX 3070 16GB这种东西了,虽然传言说它被砍了,但我相信显存容量更大的RTX 3070变种应该还是存在的。

售价方面RTX 3070的建议零售价是3899元起,比上一代的RTX 2070和RTX 2070 SUPER的上市价都要便宜,而且性能提升幅度非常之大,你们想一下现在不到4000元就能买到相当于上代万元旗舰性能的显卡,是不是很划算呢?它的性能在2K分辨率下最高画质玩光追游戏是完全没问题的,4K分辨率下就得看游戏,部分游戏可能要用画质换流畅度,它作为一款高端显卡来说它的表现已经非常出色。

在RTX 3070发布完之后,接下来的看点,NVIDIA应该就会出主流级的甜品显卡了,还有就是看看在AMD发布RX 6000系列显卡之后会如何反击。