新年,6气冲天!NVIDIA GeForce RTX 3060首发评测

辛丑牛年到,欢喜迎新春。在人们互赠祝福的同时,NVIDIA也为游戏玩家送上了一份新年大礼——NVIDIA GeForce RTX 3060(下文简称RTX 3060)。作为一款面向主流玩家的游戏GPU,RTX 3060自然也受到众多游戏玩家的关注。更值得玩家疯狂“打Call”的是,NVIDIA近日宣布将限制RTX 3060的哈希率,以降低其对加密货币从业者的吸引力。这就意味着RTX 3060将失去用于“挖矿”的价值,玩家们再也不用担心买不到卡了。正因如此,RTX 3060的性能表现也得到众多游戏玩家的密切关注。恰逢元宵佳节,RTX 3060的评测内容终于解禁,MC也早早地准备好了这款GPU的评测内容。话不多说,下面我们就一睹为快吧!
RTX 3060技术要点及规格解析
和RTX 30系列的其他前辈们一样,RTX 3060也采用三星8nm定制工艺,并基于NVIDIA最新推出的NVIDIA Ampere架构。该架构采用改进的Streaming Multiprocessor,它由不同核心、单元以及内存构成。NVIDIA Ampere架构SM的一大变化是FP32操作的吞吐量变为两倍。为实现这一目标,新数据路径设计是每个Ampere SM分区每时钟能够执行32个P32操作,所有四个Streaming Multiprocessor分区组合在一起,每个时钟可执行128 FP32操作。这能带来什么好处呢?简单来说,图形和计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。
图片
▲NVIDIA Ampere架构GPU示意图
下面我们将目光聚焦到型号为GA106-300的RTX 3060 GPU上,这款GPU拥有三项基础处理技术,它们分别是NVIDIA在15年前首次推出的可编程着色器、用于加快光线三角形和光线边界框相交的RT Core,以及称为“Tensor Core”的AI处理管线。首先在可编程着色器方面,搭载GA106-300核心的RTX 3060在处理能力上达到RTX 2060的两倍,由RTX 2060的6.5 -Shader-TFLOP/s提升到12.7 Shader-TFLOP/s。此外,GA106-300的光线三角形吞吐量也在RTX 2060的基础上大幅提升。第三代Tensor Core可自动识别并忽略次要的DNN权重,其硬件处理稀疏网络的速率同样达到上一代产品的两倍。
图片
图片
▲相比RTX 2060,基于NVIDIA Ampere架构的RTX 3060的可编程着色器、RT Core、Tensor Core性能均大幅提升。
那么对于游戏玩家来说,这些数字意味着什么呢?简单来说,在同样开启光线追踪的情况下,RTX 3060将提供比RTX 2060更强的光线追踪性能,同时得益于增强的AI推理能力,前者的DLSS性能也更胜一筹。关于NVIDIA Ampere架构的详细技术解析内容,MC曾在《性能、功能的爆炸式翻倍增长——GeForce RTX 30系Ampere架构GPU核心深入解读》一文中进行了非常全面的讲解,所以本文将不再赘述,感兴趣的玩家不妨翻阅此文,下面我们继续带领大家来了解RTX 3060的规格参数。
图片
▲GA106-300的完整宏观架构简图,仅供参考。
RTX 3060的核心代号为GA106-300,它拥有132.5亿个晶体管,28个SM单元,以及3584个CUDA核心。同时这款GPU还拥有28个第二代RT Core和112个第三代Tensor Core。需要注意的是,由于Streaming Multiprocessor设计的变化,NVIDIA Ampere架构相比Turing架构在CUDA核心的数量方面存在明显差异。具体来说,NVIDIA Ampere架构使用INT32和FP32双功能设计、并额外增加FP32单元,所以其可宣传CUDA核心数量就大大增加。正因如此,我们从规格参数中可以看到,RTX 3060拥有多达3584个CUDA核心,而RTX 2070 SUPER和RTX 2060则分别为2560个和1920个。
核心频率方面,RTX 3060的基础频率为1320MHz,相比RTX 3060 Ti和本文中的其他3款RTX 20系列GPU,前者的基础频率均要稍低一点。此外,RTX 3060的核心Boost频率达到1777MHz,比上述4款GPU的核心Boost频率要更高一些。不过从MC的测试来看,RTX 3060的核心Boost频率设定略显保守。何出此言呢?我们在这里先“挖个坑”,下文将为大家进行解答。
显存容量大幅增加是RTX 3060的一大亮点。它的显存容量达到12GB,是RTX 2060的两倍,甚至比RTX 3080还要多。为何这款GPU要搭载12GB显存呢?我们推测其主要原因是为了提升这款GPU在一些对显存容量需求较高的内容创作应用中的表现,例如其12GB大容量显存可让创作者处理更高分辨率的视频,同时在一些需要多开应用的工作,或在渲染更加复杂的模型时更加得心应手。至于其12GB显存是否能够在游戏中展现出明显优势,这还需要我们通过实际测试来寻找答案。在RTX 3060的其他显存规格上,其显存位宽为192bit,显存频率为7501MHz,显存带宽为360GB/s。可以看到,RTX 3060和RTX 2060的显存位宽保持一致,但前者的显存频率更高,所以其显存带宽也要更胜一筹。
图片
RTX 3060特色功能一览
作为GeForce RTX 30系列GPU家族的最新成员,RTX 3060也支持该系列的一些特色功能,例如NVIDIA Reflex和NVIDIA Broadcast。其中,NVIDIA Reflex是一种低延迟电竞技术,它可以提高从点击鼠标到显示器画面产生对应变化的速度,从而帮助玩家更快地捕获目标,更迅速地作出反应并提高瞄准精度,实现“指哪儿打哪儿”的目的。MC此前对这项技术进行了深度体验,并在《分毫必争的“战场”,NVIDIA Reflex助你夺得先机》一文中进行了非常详细的讲解,感兴趣的玩家不妨参阅此文。
图片
▲NVIDIA Reflex在实际游戏中可有效降低系统延迟
NVIDIA Broadcast是一款由AI驱动的通用插件,可用于大多数热门直播、语音聊天和视频会议应用程序。所有NVIDIA GeForce RTX、TITAN RTX或Quadro RTX GPU均支持此插件,并使用其专用AI处理器Tensor Core AI网络与玩家的游戏一起实时运行。目前这款软件提供了易于使用的音频和视频效果,例如“降噪”“虚拟背景”和“自动构图”等。NVIDIA Broadcast能让游戏主播、游戏分享、多人连线、视频会议等多种应用场景衍生出更强大、更好玩的功能。相比AMD在Radeon Software中的直播辅助功能,NVIDIA Broadcast的功能更加丰富,可玩性和实用性也更高。
图片
▲NVIDIA Broadcast可以帮助玩家隐藏身后背景,并且支持多种分辨率。
除了NVIDIA Reflex和NVIDIA Broadcast,RTX 3060还支持一项NVIDIA近期发布的功能——Resizable BAR。简单来说,它是一项标准化的PCIe接口技术,在该技术的帮助下,系统可以更具实际需求进行资源请求,并以整体方式将其进行传送,所以CPU便能有效访问整个帧缓存。另外,如果存在多个请求,传输可同时进行,而不是排序候命。那么对于游戏玩家来说,这项技术可以带来什么好处呢?答案是可以提升游戏帧率,至于Resizable BAR能让游戏帧率提升多少,我们会在测试中一探究竟。
图片
▲想要体验Resizable BAR,我们需要拥有支持该功能的主板,并在主板BIOS中打开“ Above 4G Decoding”和“Re-size BAR support”这两个选项。
NVIDIA GeForce RTX 3060鉴赏
NVIDIA本次没有推出GeForce RTX 3060的Founders Edition版本(即玩家俗称的“公版”产品),NVIDIA给MC提供的是iGame GeForce RTX 3060 Ultra W 12G。
图片
图片
图片
图片
图片
▲iGame GeForce RTX 3060 Ultra W 12G采用双8Pin供电设计
图片
▲视频输出面板上配备3个DP 1.4a接口和1个HDMI 2.1接口
iGame GeForce RTX 3060 Ultra W 12G采用了清新、靓丽的白色作为主色调,同时其正面装甲上辅以蓝、红、紫渐变色,前后也加上标有iGame记号的条纹为装饰,其淡然风格主体搭配明亮的色彩装饰更容易得到年轻玩家的青睐。散热设计方面,iGame GeForce RTX 3060 Ultra W 12G配备3个散热风扇,左右两个散热风扇的直径为90mm,中间散热风扇的直径则为80mm。这3个散热风扇的扇叶经过特殊设计和调教,通过边缘折角带来更高的风压和更多进风量。拆开之后我们可以看到,它采用直触式散热底座,并使用4根导热管连接大量散热鳍片,同时显存芯片和供电电路部分也配备了散热贴片进行降温。
图片
▲iGame GeForce RTX 3060 Ultra W 12G采用直触式散热底座,并且配备4根导热管和大量散热鳍片。
下面我们来看看iGame GeForce RTX 3060 Ultra W 12G的PCB板。iGameGeForce RTX 3060 Ultra W 12G的PCB板设计比较松散,如果将PCB板上的元器件设计得更加紧凑,我们相信其PCB板面积应该可以向双风扇散热器的PCB板面积看齐。此外,iGame GeForce RTX 3060 Ultra W 12G采用7+2相供电设计,GPU型号为GA106-300-A1,其频率为1320MHz~1777MHz。iGame GeForce RTX 3060 Ultra W 12G的GDDR6显存芯片来自三星,单颗容量为2GB。
图片
▲iGame GeForce RTX 3060 Ultra W 12G采用7+2相供电设计、
图片
▲iGame GeForce RTX 3060 Ultra W 12G的GPU型号为GA106-300-A1,其频率为1320MHz~1777MHz。
图片
▲iGame GeForce RTX 3060 Ultra W 12G搭载三星GDDR6显存,总显存容量为12GB。
规格参数
核心架构:NVIDIA Ampere
核心代号:GA106-300-A1
SM单元数量:28个
RT Core数量:28个(第二代)
Tensor Core数量:112个(第三代)
CUDA核心数量:3584个
GPU频率:1320MHz~1777MHz
显存容量:12GB GDDR6
显存频率:15Gbps
显存位宽:192bit
供电接口:8Pin+8Pin
视频输出接口:DP 1.4a×3、HDMI 2.1×1
TGP:170W
性能测试
本次测试我们首先想看看iGame GeForce RTX 3060 Ultra W 12G(下文简称RTX 3060)的光追性能究竟如何,于是我们挑选了《赛博朋克2077》《我的世界》《看门狗:军团》等6款光追游戏进行测试。此外,为了让大家直观感受RTX 3060的性能水平,我们也挑选了RTX 2060 FE、RTX 2060 SUPER、RTX 2070 SUER等5款进行对比。
测试平台方面,我们同一选择的是以AMD锐龙 9 5950X处理器、DDR4 3600 32GB双通道内存和X570主板为核心硬件。考虑到RTX 3060主要面向的是主流玩家,所以我们将重点在1080p和2.5K分辨率下测试其游戏性能,同时我们也比较好奇它是否具备在4K分辨率下流畅运行游戏的实力,所以我们也将在4K分辨率下测试它运行参测游戏的帧率。
MC一直推崇在最高画质下才能享受顶级游戏体验,所以在游戏测试环节中,我们将会把所有参测游戏的画质设为最高(包括光线追踪等级)。对了,《赛博朋克2077》《看门狗:军团》《德军总部:新血脉》这3款游戏均提供了多种DLSS模式,我们本次测试选择的是同时兼顾画面质量和游戏帧率的“平衡”模式。
测试平台一览
GPU:iGame GeForce RTX 3060 Ultra W 12G
NVIDIA GeForce RTX 3060 Ti
NVIDIA GeForce RTX 2070 SUPER
NVIDIA GeForce RTX 2060 SUPER
NVIDIA GeForce RTX 2060
处理器:AMD锐龙 9 5950X
内存:DDR4 3600 32GB双通道
主板:X570
电源:ROG THOR 1200W
图片
▲参测RTX 3060的GPU-Z截图
3DMark GPU理论性能测试
图片
图片
图片
图片
和上一代GPU相比,RTX 3060的理论性能位于RTX 2070 SUPER和RTX 2060 SUPER之间。具体来说,在这个测试环节中,RTX 3060的综合性能落后RTX 2070 SUPER约15%,并与RTX 2060 SUPER互有胜负。不过,RTX 3060在3DMark DirectX光线追踪功能测试中的表现要比RTX 2070 SUPER更胜一筹,我们认为其主要原因是RTX 3060搭载性能更强劲的第二代RT Core。
此外和RTX 2060相比,RTX 3060的理论性能拥有20%的优势。特别是在3DMark DirectX光线追踪功能测试中,RTX 3060的测试成绩为19.27fps,而RTX 2060的测试成绩则为13.15,前者领先高达47%。相比同样基于NVIDIA Ampere架构的RTX 3060 Ti,RTX 3060的CUDA核心数量和显存带宽明显不及前者,这也使得RTX 3060在这部分测试中的综合表现落后RTX 3060 Ti约38%。
游戏性能实测
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
对于RTX 3060游戏性能,我们首先比较关心的是它在运行各类光追游戏时的表现。从测试成绩来看,在1080p分辨率和最高画质下(光线追踪等级设为最高,并开启DLSS),RTX 3060运行6款参测光追游戏时的表现令人满意。例如它在上述设定下运行《德军总部:新血脉》的平均帧率达到179fps,并且《我的世界》的平均帧率也能达到97fps。此外,即使在运行《赛博朋克2077》《看门狗:军团》这两款对GPU性能要求较高的光追游戏时,其平均帧率也能接近60fps这一绝对流畅基准线。不仅如此,RTX 3060同样能够在2.5K分辨率和最高画质设定下(光线追踪等级设为最高,并开启DLSS),以超过60fps的平均帧率运行部分光追游戏。
值得注意的是,RTX 3060的DLSS功能在多款游戏中都提供了非常可观的性能提升。例如在关闭DLSS时,RTX 3060在1080p分辨率和最高画质下(光线追踪等级设为最高)运行《赛博朋克2077》的平均帧率为26fps,而将DLSS设为平衡之后,这款游戏的平均帧率直接翻倍,达到52fps。
下面我们再来看看RTX 3060的游戏性能处于怎样的水平。首先和“同门师兄”RTX 3060 Ti相比,RTX 3060的综合游戏性能落后约22%,而和上一代GPU相比,RTX 3060的综合游戏性能则位于RTX 2070 SUPER和RTX 2060 SUPER之间。具体来说,RTX 3060的综合游戏性能落后RTX 2070 SUPER约5%,并且领先RTX 2060 SUPER约14%。
至于RTX 2060,我们的测试成绩显示RTX 3060的综合游戏性能领先35%以上。需要说明的是,我们在测试过程中发现RTX 2060在4K分辨率下运行部分参测游戏时存在显存容量不足的问题,因此其部分测试成绩与RTX 3060差距非常大。而拥有12GB GDDR6显存的RTX 3060在在4K分辨率下运行参测游戏时则没有出现显存容量不足的情况。由此来看,RTX 3060在4K分辨率下运行游戏还是能够体现其12GB显存的优势。
散热性能及功耗测试
图片
在这个测试环节中,我们使用Furmark让RTX 3060达到满载,并进行了半个小时的烤机测试。GPU-Z的侦测结果显示,我们本次测试的这款RTX 3060在烤机半个小时之后的核心温度为61℃,还是比较清凉。而在功耗方面,ZAI 烤机半个小时之后,整个测试平台的总功耗约310W,比RTX 3060 Ti和RTX 2070 SUPER的功耗都要低一些,同时与RTX 2060 SUPER和RTX 2060处于同一水平,另外我们也建议入手这款RTX 3060的玩家为它搭配额定功率为500W的电源。
Resizable BAR功能体验
想要体验Resizable BAR功能,玩家首先需要拥有一款支持该功能的主板(例如MC本次测试使用的ROG CROSSHAIR VIII DARK HERO),同时在主板的BIOS中打开“Abobe 4G Decoding”选项,并将“Re-Size BAR Support”设为“Auto”。玩家在完成BIOS设定之后,可以在NVIDIA控制面板的系统信息中查看Resizable BAR是否成功开启。对于Resizable BAR是否能够带来游戏性能提升,我们也在《看门狗:军团》中进行了测试。
我们首先使用这款游戏的基准测试程序,在2.5K分辨率和最高画质,以及光线追踪设为“适量”,DLSS设为“性能”之后进行了测试。结果显示,在关闭Resizable BAR时,RTX 3060运行《看门狗:军团》的平均帧率为53fps,而当开启该功能之后,其游戏帧率提升至57fps,性能提升幅度约7.5%。此外,我们还在实际游戏的过程中对比了Resizable BAR开启前后的游戏帧率。结果显示关闭Resizable BAR时的游戏帧率为83fps,开启该功能之后的平均帧率上升至89fps。由此可见,Resizable BAR的确可以提升游戏性能。
图片
▲玩家完成BIOS相关设定之后,可以在NVIDIA控制面板的系统信息中查看Resizable BAR是否成功开启。
超频性能初探
最后,我们还考察了RTX 3060的超频性能。经过反复调试之后,参测这款RTX 3060的核心Boost频率可提升至2010MHz,显存等效频率可提升至17024MHz。在上述设定下,它顺利完成3DMark Fire Strike Ultra场景测试,并且其GPU分数达到5491分,相比超频前提升约9%。
图片
▲我们使用iGameCenter对这款RTX 3060进行了手动超频
图片
▲这款RTX 3060的核心Boost频率可提升至2010MHz,显存等效频率可提升至17024MHz,并顺利完成3DMark Fire Strike Ultra场景测试。
图片
▲手动超频之后,这款RTX 3060的3DMark Fire Strike Ultra GPU分数达到5491分,相比超频前提升约9%。
巩固主流市场霸主地位,GTX 1060“终极”升级方案
如果说RTX 2060是一款“光追尝鲜卡”,那么RTX 3060就是玩家目前在1080p分辨率下享受流畅“光追体验”的最优解。因为我们的测试成绩显示,RTX 3060完全能够在1080p和最高画质下为玩家提供非常流畅的“光追游戏体验”,其最新的NVIDIA Ampere架构、性能强悍的第二代RT Core和第三代Tensor Core自然功不可没。值得点赞的是,这款GPU还具备在2.5K分辨率下(最高画质,并开启光线追踪和DLSS),以超过60fps的绝对流畅帧率运行部分光追游戏的实力,这也在一定程度上满足了部分游戏玩家想要体验2.5K分辨率下更清晰游戏画面的愿望。
值得一提的是,从MC的测试结果来看,参与本次RTX 3060首发测试的所有非公版显卡均能轻松将核心Boost频率超到2GHz以上,并且还能带来比较明显的性能提升。所以我们认为,对于那些有超频需求的主流玩家来说,RTX 3060还是具备较高的可玩性。此外,根据RTX 3060的超频测试结果来看,我们认为其核心Boost频率设定(1777MHz)或许略显保守。当然,这是单纯就超频测试结果而言,NVIDA制定一款GPU的频率设定方案时,自然要考虑其性能定位、产品架构组成等诸多因素。总而言之,RTX 3060或许是NVIDIA目前在超频方面最具可玩性的一款GPU。
接下来我们再来聊聊这款GPU比较特别的12GB GDDR6显存。或许很多玩家在RTX 3060发布之时就对其12GB显存的配置表示不解,毕竟其显存容量比RTX 3080还多,同时还是RTX 2060的两倍。其实在我们的游戏性能测试成绩中,RTX 3060在4K分辨率下运行部分游戏时,其12GB显存的优势已经有所体现,只是大多数主流玩家更多时候使用的都是1080p和2.5K分辨率,所以RTX 3060的12GB显存或许很难给大多数玩家带来游戏体验上的升级。
不过除了游戏领域,我们认为RTX 3060的12GB显存在内容创作领域更具优势。特别是当创作者需要处理更高分辨率的视频时,或者是在一些需要多开应用的工作,以及在渲染更加复杂的模型时,RTX 3060的12GB显存就能大展身手。那么对于那些更加纯粹的游戏玩家来说,12GB显存或许很难完全利用,这难免是一种资源浪费。因此,我们认为NVIDIA应该随后会推出搭载6GB显存的RTX 3060,从而以更高的性价比来满足那些纯粹的主流游戏玩家。
从Steam在2020年12月进行的硬件调查结果来看,使用GTX 1060玩游戏的玩家仍然占比最高。换而言之,这款上市快5年的显卡依旧在继续服役,并且仍然得到了众多主流游戏玩家的认可。不过随着新上市的游戏对GPU性能的需求越来越高,GTX 1060在面对一些3A游戏大作时已经显得游戏力不从心。特别是随着光线追踪的进一步普及,享受光线追踪和DLSS带来的更逼真且流畅的游戏体验才是当下潮流。所以,对于那些还在使用GTX 1060的游戏玩家来说,RTX 3060就是你们的“终极”升级方案。
下面咱们再来聊聊价格。RTX 3060的首发价格为2499元。根据往年的市场行情来看,这一定价非常合理,同时也能够被绝大多数主流玩家所接受。不过综合当下的各方面因素来看,售价为2499元的非公版RTX 3060可能并不会太多,非公版RTX 3060的主流售价应该会在3000元~4000元这个价位区间。所以我们建议那些想要入手RTX 3060的玩家趁着有货且价格实惠的时候赶紧入手。
随着RTX 3060的上市,NVIDIA已经基本完成RTX 30系列从顶级到主流市场的产品布局,抢先在GPU市场进行布局也是NVIDIA的一贯作风。根据RTX 3060的综合表现来看,我们认为RTX 3060有实力帮助NVIDIA巩固其主流GPU市场的霸主地位,同时这款GPU也将继续帮助NVIDIA拓展其光线追踪和NVIDIA Studio生态圈。那么RTX 3060是否会像GTX 1060那样成为一款非常经典的游戏GPU呢?不妨让时间告诉我们答案吧!