技嘉RTX 4080 SUPER GAMING OC 魔鹰显卡评测

在今年的CES 2024上,NVIDIA进一步完善了RTX 40系列显卡品类——带来了GeForce RTX 40 系列SUPER显卡。就在今天,GeForce RTX 40系列的第九款显卡——NVIDIA GeForce RTX 4080 SUPER正式到来。
全新的GeForce RTX 4080 SUPER GPU在游戏、创作和日常工作等方面提供革命性的AI性能,再配合基于RTX GPU构建的丰富软件加速库,可使显卡的AI性能再进一步增强。
图片
本次我们为大家带来技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡的性能实测,来看看这款RTX 4080 SUPER显卡在外观、做工、散热等方面的表现如何,并实际测试RTX 4080 SUPER在AI制图、3D渲染等方面有怎样的表现,游戏性能跟RTX 4080以及上代的RTX 3090 Ti相比能领先多少,与RTX 4090还有多少的性能差距。
图片
GPU-Z检测下的技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G参数信息
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡拥有10240个流处理器、112个光栅处理单元、320个纹理单元、64MB L2缓存,显卡核心频率为2295-2595MHz,电源输入接口为16pin(12+4)。采用16GB GDDR6X显存,显存位宽为256-bit,显存带宽736.3GB/s,等效速率为23Gbps。
规格方面,与RTX 4080显卡相比,RTX 4080 SUPER显卡CUDA核心数量从9728个增加到满规格的10240个,增幅为5%。基准、加速频率分别提升90MHz、50MHz,TGP保持不变。
图片
RTX 4080 SUPER所使用的AD103-400 GPU
RTX 4080 SUPER所使用的是完整的AD103 GPU核心,采用TSMC 4N工艺制程,核心面积为379mm2,整合459亿晶体管。共拥有7个GPC,其中6个GPC内包含6个TPC,另外1个GPC内包含4个TPC,每个TPC拥有两组SM,共计为80组SM,即10240个CUDA。
RTX 40系列SUPER显卡优势简析
图片
要说NVIDIA GeForce RTX 40系列GPU最让人惊艳的技术,那一定非DLSS 3莫属了。
DLSS 3帧生成技术由GeForce RTX 40系列GPU所搭载的全新第四代Tensor Core和光流加速器提供动力支持,通过在DLSS 2超分辨率技术的基础上增加了AI驱动的帧生成技术,可利用AI创建更多帧并提高图像质量,在让游戏画面更加逼真的同时,大幅度提升游戏帧率。
图片
NVIDIA于2023年8月底正式发布了DLSS 3.5,该技术加入了全新的光线重建(Ray Reconstruction,简称RR),其主要功能是用NVIDIA超级计算机训练的AI网络取代人工设计的降噪器效果,使采样光线之间生成更高质量的像素,从而显著提升所有GeForce RTX GPU的光线追踪图像质量。
在实际游戏中,开启光线重建后的光照变得更加精确,游戏画质更加清晰,细节更为丰富,同时重影更少,并且在光线条件发生剧烈变化时响应更快。
图片
GeForce RTX 40系列GPU所采用的Ada架构能够充分释放光线追踪的强大优势,可模拟真实世界中的光线特性。借助GeForce RTX 40系列GPU和第三代RT Core的强劲性能,可以让玩家在虚拟世界中可以体验到未曾感受过的惊艳细节。
目前为止已有超过500款游戏与应用支持NVIDIA RTX技术,NVIDIA官方也是开启RTX 500活动以庆祝这一里程碑式的成果。
图片
除了游戏方面之外,GeForce RTX 40系列GPU在AI方面也拥有十分亮眼的表现,搭载专用AI Tensor核心,配合十分受视频创作者欢迎的Studio剪映、将简单线条转化为逼真风景图的NVIDIA Canvas、直播应用NVIDIA Broadcast、AI制图Stable Diffusion、以及光线追踪3D渲染器D5 Render等软件,可为用户提供强大性能和革新功能,轻松做到提升创作能力,提高工作效率。
技嘉RTX 4080 SUPER魔鹰显卡外观(一)
图片
本次测试使用的是技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡,魔鹰是技嘉旗下定位中高端的显卡系列,该系列显卡在性能、散热、外观与售价之间做到了很好的平衡。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡配件,除了基本上算是必备的16pin转3*8pin的转接线之外,还有一个定制显卡支架。该支架为这款显卡量身定做,在让显卡可以更加稳定安全输出的同时,其样式与配色还和显卡外观十分契合,可以轻松与显卡融为一体。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡的配色以黑色为主,正面采用磨砂质感外壳,辅以各种斜线条修饰,整体外观低调内敛又不失个性。显卡尺寸为342*150*75mm,可以兼容大部分机箱。
图片
显卡采用三风扇散热设计,拥有三个110mm的导流风扇。导流风扇可以使气流由风扇边缘分流,并平滑引导气流通过扇叶表面的3D条纹曲线。风扇采用纳米石墨烯润滑油,该润滑油在有效延长风扇使用寿命的同时,还能让风扇转动的更加安静。
风扇采用正逆转设计,相邻风扇的旋转方向不同,可有效减少扰流并增加气压。显卡风扇支持自动停转功能,当温度较低时风扇会停止工作,游戏开始后温度上升,风扇将自动恢复旋转。智能启停在有效减小噪音的同时,还能增加风扇使用寿命,为玩家提供更佳的使用体验。
技嘉RTX 4080 SUPER魔鹰显卡外观(二)
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G侧面设计有GIGABYTE RGB信仰灯,中间则为GEFORCE RTX标识。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G采用12+4pin电源接口
电源接口下方设计有供电指示灯,当遇到异常供电时,指示灯会通过频繁闪烁来提醒玩家。
图片
显卡输出接口为标准的3*DP 1.4a + 1*HDMI 2.1a组合
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡采用造型强化金属背板,该背板可以有效提升显卡结构强度与静电防护能力,保护显卡PCB。
背板尾部设计有一个超大的风窗,让风扇的气流可以以较低阻力穿透鳍片和背板,从而实现更高效的散热。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡采用双BIOS设计,拥有OC(性能)与SLIENT(静音)两种模式,可在显卡背面进行调节,默认是OC模式。
技嘉RTX 4080 SUPER魔鹰灯光效果
图片
显卡采用RGB幻彩光轮,支持1680万色彩调节与多种灯光效果切换,可以通过技嘉智能管家进行自定义灯效设置。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡点亮实拍
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡点亮实拍
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡点亮实拍
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡点亮实拍
技嘉RTX 4080 SUPER魔鹰显卡拆解
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G PCB板
显卡的PCB板要比散热模组短一些,配合开孔背板与三风扇设计,让显卡可以迅速排出内部热量,使显卡性能得到充分发挥。
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡PCB正面主要散热部位都覆盖有高效导热贴,能够把显存和供电元件的温度快速传导到散热模块上,加速排出显卡内部产生的热量。
图片
RTX 4080 SUPER所使用的AD103-400-A1核心
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡核心供电部分
显卡采用16+3相供电设计,显卡每个MOSFET都拥有过温保护设计,确保显卡能够持续稳定工作,保证显卡性能发挥。
图片
显存部分
GPU核心周围排布了8颗来自美光的GDDR6X显存颗粒,单颗容量为2GB,共计16GB显存。显存位宽为256-bit,显存带宽为736.3GB/s。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G采用风之力散热系统,该系统拥有三个110mm导流风扇,配合直触GPU的纯铜底座、9根复合式热管、进气格栅等,使显卡能够将GPU核心热量迅速传递出去,让显卡拥有更快的热传递速度,噪音更低的同时,散热效能更加强大。
图片
通过拆解可以发现,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡在供电、散热方面的料堆的很足,为显卡性能的充分发挥打下了良好的基础。
测试平台与测试方法介绍
图片
测试平台一览
图片
测试项目一览
技嘉智能管家 (GCC)
图片
GIGABYTE CONTROL CENTER (GCC) 首页
技嘉智能管家GIGABYTE CONTROL CENTER (GCC) 是一款适用于所有GIGABYTE产品的统一软件,该软件拥有直观的界面与较为丰富的功能体验。通过软件可实时调节显卡的频率、电压、风扇模式、RGB灯效、以及功耗等,让玩家可以轻松掌控显卡状态。
图片
GIGABYTE CONTROL CENTER (GCC)RGB灯效调节界面
图片
GIGABYTE CONTROL CENTER (GCC)风扇控制界面
图片
GIGABYTE CONTROL CENTER (GCC) 性能调节界面
3DMark基准测试
图片
3DMark Fire Strike测试
图片
3DMark Fire Strike Extreme测试
图片
3DMark Fire Strike Ultra测试
图片
3DMark Time Spy测试
图片
3DMark Time Spy Extreme测试
3DMark光追、DLSS测试
图片
3DMark Port Royal测试
图片
3DMark DirectX光线追踪功能测试
NVIDIA GeForce RTX 40系列显卡的一大变化就是新增了对DLSS3技术的支持,DLSS3在前代DLSS的基础上,通过光流加速推断下一帧生成的目标画面,使传统CUDA算力得到极大的节省,让GPU在应对高分辨率实时渲染游戏时可以更加游刃有余,与不使用DLSS相比,理论上游戏性能的提升可高达4倍。 DLSS3由于Frame Generation的加入,它的理论帧数性能能达到原先DLSS2的双倍,这使得GeForce RTX 40系显卡能够以更小的压力用高分辨率高画质运行所有支持DLSS3的游戏。
图片
3DMark DLSS3功能测试
图片
3DMark DLSS2功能测试
在3D MARK DLSS的测试项中,4K分辨率下,关闭DLSS的测试结果十分接近,然而开启DLSS后(Performance),技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡在4K分辨率下DLSS3可提升235%的性能,远超DLSS2 159%的提升。
DLSS 3.5游戏《2077》、《心灵杀手2》实测
由于RTX 40系列显卡最具价值的优势就是新增了对DLSS3的支持,因此游戏测试环节我们选择6款支持DLSS3,并且其中两款还支持最新DLSS 3.5的游戏大作来进行游戏性能对比测试。
我们通过分别测试显卡开启DLSS3(RTX 40系列)、DLSS2(RTX 30系列),与关闭DLSS后的游戏性能,来看看RTX 4080 SUPER显卡比RTX 4080显卡能领先多少,与RTX 4090显卡有多少差距,DLSS3加持下的RTX 4080 SUPER能领先开启DLSS2的RTX 3090 Ti多少。
图片
4K分辨率《赛博朋克2077》游戏性能对比
图片
2K分辨率《赛博朋克2077》游戏性能对比
图片
4K分辨率《心灵杀手2》游戏性能对比
图片
2K分辨率《心灵杀手2》游戏性能对比
《消逝的光芒2》、《F1 22》游戏实测
图片
4K分辨率《消逝的光芒2》游戏性能对比
图片
2K分辨率《消逝的光芒2》游戏性能对比
图片
4K分辨率《F1 22》游戏性能对比
图片
2K分辨率《F1 22》游戏性能对比
《光明记忆》、《瘟疫传说》游戏实测
图片
4K分辨率《光明记忆:无限》游戏性能对比
图片
2K分辨率《光明记忆:无限》游戏性能对比
图片
4K分辨率《瘟疫传说:安魂曲》游戏性能对比
图片
2K分辨率《瘟疫传说:安魂曲》游戏性能对比
游戏测试小结:
通过测试我们可以发现,与RTX 4080相比,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡整体拥有2.24%的性能优势,并且建议零售价比RTX 4080下降1400元,确实做到加量还降价。
与上代旗舰RTX 3090 Ti显卡相比,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡的游戏性能优势明显,整体性能优势为43%,其中开启DLSS3后的实际游戏帧数提升高达55%,即便是不开启DLSS,也有25%的性能优势。
与当代旗舰RTX 4090相比,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡还是有一定差距的,实际游戏性能要低22%。
在实际游戏体验方面,4K分辨率最高画质与光追效果前提下,开启DLSS3质量后,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡表现得游刃有余,在当下唯二支持全景光线追踪的高画质游戏《赛博朋克2077》与《心灵杀手2》游戏中也能保证60+FPS的平均游戏帧数,可以为玩家带来流畅的游戏体验。
AI制图——Stable Diffusion测试
除了拥有出色的游戏性能之外,GeForce RTX 40系列GPU还逐渐成为了创作者的法宝,其中AI就是工作效率的倍增器。
图片
Stable Diffusion是一款热门的AI绘画生成工具,只需要输入一句话、或者特定的关键词,即可轻松生成一幅想要的图像。该软件基于AI计算,可广泛应用于平面和3D设计,通过借助扩散模型生成海量的图片,从而大幅缩短作图时间,显著提升效率。该软件由NVIDIA RTX GPU加速,显存容量越大,支持生成图像的分辨率越高,GPU级别越高,渲染速度越快。
图片
AI绘图工具Stable Diffusion支持TensorRT,TensorRT是NVIDIA推出的一款高性能深度学习推理SDK,可优化推理性能、加速各种工作负载,并支持大型语言模型推理。
在下载并引用相关插件后,即可在Stable Diffusion中增添“TensorRT”标签,之后再经过一系列设定,就能通过TensorRT来加速AI绘画。
本次测试所使用的显卡为:
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G
NVIDIA GeForce RTX 3090 Ti
测试选用模型为sd_xl_base_1.0_0.9vae.safetensors
测试中所选择的采样方法是Eular a,采样步数为50,图片宽度和高度为1024×1024,提示词相关系数为7,总批次数为10,单批数量为1,随机数种子为13(确保中可以生成相同的图像)。
图片
Stable Diffusion常规绘图(RTX 3090 Ti),总计用时173.3秒,平均每分钟可生成3.46张图像
图片
Stable Diffusion常规绘图(RTX 4080 SUPER),总计用时136.8秒,平均每分钟可生成4.4张图像
图片
经过TensorRT加速的Stable Diffusion绘图(RTX 4080 SUPER),总计用时63.5秒,平均每分钟可生成9.5张图像
通过对比测试可以发现,同样使用SD_XL进行Stable Diffusion常规绘图时,使用RTX 4080 SUPER显卡要比RTX 3090 Ti的性能强27%。而加入支持RTX 4080 SUPER的TensorRT加速后,RTX 4080 SUPER显卡的AI绘图效率大幅提升,对比RTX 3090 Ti高出175%,即便对比未开启TensorRT加速的RTX 4080 SUPER显卡本身,开启TensorRT加速后也拥有116%的效率提升,可以给予用户更加快速的AI生成体验。
3D光追渲染器——D5 Render测试
图片
D5 Render(D5渲染器)是一款免费的实时光线追踪渲染器,主打从事大型建筑或景观项目的3D设计师和专业人士。凭借先进的实时光线追踪技术、D5 GI全局照明解决方案、以及众多即用型资源,让D5 Render可以在更短时间内完成项目的同时,还具备高真实感。
图片
在最新一代的D5 Render中,加入了为实现逼真的光线追踪视觉效果而开发的NVIDIA DLSS 3.5,此次集成包含由AI神经网络提供支持的DLSS超分辨率、帧生成和光线重建功能。
其中光线重建是一种新的神经渲染AI模型,它可以通过为各种内容提供快捷的智能降噪解决方案,进一步增强光线追踪的视觉质量;而NVIDIA DLSS帧生成功能增强了光线追踪性能并提高了实时视窗帧速率,可带来更流畅的编辑体验,进而实现直观的交互式 3D 创建。
本次我们通过使用技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G与NVIDIA GeForce RTX 3090 Ti显卡来进行测试,来看看最新加入的DLSS 3.5对于D5 Render渲染有着怎样的增幅。
图片
D5 Render测试(RTX 4080 SUPER),开启DLSS3.5中的超分辨率采样+光线重建+实时高帧率,平均帧数为97FPS
图片
D5 Render测试(RTX 4080 SUPER),关闭DLSS3.5中的超分辨率采样+光线重建+实时高帧率,平均帧数为34FPS
图片
D5 Render测试(RTX 3090 Ti),开启DLSS3.5中的超分辨率采样+光线重建,平均帧数为44FPS
图片
D5 Render测试(RTX 3090 Ti),关闭DLSS3.5中的超分辨率采样+光线重建+实时高帧率,平均帧数为20FPS
可以看到使用RTX 4080 SUPER显卡开启DLSS 3.5中的全部选项之后,使用D5 Render渲染场景可以获得高达2倍的性能增幅。对比RTX 3090 Ti显卡,RTX 4080 SUPER开启DLSS 3.5中能够开启的选项后拥有120%的性能优势。在同样关闭DLSS 3.5内选项前提下,RTX 4080 SUPER对比RTX 3090 Ti也有70%的性能优势,可以给予用户更加流畅的创作体验。
网页视频用户福利——RTX VSR技术
相信大家在线看视频时,经常会遇到由于画面清晰度较低导致难以获得满意观影体验的情况。在以前,遇到这种情况的用户是束手无策的。然而随着RTX VSR技术的出现,上述问题已经可以得到妥善解决——使用GeForce RTX 40、RTX 30系显卡的用户可以借助RTX VSR技术对流媒体视频进行实时画面增强,从而显著提升观影体验。
图片
RTX VSR全称是RTX Video SUPER Resolution,它通过利用RTX GPU中Tensor核心做AI计算去对各个浏览器中经过压缩算法的视频移除块状压缩伪影,以达到提升分辨率和清晰度的目的。这项功能目前支持谷歌Chrome、微软的Edge等主流浏览器(要升级到最新版本),此外技嘉RTX 4080 SUPER GAMING OC魔鹰16G拥有双编解码器,还增加了对AV1的硬件编码功能,无论你是在B站、斗鱼还是其它什么平台上观看视频,它让视频质量值得你去匹配4K显示器。
图片
VSR的功能开关集成在了NVIDIA控制面板中,可以在“视频”下拉栏“调整视频图像设置”的界面中看到它——RTX 视频增强。勾选这个选项并点击应用,就可以开启RTX VSR了,它还支持优化级别的设置,默认为1,最高为4。
图片
通过逐级增加VSR算法的复杂性,最大可以将360p的视频优化到1440p的视觉效果,GPU的占用率也会随之提高,它与VSR的质量级别成正比。1~2级的GPU占用率较小,已经能明显改善视频质量,它对较低端的GPU也是十分友好的。
图片
视频分割线左侧为原视频画面,右侧为开启RTX VSR的画面,可以看出清晰度明显增强,几乎接近渲染CG的效果。
我们在网络上看到的视频绝大部分都是经过重新编码压缩的,降低容量的同时也会损失一部分质量。之前已有的视频锐化处理在提高清晰度的同时往往会失真,而RTX VSR则通过将NVIDIA Tensor Core与最先进的Al图像处理技术相结合,在智能锐化和强化特征与边缘的同时,还能消除恼人的压缩伪影,从而呈现出可媲美视频所标原生分辨率的优秀画质。
散热测试与结语
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡风扇支持空闲停转功能,该功能可以大幅降低显卡在低负载工作时的噪音,提升风扇寿命。
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡的散热表现出色,室温26℃,待机20分钟后的GPU温度为40.5℃,风扇处于静止状态。
图片
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡散热测试
我们使用FurMark烤机进行显卡的散热测试,测试方法为在显卡温度稳定一段时间后,观察显卡的最终温度。
烤机时间约为20分钟,显卡核心温度为63.6℃,显存温度为52℃,此时GPU的使用率为100%,当前功耗为318.4W。风扇负载为53%,转速为1883RPM。通过散热测试可以发现,技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡在散热方面的表现是十分出色的。
结语
作为NVIDIA GeForce RTX 40 SUPER系列的第三张显卡,RTX 4080 SUPER显卡的整体表现不俗,在价位比此前RTX 4080低1400元的基础上,CUDA核心增加5%,并且核心频率、显存带宽与等效频率等方面均有一定程度的提升,确实做到加量又降价。
游戏性能方面,在定价更低的前提下,RTX 4080 SUPER显卡的游戏性能可小幅超越RTX 4080,在4K分辨率最高画质游戏中可以达到60+FPS的平均游戏帧数,可以为玩家带来流畅的4K游戏体验。
在AI方面,NVIDIA专用的AI Tensor核心配合Stable Diffusion、D5 Render等软件,可以为用户带来更高的性能与效率,给予用户更加流畅的创作体验。
图片
本次评测的技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡外观低调内敛却不失个性,配合RGB幻彩光轮与RGB信仰灯效,颜值不错。
显卡用料扎实,16+3项的高规格供电设计配合加大面积的散热模组,再加上给力的风之力散热系统,使GPU可以长久保持在最佳的工作状态当中,为显卡持续高性能输出提供了极佳的发挥空间。显卡拥有高达4年的质保,使用起来毫无后顾之忧,是一款兼具外观、性能与散热的显卡产品。
技嘉RTX 4080 SUPER GAMING OC 魔鹰 16G显卡已经在各大电商平台上架,售价为8799元,适合喜欢RGB灯光环绕,对显卡的散热与静音有较高要求,并主打4K高画质游戏大作的玩家或对AI性能有较高要求的内容创作者。