RTX3070明日上市,AI训练性能前瞻、官方基准测试公布

|匠心 | 专业 |

致力让数字科技助力未来发展

专注为人工智能、边缘计算、影视后期、动漫设计、商务应用等领域,提供基于人脸识别、深度学习、视觉计算、VR/AR/MR、桌面虚拟化、存储及数据可视化等信息化解决方案及相关服务。

NVIDIA RTX 3070公版GPU的评测已于昨晚解禁,根据外媒的前瞻测试结果,RTX 3070与上一代的RTX 2080 Ti相比略有优势。29日,RTX 3070就将正式发售,对比3080/3090,显然其价格更适配主流人群所需。

1080P、4K帧率基准测试

外媒tom'sHARDWARE分别在1080p、2K和4K分辨率下测试了RTX 3070的平均帧率。在三种不同分辨率下,RTX 3070均与RTX 2080 Ti 帧率持平,OC模式下则小超2080 Ti。

其实评测成绩不能单看游戏性能,NVIDIA早就给出过RTX 3070的官方性能成绩,测试环境包括渲染软件、基准软件等,综合看下来,大概领先RTX 2080 Ti8%左右。

虽然名为GeForce RTX 3070,但完全拥有挑战80级显卡的芯。媲美上一代卡皇GeForce RTX 2080 Ti,但售价仅需3899元,这一点性能提升就已经很超值了。

AI训练性能前瞻

RTX 3070的GA104核心174亿个晶体管,拥有5888个Cuda核心,并且包含第二代RT Core和第三代Tensor Core。RTX 3070不仅拥有更多的晶体管,还优化了负责实时光线追踪加速的RT Core和深度学习超采样DLSS的Tensor Core,导致专项性能有2至8倍的提升。

通常来说,深度学习对GPU显存的要求如下:

研究 SOTA 模型:≥11GB

一般的研究:8GB

Kaggle 及其它竞赛:4 - 8GB

公司业务:8GB 部署及原型测试,≥11GB 用于训练

对应到RTX 30系列显卡来说,可将3070(8GB显存)/3080(10GB显存)/3090(24GB显存)对号入座。

Tensor Core可以极大地加快矩阵乘法,深度学习优先使用 Tensor Core进行训练。由于RTX 架构的Tensor Core可以半精度(16bit)进行训练,显存需求减半,所以相比GTX显卡在同样的显存下可以训练大一倍的模型,因此除非预算极度有限,应该优先考虑RTX 20/30系列显卡。一张显卡有多少Tensor Core决定了这张显卡的算力,而Tensor FLOPS则量化了显卡的算力。