做GPU 他们是认真的!摩尔线程MTT S80显卡首发评测

摩尔线程(MOORE THREADS)是谁?
2020年10月,北京望京的一间共享办公室里,张建中正在与十几位员工开会,正是这次平常的会议,改变了国产显卡市场的格局,这就是摩尔线程(MOORE THREADS)的雏形。而成立短短100天后,这家公司便已经完成数十亿元的融资,这源于张建中所带领的一支技术团队。
图片
张建中这个名字有点陌生,但是提到James Zhang大家都很熟悉,他在NVIDIA拥有超过十年的任职时间,曾任NVIDIA全球副总裁兼中国区总经理。摩尔线程成立之初就致力于构建中国视觉计算及人工智能领域计算平台。
2022年3月底,摩尔线程推出MUSA(Metaverse Unified System Architecture)统一系统架构以及基于MUSA架构打造的第一代多功能GPU芯片苏堤,还有面向PC和工作站的桌面级显卡MTT S60和专为数据中心打造的图形渲染和计算卡MTT S2000,可以说首次发布新品就震惊业界,展示了这家初创公司的技术底蕴和研发速度。
图片
半年之后的2022年11月3日,对于显卡市场,尤其是国产游戏显卡行业,绝对是载入史册的一天。因为摩尔线程推出了业内首款国潮游戏显卡MTT S80,基于MUSA架构,使用第二代GPU芯片MT-春晓,重要的是MTT S80大方地在发布会现场演示了游戏DEMO,并且不是“PPT”,目前已经开启了上市销售。
图片
作为摩尔线程首款“国潮游戏显卡”,MTT S80不仅是MADE IN CHINA,就连显卡的包装都充满了中国风,金色祥云纹图案显得高端大气上档次。下面我们就来看看这款产品的实力如何。
硬件规格超越RTX 3060 首款PCIe Gen5接口显卡
MTT S80采用的MT-春晓芯片集成220亿个晶体管,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度。拥有4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。
图片
MTT S80还是业内首款配备PCIe Gen5x16接口的显卡产品,匹配了16GB GDDR6大容量显存,256bit位宽,显存带宽高达448GB/s,理论PCIe带宽和显存带宽高于RTX 3060。
图片
输出接口方面,MTT S80提供了3个DisplayPort 1.4a和1个HDMI 2.1,最高支持8K@30Hz与1080P 360Hz显示输出。
图片
图片
设计方面,摩尔线程MTT S80采用铝合金外壳,三风扇设计,尺寸为285mmx112mmx49mm,厚度2.5 slot。做工还是非常不错的,细节处理的也很到位,包括壳体的磨砂处理,以及风扇位置的高亮切边,提升了整块卡的质感。
图片
图片
供电方面,MTT S80布置在了顶部侧边,这个位置对于机箱内的理线无疑更加友好。但要注意的是使用8pin的CPU供电,必须使用附带的转接线进行转接,不能直接插PCI-E的模组线缆,最高功耗约255瓦。
图片
图片
背板上的近似摩尔线程LOGO型开孔还配有摩尔橙配色的主题灯效,虽然目前还不支持调节灯光,但据了解是预留了调节插口的,后续更新后有望支持更多灯光的设定。
图片
图片
驱动程序方面,目前官方的驱动程序适配Windows以及Linux操作系统,Windows 10下安装完驱动程序之后,就可以看到PES(Perfect Experience System)控制中心了。这个程序的界面设计非常清爽,首页为显卡的参数信息,以及GPU利用率、核心频率、GPU温度及显存利用率等状态信息。
图片
设置选项卡中可以进行分辨率、刷新率、监视浮窗、快捷键等的设置。监视浮窗可以显示FPS、GPU利用率、频率等信息,可以随时通过快捷键进行呼入,方便玩家们检测游戏运行时显卡的工作状态。整体来看,虽然是1.0版本,但PES的UI设计、交互逻辑还是值得肯定的,非常容易上手。
图片
本次测试采用支持PCIe 5.0的B660M平台与英特尔第12代酷睿i7-12700K处理器,以下测试部分均基于此平台,分别使用Windows 10专业版64位和Ubuntu 20.04两个操作系统进行。
能不能玩游戏?游戏适配怎么样?
有关注摩尔线程的用户,相信肯定注意到在摩尔线程MTT S80的发布会上,现场演示了暗黑破坏神3和极品飞车14热力追踪两个游戏的运行效果,虽然这两个游戏确实比较老,但现场演示的其实是4K分辨率下的高画质画面,能做到流畅运行其实并不是那么容易的事情。
图片
《暗黑破坏神3》游戏画面
事实上,MTT S80的推出使得摩尔线程成为国内率先支持Windows环境和DirectX图形接口的GPU公司,这一点已经值得称赞。目前,MTT S80的Windows驱动已经内置了MUSA DirectX Driver模块,测试中已经能够运行几十款游戏,其中《暗黑破坏神3》《英雄联盟》《穿越火线》等十多款已经完成了优化适配。
图片
我们也试玩了几款游戏,表现如上。在《暗黑破坏神3》游戏中,整个游戏过程的流畅度还是值得肯定的,平均游戏帧率为118帧,游戏体验还是非常有保障的。英雄联盟游戏中,平均游戏帧率为139帧。无论是走位,单人对线,还是多人团战,整体游戏画面还是很流畅的。多人团战特效相对多的场景下,帧率有所降低,但也基本能保持在60FPS以上,游戏可玩性不必担心。
图片
《极品飞车14热力追踪》游戏画面
《极品飞车14热力追踪》游戏中,整个画面也值得肯定,无论是画质,还是帧率表现,都表现的可圈可点。
综合来看,目前摩尔线程对于游戏的适配还处于初期阶段,当前适配的都是DX10和DX9的游戏,不过MTT S80在硬件上是支持DX11的,待驱动完善之后,使用DX11及更新API接口的游戏适配以后,就能畅玩像《绝地求生》《永劫无间》等热门游戏了。
图片
《生化危机6》游戏运行画面
这里附上目前可以运行在摩尔线程MTT S80上的游戏列表,包括13款适配游戏和60余款兼容游戏。
图片
据了解,摩尔线程正在与Unreal和Unity等游戏引擎开发商以及腾讯游戏、网易游戏、西山居、完美世界、360游戏等游戏开发商展开深度合作,以便对游戏引擎和游戏产品提供更好更快的支持,让玩家能够获得持续更新的3A级游戏体验。摩尔线程Windows驱动及MUSA DirectX版本也将持续更新,实现更多游戏的兼容与性能优化。
理论性能测试 硬件性能尚没有发挥出全部实力
关于MTT S80的理论图形性能,我们也在Windows环境和Linux环境下进行了测试。
首先提到GPU,大家可能第一时间想到3DMARK,但由于最新的3DMARK采用DX11/DX12引擎,MTT S80目前的驱动版本尚不支持,因此我们使用了比较老的3DMARK 06来进行DirectX的图形测试。
图片
图片
在1080p分辨率的设定下,MTT S80取得了23373的总成绩,这个成绩大约可以达到GTX 1650的一半左右,但是在纹理填充率项目中是超过GTX1650的。其中单纹理填充率为151.44 GTexels/s,多纹理填充率为194.2 GTexels/s,就MTT S80的硬件基础来看,驱动对硬件的优化还不够充分,显然是没有发挥出完全性能的。
图片
在Unigine Valley的测试中,在DirectX 9、超高质量、x8反锯齿、1920*1080p分辨率的设定下,测试结果得分为1490分,平均FPS为35.6,如果后续驱动程序继续优化的话,还有继续提升的空间。
图片
正如前述,摩尔线程MTT S80作为首款采用PCIe 5.0通道与高速显存的国产游戏显卡,硬件的性能上限其实很高,我们在Ubuntu环境下进行了显存带宽、浮点计算性能以及PCIe接口带宽的运算测试。
图片
实测MTT S80的显存带宽可以跑到372GB/s,相比理论带宽可以发挥出85%的性能;单精度浮点运算算力高达13.9 TFLOPS,两项成绩均超出了RTX 3060。
图片
关于PCIe接口带宽方面,我们使用MUSA MemoryCopyRate在Ubuntu环境下进行了测试,测得最高H2D下行带宽为28.95 GB/s,D2H上行带宽最高为42.45 GB/s,比PCIe 4.0x16的带宽要高出33%左右。
图片
需要指出的是,由于MTT S80图形API接口优化的问题,目前Windows平台的GPU-Z和GPU Caps Viewer还不能完整显示MTT S80的信息,同样的由于MTT S80在Windows平台下还不支持OpenGL 2.0,因此FurMark暂时无法运行的,目前还不能通过这个软件来进行满载功耗与温度方面的测试。
图片
MTT S80 GPU TEST Plot3D@Linux
因此我们在Ubuntu系统下测试了MTT S80的OpenGL图形性能,使用了可以运行在Linux环境GPU Test软件,主要包括衡量显卡压力的Furmark、用于像素着色器渲染的Piano和顶点着色器渲染的Plot3D三个场景。
图片
测试显示,Furmark与Piano两个场景下MTT S80的成绩接近RTX 3050,Plot3D场景下的表现要好很多,超出RTX 3050,与12GB显存的RTX 3060相比,仅有11%左右的差距。
不仅仅是游戏卡 MTT S80还有更多本领
除了备受关注的游戏性能,其实MTT S80能做的远不止这些。正如前述,摩尔线程的发展路径从一开始就是全功能GPU,游戏、视频、AI一样都不少。因此这个章节我们就来看看MTT S80在视频编解码方面的表现,由于软件的适配问题,此部分测试仍然在Ubuntu环境下进行,非大家在Windows系统上常见的典型工作流。
图片
MTT S80视频编码测试 左H.264 右H.265
首先,我们输入一个大小为1.4GB的YUV视频源文件,采用为50路1080P并行执行的设置,分别使用H.264和H.265编码,共编码5500帧。
图片
MTT S80视频解码测试
接下来,我们使用四段视频文件进行编码测试,四段视频均为1920*1080p分辨率,分别为容量为116MB的AV1编码webm格式、容量为53MB的H.264编码MP4格式、容量为26.2MB的H.265编码格式以及容量为49MB的vp9编码MP4格式视频*。为了给GPU尽量大的负载压力,我们采用20路视频并行执行的设置。
图片
MTT S80视频转码测试
视频转码部分,我们也进行了H.264转H.265的测试,视频源文件仍为上述四个类型*,设置为20路视频并行执行,最终编码、解码、转码的统计如下表所示。
图片
最后还要提出的一点是,借助摩尔线程开发的CUDA ON MUSA兼容方案,用户可以将CUDA上开发的代码无缝迁移到MTT S80。有了这个强大的开发工具,软件开发者可以将使用CUDA语言开发的代码经过重新编译后,运行在MUSA的显卡上。
图片
此外,摩尔线程还对MUSA软件栈进行了深度性能优化,推出自研AI推理引擎TensorX,兼容PyTorch、TensorFlow、Jittor等多种深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的加速。
图片
通过AI能力,在MTT S80上可以运行AIGC内容生成器——马良,这个软件支持中英双语的图文生成、图文编辑,只需发挥你的想象即可生成专属于你的艺术作品。有个MTT S80,不必花费巨大成本去采购AI服务器,只需一张显卡即可实现艺术创作,培养兴趣,甚至是用来生成CG无版权图片,用于商业创作,是一个非常有意思的零门槛AIGC创作平台。
解决了有没有的问题后 期待摩尔线程腾飞
大家都知道,半导体行业具有技术门槛高、资金投入大、研发周期长的特点,尤其是GPU芯片,更是一项系统性工程,涉及硬件架构、驱动开发、软件生态等方面,研发壁垒高,产业链长。特别是游戏显卡,想要做成是非常困难的一件事,它的难度不仅在于显卡本身的设计指导,更难的部分是如何开发驱动程序,如何做好各种图形API、游戏、软件的适配,建设生态,是比产品开发本身更难的事情。
图片
我们很高兴看到像摩尔线程这样的公司能够有勇气投身这一行业,挑战GPU赛道。摩尔线程MTT S80的发布上市可以说是国产GPU行业的里程碑事件,这意味着我们自己的显卡能玩游戏,能处理视频负载,能进行AI创作,解决了“有没有”的关键问题。而且未来还有更大的成长优化空间,“好不好”的问题留给时间。
诚然目前MTT S80的游戏适配广度不够,驱动优化也有很大空间,但我们相信这是一块可以进化的显卡,随着软件层面的工作继续推进,假以时日,MTT S80会越来越好用,从MTT S80上我们感受到了摩尔线程做GPU是认真的!同时我们也要理性地看待国内GPU产业的发展,毕竟尚处于早期阶段,“一口吃个胖子”是不现实的。面临着芯片设计、底层驱动开发等诸多关键性问题,整个行业应该守望互助,加强协作,早日繁荣壮大。
图片
正如摩尔线程创始人兼CEO张建中所说:“GPU创业是一个长期事业,充满了挑战。元宇宙的时代,图形与AI将成为开启新时代的密钥,赋予科技前所未有的想象。山再高,向上攀,总能登顶!”
我们希望摩尔线程能如这番豪言壮语那般,努力向上,带动GPU行业,带动国产GPU厂商共同成长,共同繁荣显卡市场,为元宇宙和数字经济提供核心动力。