华为盘古大模型3.0正式发布！一句对话生成代码，还能解决世界难题

极果

2023-07-10 14:50发布于北京极果官方账号

在ChatGPT的火热在全球掀起一股新的AI浪潮背景下，国内的科技巨头们也开“卷”了，据统计，我国10亿级参数规模以上大模型已超80个，不过其中通用大模型较多，应用型大模型较少。

而华为作为国内早早就开始布局大模型的科技公司，如今又向业内扔下一记“重锤”！今天，华为开发者大会2023（Cloud）在中国东莞正式揭开帷幕，在下午举行的大会主题演讲中，华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0。

与百度的文心一言、阿里的通义千问不同，盘古大模型强调在细分场景的落地应用。

比如“盘古药物分子大模型助力发现世界40年来首个抗生素”、“盘古气象大模型相比传统数值预测方法速度提升10000倍，能够提供秒级的全球气象预报”等等，可以看出盘古主要解决商业环境中低成本大规模定制的问题。

正如张平安所介绍的那样，盘古大模型不会写诗，只会做事。

具体来看，盘古大模型 3.0 是一个完全面向行业的大模型系列，包括 5+N+X 三层架构，几乎涵盖当前人工智能的各个主流方向。并且未来盘古大模型能成为每个行业、企业和个人都有自己的专家助手，让工作更轻松。

第一层L0层是盘古的5个基础大模型，包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型，它们提供满足行业场景的多种技能。

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型，匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集，包括 NLP 大模型的知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等能力，这些技能都可以供客户和伙伴企业直接调用。

第二层 L1 层是 N 个行业大模型，我们既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等；也可以基于行业客户的自有数据，在盘古的L0和L1上，为客户训练自己的专有大模型。

第三层 L2 层是为客户提供更多细化场景的模型，它更加专注于某个具体的应用场景或特定业务，为客户提供开箱即用的模型服务。

顺带一提，在 L0 和 L1 大模型的基础上，华为云还为客户提供了大模型行业开发套件，通过对客户自有数据的二次训练，客户就可以拥有自己的专属行业大模型。同时，根据客户不同的数据安全与合规诉求，盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

据介绍，盘古可以一己之力做到网络搜索、请教专家、参考案例、查阅书籍等，让每个开发者都拥有一个自己的编程助手，甚至还可以实现一句对话代码生成、一个按键用例测试、一次点击自动注释、一条指令智能部署，极大地简化了开发的流程。

“盘古为行业而生，就要为行业着想，更好地服务千行百业的客户。”张平安表示。如今，盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。

在煤矿领域，盘古矿山大模型已经在全国8个矿井规模使用，一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景，让更多的煤矿工人能够在地面上作业，不仅能让煤矿工人的工作环境更加舒适，而且可以极大地减少安全事故。

在铁路领域，盘古铁路大模型能精准识别现网运行的67种货车、430多种故障，无故障图片筛除率高达95%，成为货运列检员身边有力的数字助手，将列检员从每日数百万张的“图海”检测中解放出来。

在气象领域，盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型，同时预测速度也有大幅提升。原来预测一个台风未来10天的路径，需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型，通过AI推理的方式，研究者只需单台服务器上单卡配置，10秒内就可以获得更精确的预测结果。

7月6日，国际科技期刊《nature》刊发盘古气象大模型文章，审稿人称，“华为云盘古气象大模型让人们重新审视气象预报模型的未来，模型的开放将推动该领域的发展。”

在金融领域，盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练，能根据客户的问题，为柜台工作人员自动生成流程和操作指导，将原来需要平均5次的操作降低为1次，办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。

在制造领域，过去单产线制定器件分配计划，往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后，能够对业务需求进行准确的意图理解，并调用天筹AI求解器插件，1分钟即可做出未来3天的生产计划。

在药物研发领域，原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素，并将先导药物研发周期缩短至1个月、研发成本降低70%。

除具身智能的创新之外，盘古大模型已深度融入华为自身的资料服务、云客服、BI、云搜索等内部服务中，重构的华为云产品与服务。华为云也和很多互联网的合作伙伴做了创新实践。

比如美图公司旗下的美图设计室，上线了基于盘古大模型的AI试衣SaaS应用。它可以让一件衣服匹配多种真实模特，直观看到不同模特的上身效果。盘古大模型生成的模特更真实、更自然，媲美真人模特效果，服装图片制作时间由天级降至秒级，缩短上架周期，帮助服装行业高效运营。在信息服务行业，天眼查基于盘古大模型也获得了不错的效果。

整体来看，华为本次发布的盘古大模型3.0，围绕行业重塑，技术扎根，开放同飞三大方向，持续打造核心竞争力，未来华为会更加专注于具体的应用场景或特定业务。

目前，华为云AI在各行业有超过1000个项目，盘古大模型能够更好地落地在行业主业务场景。

华为云人工智能领域首席科学家田奇还在演讲中表示，生成式AI是智能化升级的新浪潮，大模型是生成式AI的核心。但目前全球基于大模型开发ToB应用的企业还不到三分之一，行业中的海量业务场景迫切需要更多专业的大模型和专业的AI应用来解决，来弥补通用大模型落地行业的不足。

为了应对这一挑战，华为云基于实践打造了分层解耦的大模型架构，加速大模型落地千行百业。

同时这次大模型的创新不仅仅是模型自身的创新，更依赖于AI的各项根技术创新。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台，以及异构计算架构CANN、全场景AI框架昇思MindSpore，AI开发生产线ModelArts等，为大模型开发和运行提供分布式并行加速，算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术，大模型训练效能可以调优到业界主流GPU的1.1倍。

在本次大会上，张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外，还支持Pytorch、Tensorflow等主流AI框架，实现极致效能，打造世界AI另一极。

张平安表示：“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手，让工作更高效更轻松。我们始终坚持AI for Industries的战略，在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业，而每一个开发者，都将是改变世界的英雄。”

查看原图 561K