21世纪的“石油”——AI算力

酷玩实验室

2021-07-14 10:32科技领域创作者

最近一段时间，各省高考成绩已经陆续出来了，几人欢喜几人愁。

此时，填报什么专业最有前途（钱途），成为家长和考生最关心的问题。

图源：中国教育在线

2020年度，普通高等学校本科专业备案和审批结果显示，目前新增备案专业数量最多的学科是人工智能，包括清华大学、北京语言大学、华北电力大学在内的100多所高校新增了人工智能专业。

新增人工智能专业的部分学校/图源教育部

可见，火了这么多年的人工智能依然备受高校重视和考生欢迎。

同时，人工智能也备受市场期待。据中国信通院数据研究中心测算，2020年中国人工智能产业规模为3031亿元，同比增长15.1%，占全球市场规模近三成。

而在这背后，再次引发了人们对人工智能的各种“经典”讨论：人工智能的未来是什么样的？人工智能究竟能不能带来新一轮生产力革命？

算力，21世纪的基础设施

2001年，电影《AI》上映，影片中，人们可以制造出具有情感的机器人。

电影《AI》剧照

20年后的今天，虽然这一目标还未实现，但我们早已离不开了人工智能。

比如内容推荐、智能质检、远程医疗、智慧交通……

智能质检/图源松山湖智能制造

可见，21世纪，人工智能正在成为新的生产工具，算力已成为新生产力，数据成为新生产资料。

18世纪的蒸汽机、19世纪的电力、20世纪的计算机，三次工业革命，带来三次生产力提升。

但纵观下来，这三次革命都有一个共同的特点——蒸汽、电力、带宽，都演变成了当时的基础设施。

瓦特改良的蒸汽机模型/图源网络

而算力作为21世纪的新生产力，能否成为基础设施？

基础设施，“普惠性”和“大众化”是其主要特征，也就是说一要便宜，二要让更多人用得上，比如电、燃气。

人工智能算力符合么？

为什么建设人工智能计算中心？

当前我国的人工智能算力最大的一个问题之一就是太分散，因为一些企业选择了自建人工智能计算中心。

而另一些尚未建设人工智能计算平台的企业，面对人工智能浪潮下的数字化转型，却不知道如何下手。

于是，国家主导投资建设的人工智能计算中心应运而生。

一中心四平台

以“一中心四平台”支持产业发展：一中心是指计算中心，四平台是指公共算力服务平台、应用创新孵化平台、产业聚合发展平台、科研创新和人才培养平台。

往小了说是端到端打通“政”“产”“学”“研”“用”全产业链，算力以集群赋能产业集群，帮助企业进行数字化转型、提质增效。

人工智能计算中心作用

往大了说就是把人工智能算力打造成如同水、电、气一样的基础设施，通过普惠的算力促进我国经济与产业发展融合、支撑国家战略任务落地。

简言之，就是像发电站那样，为万千企业输送算力。

用现在的惯用行语就是“赋能”。

那么，人工智能计算中心打造的集中算力能成为基础设施么？分散算力为什么不行？

究其原因，无非与制约人工智能产业进程的三个维度分不开：大模型训练、模型训练时间、效率与成本。

集中算力支持训练大模型

AI模型的训练对于产业发展的意义毋庸置疑。

而AI模型尤其是大模型的训练就需要大算力的支撑，如今AI模型训练所需要的算力平均每100天就会翻番，2012年至2019年算力需求翻了30万倍。

GPT-3模型参数 1750亿/图源机器之心

今年以来，大模型层出不穷，而且一个比一个大，GPT-3模型参数 1750亿，鹏程·盘古大模型参数2000亿。

鹏程·盘古2000亿级中文预训练大模型/图源机器之心

然而，期间AI算力的增长远远落后于需求的增长速度，人工智能计算中心则能满足这一增长需求。

此前鹏城实验室基于昇腾AI基础软硬件平台的人工智能大科学装置——鹏城云脑，就是很好的实践落地。

其推出的全球首个千亿参数预训练中文模型：鹏程—盘古大模型，可以实现支持“一带一路” 常见的79 种语言。

因此，集中算力支持训练大模型，分散算力不支持。

集中算力节约模型训练时间

上世纪初，汽车还是奢侈品的标志，即便是美国，普通民众想买一辆汽车，也十分困难。

但一款汽车的问世，彻底改变了这种情况。

1908—1927年间这款车卖出了1500万辆，一度占了美国当时汽车市场份额的56%以上。

该款汽车名为福特T型轿车，当时售价仅为260美元/辆，而当时美国工人的平均工资是每年200-400美元之间，高收入群体的律师和牙医，平均收入是2000-2500美元。

福特T型轿车/图源网络

按照购买力算，这款车的价格妥妥的是现在我们的五菱宏光水平。

表面上看，是价格拉低了汽车售价，让汽车从奢侈品变成了大众品。

深一层，则是流水线的功劳，当时美国生产一辆汽车的时间需要700多个小时，而福特T型采取流水线作业之后，仅需12.5个小时，售价从几千美最终降到了260美元。

到了今天，汽车流水线甚至1分钟就能生产出一辆汽车。

汽车流水线/图源汽车之家

类比一下，集中算力训练模型就如同流水线团队协作，而分散算力由于“单兵”特征，效率自然不高。

经过测算，人工智能计算中心的集中算力拥有1024个节点，可使同样的模型由原先拥有8个节点的分散算力的203分钟提速至1.48分钟，极大缩短训练时间，增加训练效率。

因此，从模型训练时间上来看，集中算力模型训练时间短。

集中算力效率更高

自从共享概念流行起来之后，共享汽车、共享办公室等共享经济模式层出不穷。

集中算力可以简单理解为共享经济的一种——共享算力。

事实上，集中算力正发挥着“共享模式”的高利用率优点。据测算，企业分散的小算力利用率仅为10%-15%，浪费严重，而人工智能计算中心的算力利用率在80%以上。

为何差距这么大？

因为企业分散算力难以共享，当业务量不饱和的时候，就会闲置。有人说，可以少部署一些算力不就行了？还真不行，不仅要有足够的算力，还要有备用的，用于应对业务变动。

人工智能计算中心机房/图源长江日报

而人工智能算力中心的公共算力池，可以让多个企业使用公用，用多少取多少，这个企业用完，另一个企业可以继续用，闲置率低，利用率也就高了。

比如，武汉人工智能计算中心，在2021年5月31日投运后一直都是满负荷运行，基本实现了闲置率“归零”。

图源：湖北新闻

成本方面，国家主导的人工智能计算平台充分利用集约土建、电力、运维优势，降低了总体建设和运维成本。

因此，从效率和成本上看，集中算力资源利用率高，规模效应后的费用更低。

人工智能，我们输不起

总而言之，无论是进行数字化转型的传统企业，还是新兴人工智能企业，面对不断增加的算力成本，自身算法团队很难支撑起越来越复杂的现实业务需求。

因此需要一个低门槛、开放、端到端的人工智能算力中心，采用集中算力，降本增效。

目前，除了武汉之外，成都、南京等地的人工智能计算中心已开工建设，不久之后，就会与我们见面。

南京人工智能计算中心发布仪式/图源我苏网

这只是开始，而后，除了这些地方，更多人工智能计算中心将会在全国各地出现。

这些，足以说明我国对人工智能算力的重视程度。

不仅我国，纵观全球，至少有50多个国家把人工智能当做国家战略。

图源：中国信息通信研究院和人工智能与经济社会研究中心

不过，算力作为新的生产力，也面临许多挑战，需要落实集中算力的普惠功能，真正发挥出“电力”和“石油”的作用，为产业提供源源不断动力。

用得上，用得起，用得好的算力资源，才是真正的变革生产力的基础设施。

18世纪的人，理解不了电力的重要性；19世纪的人，理解不了互联网的重要性；20世纪的人，理解不了人工智能的重要性。

21世纪，人工智能，这个未来科技竞争制高点，必须抢占。因为，一旦落后，就是整个生产力的落后。

而我们，不会再让落后两次工业革命的惨痛经历，再次发生。

查看原图 358K