21世纪的“石油”——AI算力

最近一段时间,各省高考成绩已经陆续出来了,几人欢喜几人愁。
此时,填报什么专业最有前途(钱途),成为家长和考生最关心的问题。
图片
图源:中国教育在线
2020年度,普通高等学校本科专业备案和审批结果显示,目前新增备案专业数量最多的学科是人工智能,包括清华大学、北京语言大学、华北电力大学在内的100多所高校新增了人工智能专业
图片
新增人工智能专业的部分学校/图源教育部
可见,火了这么多年的人工智能依然备受高校重视和考生欢迎。
同时,人工智能也备受市场期待。据中国信通院数据研究中心测算,2020年中国人工智能产业规模为3031亿元同比增长15.1%,占全球市场规模近三成。
而在这背后,再次引发了人们对人工智能的各种“经典”讨论:人工智能的未来是什么样的?人工智能究竟能不能带来新一轮生产力革命
01
算力,21世纪的基础设施
2001年,电影《AI》上映,影片中,人们可以制造出具有情感的机器人。
图片
电影《AI》剧照
20年后的今天,虽然这一目标还未实现,但我们早已离不开了人工智能。
比如内容推荐、智能质检、远程医疗、智慧交通……
图片
智能质检/图源松山湖智能制造
可见,21世纪,人工智能正在成为新的生产工具,算力已成为新生产力,数据成为新生产资料。
18世纪的蒸汽机、19世纪的电力、20世纪的计算机,三次工业革命,带来三次生产力提升。
但纵观下来,这三次革命都有一个共同的特点——蒸汽、电力、带宽,都演变成了当时的基础设施
图片
瓦特改良的蒸汽机模型/图源网络
而算力作为21世纪的新生产力,能否成为基础设施?
基础设施,“普惠性”和“大众化”是其主要特征,也就是说一要便宜,二要让更多人用得上,比如电、燃气。
人工智能算力符合么?
02
为什么建设人工智能计算中心?
当前我国的人工智能算力最大的一个问题之一就是太分散,因为一些企业选择了自建人工智能计算中心。
而另一些尚未建设人工智能计算平台的企业,面对人工智能浪潮下的数字化转型,却不知道如何下手。
于是,国家主导投资建设的人工智能计算中心应运而生。
图片
一中心四平台
“一中心四平台”支持产业发展:一中心是指计算中心,四平台是指公共算力服务平台、应用创新孵化平台、产业聚合发展平台、科研创新和人才培养平台。
往小了说是端到端打通“政”“产”“学”“研”“用”全产业链,算力以集群赋能产业集群,帮助企业进行数字化转型、提质增效。
图片
人工智能计算中心作用
往大了说就是把人工智能算力打造成如同水、电、气一样的基础设施,通过普惠的算力促进我国经济与产业发展融合、支撑国家战略任务落地。
简言之,就是像发电站那样,为万千企业输送算力
用现在的惯用行语就是“赋能”。
那么,人工智能计算中心打造的集中算力能成为基础设施么?分散算力为什么不行?
究其原因,无非与制约人工智能产业进程的三个维度分不开:大模型训练、模型训练时间、效率与成本
03
集中算力支持训练大模型
AI模型的训练对于产业发展的意义毋庸置疑。
而AI模型尤其是大模型的训练就需要大算力的支撑,如今AI模型训练所需要的算力平均每100天就会翻番,2012年至2019年算力需求翻了30万倍。
图片
GPT-3模型参数 1750亿/图源机器之心
今年以来,大模型层出不穷,而且一个比一个大,GPT-3模型参数 1750亿,鹏程·盘古大模型参数2000亿
图片
鹏程·盘古2000亿级中文预训练大模型/图源机器之心
然而,期间AI算力的增长远远落后于需求的增长速度,人工智能计算中心则能满足这一增长需求。
此前鹏城实验室基于昇腾AI基础软硬件平台的人工智能大科学装置——鹏城云脑,就是很好的实践落地。
其推出的全球首个千亿参数预训练中文模型:鹏程—盘古大模型,可以实现支持“一带一路” 常见的79 种语言
因此,集中算力支持训练大模型,分散算力不支持。
04
集中算力节约模型训练时间
上世纪初,汽车还是奢侈品的标志,即便是美国,普通民众想买一辆汽车,也十分困难。
但一款汽车的问世,彻底改变了这种情况。
1908—1927年间这款车卖出了1500万辆,一度占了美国当时汽车市场份额的56%以上。
该款汽车名为福特T型轿车,当时售价仅为260美元/辆,而当时美国工人的平均工资是每年200-400美元之间,高收入群体的律师和牙医,平均收入是2000-2500美元。
图片
福特T型轿车/图源网络
按照购买力算,这款车的价格妥妥的是现在我们的五菱宏光水平。
表面上看,是价格拉低了汽车售价,让汽车从奢侈品变成了大众品。
深一层,则是流水线的功劳,当时美国生产一辆汽车的时间需要700多个小时,而福特T型采取流水线作业之后,仅需12.5个小时,售价从几千美最终降到了260美元。
到了今天,汽车流水线甚至1分钟就能生产出一辆汽车。
图片
汽车流水线/图源汽车之家
类比一下,集中算力训练模型就如同流水线团队协作,而分散算力由于“单兵”特征,效率自然不高。
经过测算,人工智能计算中心的集中算力拥有1024个节点,可使同样的模型由原先拥有8个节点的分散算力的203分钟提速至1.48分钟,极大缩短训练时间,增加训练效率。
因此,从模型训练时间上来看,集中算力模型训练时间短。
05
集中算力效率更高
自从共享概念流行起来之后,共享汽车、共享办公室等共享经济模式层出不穷。
集中算力可以简单理解为共享经济的一种——共享算力。
事实上,集中算力正发挥着“共享模式”的高利用率优点。据测算,企业分散的小算力利用率仅为10%-15%,浪费严重,而人工智能计算中心的算力利用率在80%以上。
为何差距这么大?
因为企业分散算力难以共享,当业务量不饱和的时候,就会闲置。有人说,可以少部署一些算力不就行了?还真不行,不仅要有足够的算力,还要有备用的,用于应对业务变动。
图片
人工智能计算中心机房/图源长江日报
而人工智能算力中心的公共算力池,可以让多个企业使用公用,用多少取多少,这个企业用完,另一个企业可以继续用,闲置率低,利用率也就高了。
比如,武汉人工智能计算中心,在2021年5月31日投运后一直都是满负荷运行,基本实现了闲置率“归零”
图片
图源:湖北新闻
成本方面,国家主导的人工智能计算平台充分利用集约土建、电力、运维优势,降低了总体建设和运维成本。
因此,从效率和成本上看,集中算力资源利用率高,规模效应后的费用更低。
06
人工智能,我们输不起
总而言之,无论是进行数字化转型的传统企业,还是新兴人工智能企业,面对不断增加的算力成本,自身算法团队很难支撑起越来越复杂的现实业务需求。
因此需要一个低门槛、开放、端到端的人工智能算力中心,采用集中算力,降本增效。
目前,除了武汉之外,成都、南京等地的人工智能计算中心已开工建设,不久之后,就会与我们见面。
图片
南京人工智能计算中心发布仪式/图源我苏网
这只是开始,而后,除了这些地方,更多人工智能计算中心将会在全国各地出现。
这些,足以说明我国对人工智能算力的重视程度。
不仅我国,纵观全球,至少有50多个国家把人工智能当做国家战略。
图片
图源:中国信息通信研究院和人工智能与经济社会研究中心
不过,算力作为新的生产力,也面临许多挑战,需要落实集中算力的普惠功能,真正发挥出“电力”和“石油”的作用,为产业提供源源不断动力。
用得上,用得起,用得好的算力资源,才是真正的变革生产力的基础设施。
18世纪的人,理解不了电力的重要性;19世纪的人,理解不了互联网的重要性;20世纪的人,理解不了人工智能的重要性。
21世纪,人工智能,这个未来科技竞争制高点,必须抢占。因为,一旦落后,就是整个生产力的落后
而我们,不会再让落后两次工业革命的惨痛经历,再次发生。