寒武纪之战:成立仅4年,能扛起中国芯片产业的大旗吗?

英特尔今年52岁,AMD今年51岁,英伟达今年27岁,而寒武纪只有4岁。曾经也是追赶者的三星从1974年到1987年足足亏了13年,才在存储芯片领域做出了一点成就。

出品 光子盒研究院

上世纪50年代,成就了“20世纪最伟大发明”的“晶体管之父”的肖克利博士,有著名的八大门徒。这八位青年科学家后来离肖克利而去,集体成立了仙童半导体公司,肖克利怒不可遏地骂他们是“八叛徒”(The Traitorous Eight)。

在仙童期间,以诺伊斯为首的“八叛徒”在晶体管的基础上设计出了基于硅的IC(集成电路),他本人与德州仪器的基尔比并称“集成电路之父”。

后来由于仙童公司的经营问题,“八叛徒”分道扬镳,这八位均在未来成为了赫赫有名的硅谷大佬,其中有两位诺伊斯和摩尔于1968年创办了在今天大名鼎鼎的IT巨头——英特尔。

乔布斯(左)与诺伊斯(右)

1978年英特尔发布了新款16位微处理器8086,也同时开创了一个新时代:X86架构诞生了。X86指的是微处理器执行的计算机语言指令集,定义了芯片的基本使用规则。而真正将X86架构发扬光大的是英特尔另外两位合作伙伴——IBM和微软。

1981年IBM生产出了世界上第一台PC,它的处理器和操作系统分别选择了当时并非一流的英特尔和微软。出人意料的是,各个并非一流的组件组合成强大的产品,风头盖过产业先驱苹果公司。

世界上第一台PC

在盖茨的建议下,IBM开放架构允许其他计算机制造商仿制和改进,使得IBMPC成为世界标准,这就是IBM兼容机的由来。让IBM始料不及的是,PC厂商百花齐放,而操作系统和CPU却是微软和英特尔一枝独秀。

借着IBM PC的影响力,英特尔与微软开始坐大,成为IBM兼容机厂商的供货商,并逐渐在眉来眼去中形成了事实上的Wintel联盟。

90年代英特尔推出了具有划时代意义的奔腾芯片系列,而微软则“珠联璧合”地推出了Windows95。从那时起,大部分PC都采用了英特尔的X86处理器,而微软的Windows是主流的操作系统。

曾有PC厂商老总无奈地说,“卖一台PC能赚100元,其中英特尔拿去了70元,微软拿去了40元。”而这种无奈,正是世纪之初国家下定决心要造中国人自己的CPU的直接动力。

溃败

1999年,在专家加强对国内芯片企业支持力度的提议下,当时的国家经贸委政策司与信息产业部组成联合小组,并起草了相关芯片企业优惠政策条款,这些条款最终在2000年6月形成了《鼓励软件产业和集成电路产业发展的若干政策》(18号文)。

受到使命感召,大批有海外留学经验、在顶级芯片公司工作多年的半导体人才,在这一时期回到中国。90年代末,先后任职于摩托罗拉、日立(美国)的李德磊,回国成立一家百拓立克(BBT)公司,主要靠李德磊介绍外包业务。

1997年,离开摩托罗拉的李德磊加入日立,担任微处理器设计总监,BBT承接的外包业务也从摩托罗拉转向后者,主要做基于日立芯片的相关业务。

1999年,李德磊通过内部消息得知,日立美国要停止外包给BBT的一切项目。此时李德磊想到了一个人——联想集团前总工程师倪光南,并询问后者的建议。李德磊在80年代进入中科院计算所读研时,倪李二人便已相熟。

联想集团前总工程师倪光南

倪光南提出了自己的看法,“虽然当时日立的项目没做完,但我发现通过这个项目,BBT在编译器设计、芯片设计以及操作系统设计方面的人才积累已经很完善,基本具备自主研发CPU的技术能力。”而拥有一支做CPU的完整技术队伍,是倪光南梦寐以求的。

李德磊同意了倪光南的建议。2000年3月8日,北京中芯微系统技术有限公司(“方舟科技”前身)在京注册成立。倪光南帮助李德磊找钱、找政府、找资源,用自己的信誉和国产芯片巨大的前景,打动了一位热心的深圳民营企业家,后者立即拍板投资2000多万元。

那时,倪光南又找回了在联想时的研发热情。作为倪光南助手的梁宁在日后回忆道:“倪光南院士给我讲方舟CPU+Linux操作系统,做成瘦客户机NC,‘云+端’解决方案,替代Wintel架构的时候,我当时兴奋得紧紧攥住拳头……”

有了CPU和SOC(系统级芯片)的技术,政府给的钱也到位了,2001年4月,第一片中国人自己设计的嵌入式芯片“方舟1号”问世。国家几个部委召开了盛大新闻发布会,主办单位阵容豪华,多个部委代表出席。这在中国工程院历史是破天荒的第一次。

李德磊手持方舟芯片

货真价实的芯片造出来了,然而真正的考验才刚刚开始……

梁宁在《一段关于国产芯片和操作系统的往事》中谈及,做CPU最难的不是开发,而是要在Wintel之外建立一个全新的游戏规则。方舟不是写不出英特尔那样的设计,而是他们打不起官司。

自英特尔成立那天起,专利保护就是其核心竞争力之一,当2000年中国决定自主研发CPU时,英特尔几乎把X86体系相关的专利全注册了。对方舟团队来说,不是X86体系的技术难度高,而是在这条路上的每一步,都会遇到英特尔的专利。

所以,倪光南做的技术路线选择是,走RISC结构,做嵌入式,绕开X86体系。

CPU是做出来了,但是根本没有一家下游企业可以使用。当时生产主板的中国厂商拿着方舟的CPU做不了产品原型开发,一直都是基于英特尔或它的设计工厂(design house)的公板进行再开发。也就是说,方舟芯片没有它的目标客户。

显然,我们与英特尔的差距不是一块CPU,而是一个基于CPU的开发生态系统。

无奈之下,方舟在做完CPU后,又建立硬件团队,自己做出了公板,做出了NC的产品原型,终于可以交付市场……当时为了支持NC,北京市政府直接订购了几万台NC机。北京市副市长刘志华专门把各个行业的头召集起来,“逼着”他们支持推广NC。

NC主要靠政府推,李德磊认为只要做好政府就行了,不需要什么市场推广。在连续拒绝了前两家客户后,2002年经政府牵线搭桥,脱胎于联想集团的神州数码成为方舟真正意义上的第一家客户。

2002年11月4月,双方召开了盛大的新闻发布会,神州数码于当天宣布正式推出基于方舟1号的网络计算机。有媒体以“迎接PC时代后的NC风潮”为标题报道了这场发布会。

2002年《e点天下》杂志

2002年12月,方舟2号系统级芯片高调上市。联想、京东方、泰丰、长城等知名厂商纷纷跟进。到2003年,在政府采购中胜出的网络计算机均采用了方舟系列芯片。

但是NC的缺点显然易见,Linux系统的操作复杂性姑且不论,更关键是没有任何配套软件可用。Windows早期依托IBM PC成为最普遍的操作系统,所有的配套软件都围绕Windows进行开发,而这些软件均不能被Linux兼容。

为了解决这一问题,当时北京市先后发起了“扬帆计划”“启航计划”,针对Linux桌面的13大类50多个问题,在全国进行招标,包括浏览器、OFFICE、播放器等,召集中国的所有Office高手一起破解微软的文档格式,以期能读能存。

但是效果不好,用户体验极差,纷纷要求换回Wintel。比如当时重点推广NC的学校,一有领导来视察,这些校长就嚷嚷“NC不能用啊,让我们换PC吧”。启航计划的破产,也宣告了内嵌方舟芯片的NC彻底失败。

随着NC被逐步证明并不适用,从2003年底开始,NC从政府采购中淡出。方舟CPU的销售也开始受到影响,财务状况持续恶化。2004年被曝出挪用1538万科研基金,方舟科技接受调查,CPU停止开发。两年后汉芯骗局败露,国产芯片事业跌入谷底。

时至今日,在PC端,Windows+X86 CPU的格局依然无法打破。目前商业化做的最好的海光、兆芯,其主打产品还是X86 CPU,而且性能远不如英特尔和AMD的产品。而与方舟走同一条路的龙芯,研发历程长达19年,至今仍未实现商业化。

蛰伏

2001年5月,中科院计算所的龙芯课题组正式成立,毕业于中科大的胡伟武博士是该项目的首席科学家。

与方舟不同的是,龙芯团队并没有做CPU方面的经验,没有海外留学经历,胡伟武更将自己戏称为“土鳖派”。此外,胡伟武启用了大量学生,处于一种边学习边开发的状态

2002年,年仅19岁的陈云霁从中科大少年班毕业,凭借优异的成绩,来到中科院计算所硕博连读,他的导师正是胡伟武博士。

当时由于龙芯研发人手短缺,胡伟武将19岁的陈云霁安排进了龙芯研发团队,成为团队中最年轻的成员。而陈云霁也如福星一般,就在他加入团队的这个夏天,我国首款通用CPU龙芯1号代号X1A50流片成功。

因为技术不成熟、学生比例较大的缘故,龙芯项目的进程相对缓慢,从龙芯1号到3号历时7年时间,直到2010年龙芯中科公司成立,才开始产业探索。项目进程缓慢,对于陈云霁有一个好处就是在芯片开发领域打下坚实的基础。

就这样,陈云霁在龙芯团队一待就是12年,24岁取得中科院计算所博士学位,29岁晋升为研究员。目前国内最新的计算机体系结构教材,就是胡伟武和陈云霁在2011年合作编写的。

陈云霁还有一个小两岁的弟弟陈天石。自认为不输于哥哥的陈天石,2001年16岁的他追随哥哥的脚步来到中科大少年班。本科毕业后,颇具天赋的陈天石顺利进入中科大计算机系读研究生,并一直读到博士毕业,人工智能成为他的主攻方向。

陈云霁(左)与陈天石(右)

因为爱人在北京的关系,陈天石读博的最后一年,经常跟导师找借口说去北京计算所做基础研究。一来二去,陈天石渐渐熟知了哥哥所负责的龙芯项目,并且得到了胡伟武的赏识。

博士毕业后,胡伟武邀请陈天石加入龙芯工作。虽然他在此前完全没有处理器架构相关的基础知识,但是盛情难却,陈天石最终还是答应了。

但在当时,人工智能远没有现在火热,计算所大都选择做芯片,陈天石在计算所感觉无用武之地。终于,厌倦了画版图的陈天石,产生了一个非常“不靠谱”的想法:

既然自己从事人工智能的研究,而且计算所又有芯片研发的基础,是不是可以将AI和芯片结合在一起呢?

兴奋不已的陈天石将这个“不靠谱”的想法告诉了哥哥陈云霁,没想到二人一拍即合。就这样,陈天石、陈云霁决定联手做人工智能和芯片设计的交叉研究。尽管芯片设计落后发达国家几十年,人工智能同样落后几十年,但是AI+芯片,陈氏兄弟称得上是先驱者。

在计算所所长李国杰院士的支持下,2012年,陈云霁、陈天石带着几个计算所的师弟,包括后来在寒武纪任高管的刘少礼、郭崎、刘道福、杜子东等,以及首次提出“AI加速器”概念的Olivier Temam教授,启动了神经网络处理器(AI芯片)项目,这也是寒武纪的技术来源。

项目命名非常直白,就是汉语拼音DianNao(电脑),据说是在Olivier教授的建议下定的这个名字,与其取一个平淡的英文名字,还不如反其道而行用中文的拼音来命名,这样对外国人来说是“外语”,他们反而会觉得十分“洋气”。

2014年3月,陈氏兄弟团队公开提出国际首个深度学习处理器学术架构DianNao,该学术论文获处理器架构领域顶级国际学术会议ASPLOS最佳论文奖,这是亚洲学术研究成果首获处理器架构领域顶尖会议最佳论文。

同年12月,团队在DianNao的基础上公开提出国际首个多核深度学习处理器学术架构DaDianNao,该学术论文获处理器架构领域顶级国际学术会议MICRO最佳论文奖。这也是MICRO自1963年创办以来,第一次由美国以外的研究者摘得该奖项。

后来,团队又相继开发出了PuDianNao(普电脑,通用机器学习处理器)、ShiDianNao(视电脑,图像识别处理器)等。2016年发布国际首个智能处理器指令集Cambricon ISA,最初命名为DianNaoYu(电脑语)。

首个智能处理器指令集Cambricon ISA

2015年,陈云霁入选年度《麻省理工科技评论》35岁以下的全球最佳35名创新人士,又在第二年荣获中国青年科技奖和中科院青年科学家奖。

破局

在论文获得国际学术界的认可之后,陈氏兄弟团队的研究工作开始得到更多关注。2015年,团队获得了中科院先导专项数千万元的资助,在这笔资金的支持下,仅20人的研发团队研发出世界首款深度学习专用处理器原型芯片。

2015年12月,陈云霁以“深度学习处理器芯片”为名申报的项目入围苏州工业园区第九届科技领军,获领军人才称号。缘于苏州工业园区的推荐,陈云霁得以结识元禾原点的投资人乐金鑫,并给后者留下了深刻印象。元禾原点也成为寒武纪的天使投资人之一。

2016年3月,北京中科寒武纪科技有限公司在中关村注册成立,行事谨慎的陈天石担任公司CEO,而陈云霁选择继续在计算所搞科研,为寒武纪的首席科学家。

之所以将公司命名为“寒武纪”,根据陈天石介绍,“‘寒武纪’这个地质纪年是生物多样性大爆发的时代,这项科研成果之所以取这个名字,就是希望人工智能也能像生命一样出现大爆发。

而“寒武纪”也的确名副其实,公司在成立当年就发布了世界首款终端人工智能专用处理器(寒武纪1A),面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,并入选世界互联网大会评选的十五项“世界互联网领先科技成果”。

寒武纪1A处理器支持视觉、语音、自然语言处理等多种智能任务,一经推出便被华为看中,集成到华为海思的麒麟970芯片中。麒麟970被公认为全球首款内置独立NPU(神经网络单元)的智能手机AI计算平台,而NPU指的就是寒武纪1A处理器。

华为麒麟970芯片发布会

寒武纪1A在计算机里用虚拟的神经元和虚拟的突触把他们联结在一起,构成多层次的人工神经元网络。在语音识别和视频识别领域里,它的识别精度已经超越了人类。每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的1/10。

2017年10月,首款采用麒麟970的华为手机Mate 10正式发布,这是全球手机行业首次引入人工智能概念。后来的事实证明,搭载寒武纪1A的华为麒麟970以每分钟识别2005张照片击败了苹果A11芯片每分钟的889张照片。

麒麟970名声大噪,寒武纪也因此一炮而红,拿到了上亿元的订单。同时,寒武纪获得了国投创业、阿里巴巴、联想创投、国科投资等共计1亿美元的A轮融资,成立仅一年时间,寒武纪估值已达10亿美元,成为全球智能芯片领域诞生的第一个独角兽公司。

2017年11月,寒武纪发布了第二代终端处理器:寒武纪1H16和寒武纪1H8,以及面向开发者的人工智能软件平台Cambricon NeuWare。与上一代1A相比,寒武纪1H16具备更高性能、更低能耗,能效比达到了1A的2.3倍,而寒武纪1H8对比1H16又有更低的功耗和成本。

2018年5月,寒武纪再接再厉,发布了第三代终端处理器寒武纪1M,在台积电7nm工艺下8位运算的效能比达每瓦5万亿次运算,是1A性能的10倍,可广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域当中。

同时,寒武纪发布了第一代云端AI芯片思元MLU100(MLU:机器学习处理器)以及搭载MLU100的云端智能处理卡。MLU100芯片标志着寒武纪成为世界上少数几家,同时也是中国第一家同时拥有终端和云端智能处理器产品的商业公司。

2019年11月,随着边缘AI系列产品思元220芯片及加速卡产品的发布,寒武纪已形成全面覆盖云端、边缘端和终端场景的系列化智能芯片产品布局。

寒武纪主要产品

从方舟1号到寒武纪,相比于第一代“芯片人”的切肤之痛,寒武纪确实打开了芯片事业的新局面,在芯片和人工智能都不占先的情况下,创造性地将二者结合,并在短时间内掌握世界领先的技术。

未来

2020年3月,公司成立4周年之际,寒武纪出现在了科创板的上市名单之中,这家智能芯片领域的独角兽公司也终于浮出水面。

2017年、2018年寒武纪营业收入分别为784.33万元、1.17亿元,几乎全部来自华为。不过研发费用更高,分别为2985.19万元、2.40亿元,导致两年累计亏损了4.22亿元。

2019年开始,华为发布自研AI手机芯片麒麟810,开始避开支付给寒武纪的技术成本,同时华为海思也与ARM合作开发基于ARM Trillinum框架的AI技术。这就导致寒武纪2019年来自华为的营收减至6365.80万元。

招股书显示,寒武纪已将华为海思列入竞争对手的范围以及风险提示。

危机之下,寒武纪及时转身。2017年、2018年寒武纪的营业收入主要来自终端AI芯片的IP授权费用;而2019年,寒武纪拓展了云端智能芯片和加速卡、智能计算集群业务和相应的新客户,如服务器厂商、云服务厂商、企业和地方政府等。

2019年,寒武纪营业收入4.44亿元,相比2017年增长了50倍。亏损11.79亿元主要来自股权激励和研发费用,2019年寒武纪研发费用5.43亿元。截至2020年2月29日,寒武纪已获授权的专利有65项,正在申请中的专利有1474项。

尽管开支巨大,寒武纪的现金流依然充沛。招股书显示,共计46.68亿的资产中,货币资金3.83亿元,其他流动资产(结构性存款及理财)为39.20亿元。

寒武纪巨额亏损,很多人就开始慌了,毕竟中国人在芯片上吃过太多的亏。但今时不同往日,国内芯片研发的大环境要远远好于过去,科创板允许亏损企业上市就是最好的佐证。

要知道罗马不是一天建成的,更何况还是起步更晚的芯片事业。曾经也是追赶者的三星从1974年到1987年足足亏了13年,才在存储芯片领域做出了一点成就。纵观国外芯片巨头,英特尔今年52岁,AMD今年51岁,英伟达今年27岁,而寒武纪只有4岁。

既然有了远大的目标,便只顾风雨兼程。陈云霁说,“寒武纪的长期奋斗目标是,让人工智能芯片计算效率提高一万倍,功耗降低一万倍。”

-End-

1930年秋,第六届索尔维会议在布鲁塞尔召开。早有准备的爱因斯坦在会上向玻尔提出了他的著名的思想实验——“光子盒”,公众号名称正源于此。