ChatGPT火了,谷歌慌了,百度稳了

图片
图片来源@视觉中国
文 | 天辰光源
ChatGPT的横空出世让整个科技圈进入新的变革期。
2月8日凌晨,微软宣布推出由ChatGPT支持的新版搜索引擎必应及浏览器Edge,微软首席执行官萨蒂亚·纳德拉表示,搜索引擎迎来了新的时代。
作为应对,2月8日晚间,谷歌在巴黎举行AI发布会,向外界正式披露聊天机器人产品Bard(巴德),但在演示时却出现重大错误。
有用户问Bard:“该如何告诉一个9岁孩子关于詹姆斯·韦伯太空望远镜的发现?”巴德给出的答案其中有一条是:“韦伯太空望远镜拍摄了太阳系以外行星的第一批照片。”但随后,有天文学家指出,由欧洲南方天文台的甚大望远镜早在2004年就捕捉到了系外行星的图像。
国际市场打得火热,国内市场也开始升温。连日来,已有多家科技公司纷纷响应。
2月7日,百度确定将推出一款类ChatGPT项目,项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。2月8日,阿里巴巴证实正在研发类ChatGPT产品,目前处于内测阶段。2月9日,腾讯证实目前在类ChatGPT相关方向上已有布局,专项研究也在有序推进。同日,360创始人周鸿祎表态,如果企业搭不上ChatGPT这班车,很可能会被淘汰。
截至目前,从相关技术到项目名称再到开放日期,百度是公布信息最明确的国内科技公司。不仅如此,天辰光源获悉,百度CEO李彦宏2023年一季度OKR关键任务为“引领搜索体验的代际变革”,这意味着百度搜索或将全线接入文心一言,搜索产品将迎来颠覆性变化。
在近期流出的一份百度内部讲话中,李彦宏再次强调:“技术已经到了临界点,类似ChatGPT这样的技术如何运用在搜索场景上,未来一年,在这方面我们非常有机会”。
在全球,一场搜索引擎市场的大变局正在发生。在中国,谁能最先搭上ChatGPT这班车也呼之欲出。
实际上,ChatGPT从一出生就是冲着谷歌来的。
2015年,为了打破谷歌有望形成的垄断局面,美国人工智能公司OpenAI成立,背后汇集了美国创业孵化器Y Combinator总裁阿尔特曼、特斯拉总裁马斯克、PayPal联合创始人彼得·蒂尔、领英联合创始人里德·霍夫曼等多名科技大佬。
2019年,微软向OpenAI投资10亿美元,双方达成深度合作。2022年11月,OpenAI推出聊天机器人模型ChatGPT,发布仅5天,注册用户数就超过100万。截至2023年1月末,ChatGPT月活用户已突破1亿,成为历史上增长最快的消费应用。
2023年1月,微软宣布对OpenAI追加数十亿美元的投资,并将在旗下的Office和云服务中植入ChatGPT。
ChatGPT的迅速爆红让谷歌拉响“红色警报”。其实,真正让谷歌紧张的并不是核心技术落后的问题,而是“起个大早,赶了个晚集”。
可更焦虑的是,即便谷歌发布了ChatGPT的竞品,也会对自身的商业模式造成颠覆。
如今,谷歌慌忙展示Bard却遭遇大翻车,焦虑心无疑更重了。
再看竞争方面,微软和谷歌注定是一对天敌。
浏览器是微软最早涉足互联网的武器。1995年年底,微软创始人比尔·盖茨发出The Tide of Internet(互联网的大潮)长信后,微软开始扑向互联网,凭借将IE与Windows的捆绑式销售,IE成为了市场霸主,并形成了长期垄断地位。
1996年的春天,在斯坦福计算机系的“比尔·盖茨大楼”开幕典礼上,拉里·佩奇和谢尔盖·布林正老实的坐在台下,听比尔·盖茨发表演讲。不曾想,台下坐的这两个年轻人,在不远的未来会成为微软的对手,而他们的武器就是谷歌。
从搜索到广告、邮箱、视频、地图、移动服务、手机平台、数字出版、应用软件,谷歌势如破竹,几乎在所有的互联网关键应用上都有布局,与微软的业务也不断形成交叉,并渐显合围之势。
此次微软携ChatGPT以复仇者的身份又回到了战场,目的就是让“Google is done”。也许胜负一时难以分出,但鹬蚌相争渔翁得利,百度可以从中借鉴很多经验。
谁先搭车
不管怎样,ChatGPT的面世足以将人工智能乃至整个科技业带向新的高度,在这样的趋势下,科技公司势必会迎头跟上,正如360创始人周鸿祎的表态,如果企业搭不上ChatGPT这班车,很可能会被淘汰。
那国内谁能先搭上这班车?
目前,人工智能的技术栈可以分为四层:芯片层、框架层、模型层和应用层。ChatGPT处在技术架构的模型层,而训练一个千亿的大模型是对算力、算法、算据的全流程考验。
首先是算力,根据瑞银分析师Timothy Arcuri的说法,ChatGPT已导入至少1万颗英伟达高端GPU。
而对数据的训练则是来自互联网上公开的聊天记录和对话数据。
谁能同时具备算力、算法和数据,就能在更多的应用场景进行布局,基于此,目前各巨头围绕着大模型的争夺成为普遍现象。
回顾OpenAI GPT模型的进化之路,具有十分明显的规模效应,2018年,初代GPT参数量达1.17亿,2019年,二代参数量达15亿,2020年,GPT 3.0参数规模直接飞跃至1750亿。如果把模型比成科技公司打入人工智能领域的“入场券”,那么大模型就是科技公司的“护城河”。
另一方面,大模型的比拼已逐步从实验室阶段转变到产业化阶段,想让自家大模型的差异化优势更为明显,就要抢占产业高地。
目前,腾讯混元大模型聚焦广告行业。据腾讯研究院发布的《AIGC发展趋势报告2023》显示,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等行业取得重大发展。
据阿里研究院公布的信息显示,阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,已在超40个场景中应用,日调用量上亿。
图片
不得不提的是自然语言处理(NLP),有人把NLP称为“人工智能皇冠上的明珠”。所谓NLP就是“懂人话”和“说人话”,谁能实现这方面的突破,谁就能在AI领域一骑绝尘。
英文是偏结构化的语言,而中文是自由的线性语言,在信息处理上有一些“特有”的难题,因此,能做好对中文语言的理解和处理的,自然会是一家中国公司,不是微软、谷歌。
国内最先搭上ChatGPT这趟班车的科技企业会是百度吗?