谷歌全面出击AI 它能胜过“OpenAI+微软”吗?

被OpenAI和微软吊打几个月后,谷歌终于全面出击AI。在5月10日的2023 Google I/O开发者大会上,谷歌宣布搜索、邮箱、地图等25个产品接入大模型PaLM2,通过生成式AI来重构所有产品。
图片
谷歌新的搜索服务叫搜索生成体验SGE,搜索结果首先将是AI生成的摘要,同时还给出链接,以证明摘要中的内容;办公协作平台workspace新增助手Duet AI,为Gmail和DOS文档提供写作辅助、为幻灯片提供图片生成、为Meet生成会议摘要;
几个月前演示翻车的聊天机器人Bard功能也有所增加,能识别图片,在回复中能附带照片。同时支持用户将聊天记录导出到 Google Docs 和 Gmail 中。
在谷歌地图中,AI为用户生成沉浸式路线视图。在手机中,AI帮助用户智能修图,不久的将来,用户还可以用提示词让AI生成不同的手机壁纸。
除了互联网用户,谷歌还为Android开发者推出了AI编码机器人Studio Bot,不仅可以生成代码、修复BUG,还能回答关于安卓应用开发的相关问题。谷歌云为企业客户推出了Duet AI,客户可以选择不同付费档次的AI模型。
从互联网服务到手机硬件,从普通用户到开发者和企业客户,谷歌在AI的覆盖面上已经完全超过了微软。
到目前为止,全面拥抱生成式AI的科技巨头就只有微软和谷歌两家。之前市场关注的重点是微软Bing接入chatGPT后是否有可能逆袭谷歌搜索?假设只占搜索市场3%的Bing有机会撼动占90%市场的谷歌搜索,那么排名第四的谷歌云也有可能挑战老二微软云。
生成式AI有可能改写任何行业的格局,这已经是一场全面性的战争,未来将把所有企业都卷进来。目前战场上只有两个阵营,一方是谷歌,另一方则是“OpenAI+微软”联军。
决定胜负的关键是双方大模型的实力比拼。
众所周知,所有大语言模型的起源和基石是谷歌2017年推出的Transformer,它分为编码器和解码器两大模块,模拟了人类大脑从理解语言到表达语言的过程。
2018年6月,OpenAI公司发布了GPT模型的初代版本,GPT-1。2018年10月,Google也发布了BERT模型。虽然二者都基于Transformer,但GPT模型仅使用了解码器的部分,而BERT仅使用了编码器的部分,二者在技术路线上也走向了两条不同的道路。
具体来说,BERT在训练时每一个词需要对整个输入序列的上下文进行相关性分析,从模式上来看更接近于一个完形填空模型;而GPT在训练时会对下文进行了遮盖(mask)处理,仅基于上文,来生成下文,因此更接近人类的语言生成模式,更适合来构建语言生成模型。
但BERT的参数量是GPT-1的3倍,因此其测评结果要领先于GPT-1。GPT不断改进训练的方法,经过多次迭代,到2020年5月发布GPT-3,训练参数达到了1750亿,数据集在处理前容量达到了45TB,成了真正意义上的超大语言模型。
看到GPT基于仅解码器产生的高性能,2021年10月,谷歌也转向仅解码器的方向。2022年1月,谷歌推出LaMDA大模型。2022年4月,推出PaLM大模型,现在接入谷歌全线产品的PaLM2是其升级版本。
图片
OpenAI去年11月底发布的chatGPT是GPT-3.5,今年3月又发布了GPT-4。可以说,在仅解码器这个技术路线上,OpenAI走在谷歌前面,GPT的更新迭代也比PaLM快了两代。
但PaLM2大模型在性能上是否一定比GPT-4差两代?现在也还没法下定论,待日后两家接入大模型的产品上线后,才能一分高下。
而决定大模型胜负的除了技术性能,还要看谁能吸引到更多的盟友。鉴于大模型耗资巨大,目前来看,只有巨头才玩得起。虽然Meta、英伟达也有推出大模型,但还没有什么动静。
OpenAI已经拉开了阵势,向企业推出了MaaS模式,有详细的API收费标准。目前已经有很多创业公司基于chatGPT推出创新的AI应用,比如生成广告文案的Jasper,生成视频的 waymark,生成游戏角色的Inworld AI。OpenAI还推出了chatGPT插件,供第三方互联网产品使用。
PaLM2目前只面向自己的产品,但谷歌自己的产品和用户就够多了。互联网产品除了搜索、workspace、地图,还有视频网站youtube、浏览器chrome;硬件产品除了手机,还有笔记本电脑、智能家居、谷歌眼镜。根据中信建投的报告,谷歌在全球用户超过43亿。
而且谷歌也在引入合作伙伴。在本届开发者大会期间,全球决策和市场情报技术提供商Fiscalnote被选为Bard的启动合作伙伴,使用户能够访问选定的实时公司数据集和内容。
一切才刚刚开始,未来各行各业势必都要用AI来武装自己,届时它们将投奔哪个阵营,OpenAI+微软还是谷歌?抑或还有更强的阵营出现?
最后我想说,微软不足为惧,OpenAI才是谷歌真正的对手。
OpenAI本来是个非盈利机构,因为算力成本昂贵,后来过渡到“有限盈利”,利润上限为任何投资的 100 倍。跟微软的绑定只是暂时的,在完成对投资人和员工的承诺后,OpenAI将回归非盈利机构。
GPT的接入让微软的产品焕发新生,但AI在其中扮演的角色只是助手,主角仍是微软的Office、Bing、Team。换句话说,入口并没有变。
但其实生成式AI的革命性在于对人机交互方式的彻底颠覆。4月份,OpenAI 联合创始人之一的Greg Brockman在 TED2023 上做了一个现场演示,他叫ChatGPT 策划一个TED晚宴,ChatGPT生成了一个非常详细的方案,接着调用 Dall-E 生成了一张晚宴的图片,然后列出晚宴需要的食材清单,在食品购物网站instacart下单购买,最后调用一个软件在推特上发了一条推文。
整个过程都没有离开ChatGPT界面,而且ChatGPT会自己使用工具。这才是未来互联网的新范式,人们有什么需求直接找ChatGPT这样的聊天机器人就行了,不需要费劲去下载APP,在繁琐的菜单中去寻找功能。很多APP将隐身幕后,甚至消失。
OpenAI可以无所顾忌地去革互联网的命,但谷歌会用Bard来干掉自己的互联网产品吗?未来它将如何取舍、重组其庞杂的产品线?它又将给互联网产业树立一个什么样的新范式?
而这恐怕将是PaLM和GPT对决的终局之战。
参考资料:
《解析GPT背后的技术演进》(方正证券研究所)