“中国版ChatGPT”将花落谁家?

在中文人工智能领域,百度、360、科大讯飞等人工智能公司纷纷发力,关于“中国版ChatGPT”最终将花落谁家也不断引起业内热议。

全文3024字,阅读约需6分钟 

文/罗亦丹 编辑 陈莉 校对 卢茜

随着人工智能聊天机器人ChatGPT引发的热议持续升温,科技圈正迎来一轮新热潮,不少用户被ChatGPT足以“以假乱真”的拟人回答深深震撼,还有用户使用过微软基于ChatGPT支持的最新版本人工智能搜索引擎后惊呼“时代变了”。

在中文人工智能领域,百度、360、科大讯飞等人工智能公司纷纷发力,关于“中国版ChatGPT”最终将花落谁家也不断引起业内热议。

事实上,ChatGPT之所以能够取得令人称奇的能力,核心在于其基于GPT-3.5架构一路发展而来,具备强大认知智能的预训练模型,海量学习数据以及背靠微软的强大算力。从这些维度来看,谁将最先打造出“中国版ChatGPT”呢?

━━━━━

ChatGPT表现出色

考验国内企业认知智能领域技术积累

ChatGPT属于认知智能领域的应用,从目前普遍的对话感受来看,ChatGPT的最大亮点就在于其意图识别与语言理解能力甚至能够达到“以假乱真”的水准,回答滴水不漏。要做到这一点,强大的NLP(自然语言处理)技术是关键。

有观点认为,ChatGPT的核心技术是人工智能语言大模型,其关键是如何让人工智能模型具备逻辑推理能力,以及如何让人工智能学习全互联网的知识。这些ChatGPT基本都做到了,因此在决策和知识环节有了很大的突破。

据了解,目前国内有不少公司正在布局这一领域。2月7日,百度宣布将推出类ChatGPT的技术,并确定项目名为“文心一言”。三六零同日也在投资者互动平台上表示计划尽快推出类ChatGPT技术的原型版产品。

具体来看,对于决策和知识环节,常识推理是重要一环。对于常识问答系统来说,首先要能从千万量级的海量的知识库中准确检索到相关的知识,同时模型要能正确地将两条知识进行结合,建立两条常识之间的关系,才能与问题相匹配,最终得到正确选项。

2月8日,科大讯飞在投资者互动平台回应称,已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,在Github平台的中文预训练模型的星标数达13346,位列第一,是第二名的2倍,“公司已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布。”截至目前,这是唯一给出确切上市时间,并率先实现商业化的中国企业。

在该领域,科大讯飞主导承建了科技部首批20家标杆全国重点实验室之一的认知智能全国重点实验室,多年来始终保持关键核心技术处于世界前沿水平。去年科大讯飞曾获得包括OpenBookQA、常识推理挑战赛QASC等在内的总共获得了12项认知智能领域权威评测的第一。

━━━━━

如何“再打造”ChatGPT?

数据与算力是门槛

事实上,早在2022年12月,首个开源的类ChatGPT项目就已经在GitHub上发布,该项目基于谷歌语言大模型PaLM架构,使用了同ChatGPT一模一样的从人类反馈中强化学习的方法,但却出现了无人能够运行的窘境。

这是因为,人工智能模型要想达到ChatGPT的级别,不仅要看算法,还需要足够大的规模、海量的训练数据以及支撑运行的算力。

中国电信首席专家、美国贝尔实验室院士毕奇在接受媒体采访时表示,ChatGPT所使用的技术研发需要投入大规模资金,它基于一个巨大的语料库,千亿参数的模型,还需要计算快且便宜的芯片等。

IDEA研究院(粤港澳大湾区数字经济研究院)认知计算与自然语言研究中心讲席科学家张家兴公开表示,与以往的人工神经网络相比,预训练大模型最大的不同在于它规模足够大,深度学习网络的层数多、连接多、参数多。

据了解,2012年前后的深度学习网络只有几百万参数;2018年前后主流的预训练模型达到1亿参数;目前被证明非常有效的大规模预训练模型已有几千亿参数,短短几年时间提升了几千倍。在对预训练模型各种不同的技术评测中,算法性能展示了一个规律:数据规模越大、预训练模型参数越多,算法输出精度往往也越高,而在这背后,所要求的算力也更加恐怖。

ChatGPT由OpenAI研发,该公司背靠微软,可用算力包括28.5万个CPU核心、1万个英伟达V100 GPU。公开资料显示,ChatGPT的前身GPT-3参数量达到了惊人的1750亿,训练一次所要消耗的成本就高达近8400万元人民币。由此看来,训练ChatGPT所需要的数据量、算力只会更多。

目前,国内市场中百度、科大讯飞等常年深耕人工智能的企业各自均有各自的算力积累,如科大讯飞曾于去年12月在投资者互动平台上表示,其于2009年就开始算力基础设施建设,目前已建成4城7中心深度学习计算平台,讯飞的算力不仅完全满足AI算法模型训练,及面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求。

━━━━━

产品发布看什么?

行业应用是关键

当“硬件”足够,ChatGPT能够运转起来的重要因素还有一个:让其能够不断迭代、训练的海量数据。记者在体验多个国外人工智能语义模型时发现,对方往往提供免费的对话服务,但需要用户予以反馈,通过此种方式对模型进行再训练,事实上,这天然符合行业应用的场景。

三六零董秘在近期的电话会议中表示,ChatGPT走出了通用范式(AI)的从0到1,这会对搜索引擎的底层逻辑造成重大影响,所以大家看到现在首先发力或者主要发力于ChatGPT产品的是谷歌等搜索引擎巨头,“在此之前,大家对于能用通用AI来做专业的事情心里是没有根的,大家更多做垂直领域或者更专业的AI,用更专业的数据模型去训练人工智能,去做一些专业领域的事情。”

在行业应用方面,他认为360使用安全AI查找、扫描漏洞效果非常好,科大讯飞从很早开始就做AI训练模型,在专有领域做到了相当的水平,在医疗领域、教育领域有很好的市场地位。

事实上,深耕某一行业多年的公司具备更多数据积累优势。公开资料显示,目前科大讯飞智慧教育产品已在全国32个省级行政单位50000多所学校中应用,服务超1.3亿师生;在AI学习机市场,去年营收增长53%,一直是份额最高的学习机产品;智医助理产品覆盖了全国380个区县,5.3亿次AI辅助诊疗。

记者梳理资料发现,近期科大讯飞、云从科技等A股相关人工智能类公司的投资者交流活动吸引了多家投研机构的关注,是否会布局类ChatGPT产品是主要问题之一。早在2月7日,科大讯飞就在深交所互动易上回答关于“抢滩ChatGPT语言模型”的问题时表示,已于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,于2023年5月6日进行产品级发布。该技术突破将在AI学习机的中英文作文辅导、中英文口语学习等方面带来显著提升。科大讯飞在2023年会持续升级该系列技术,并陆续应用于公司在教育、医疗、汽车、消费者等多个行业赛道的既有产品,持续提升核心技术效果和产品体验。可见,从算力算法积累到抢先布局产品落地,科大讯飞在这场中国版的ChatGPT角逐中已优先一步。

睿亿投资研究总监熊林认为,包括ChatGPT在内的人工智能产业,由于具有替代人工的潜能,可以有效地帮助企业降本增效,因而长期想象空间很大,但短期产品迭代及生态建立仍需时间,盈利兑现也需要时间,因此应提防过度炒作带来的风险。

事实上,在基础算力、人工智能模型、数据量等维度,国内的人工智能公司均有各自的优势,在ChatGPT大获成功的鼓励下,中国版ChatGPT的到来似乎已并不遥远。有业界观点称,从大数据资源看,中国拥有全世界最大规模的网民数量,有丰富的应用场景,在数据积累方面优势明显。虽然目前全球还没有能跟ChatGPT惊艳表现相抗衡的大模型,但是业界共识是差距在两年左右,两年的差距并非鸿沟,有赶超可能。属于AIGC的时代已然来临,那些对AIGC探索的企业也将接踵而至。

值班编辑 李加减 康嘻嘻

《狂飙》涉毒演员凌晨致歉,剧组昨日表态“零容忍”“会删改”!

在癌症出现前,曾给你释放过这些信号→

6年举办34届?一项被指山寨的作文大赛为何持续多年