360押注AI,周鸿祎意欲何为?

图片
商业模式的固化与大模型的碰撞,360似乎从未放弃过任何一个数字时代的爆点,但这一次所不同的是,360在推出智脑的同时,更是希望能够将“大模型拉下神坛”。
有意思的是,消息一经发布,二级市场的动作也开始一直向下。
6月14日,360智脑大模型4.0版本发布次日,三六零股价由涨转跌,振幅达到5.66%,结束连续3个交易日的涨势。
图片
就连2023年上半年的总营收情况也下降状态。
7月13日晚间,360发布的2023年上半年业绩预告显示,该公司依旧以营收下滑和亏损收场,不过相较于一季度的跌幅,二季度的业绩开始有明显好转。
360上半年实现营业总收入约45.7亿元,较上年同期下降约2.5亿元,同比减少约5.19%,相较于2022年半年度营业总收入同比降幅14.16%,2023年半年度营业收入下降幅度收窄。
其中,第一季度营收为19.66亿元,减少22.17%,第二季度恢复增长,约26.04亿元,同比增长13.32%。
那么,在成本与语言模型融合搜索引擎的两大难题面前,一边向往大模型,一边又欲将大模型拉下神坛的360,又该如何做到呢?
图片
图片来源:百度股市通
一、是步后尘,还是带来新研发?
近期,中国科学技术信息研究所发布《中国人工智能大模型地图研究报告》,据不完全统计,中国已发布10亿参数以上的大模型已多达79个。
从大模型的发展来看,AI的发展是迅速的,而传统搜索引擎在与AI+搜索模式对比下,实际上也是越来越式微的。
回看国内卷起“百模”厮杀后,至今大模型已经遍地开花,无论是通用还是垂域模型,种类和数量都日渐丰富。
同时,各家也积极探索大模型的落地应用,例如360宣布依托智脑大模型打造数字人社区;百度文心开拓更多行业应用领域;阿里则推出专攻音视频内容的AI产品通义听悟。
图片
但总结起来看,各大模型中最常用最基础的功能有两个:一个是知识问答,一个是写作生成。
首先是360,360智脑大模型通过预训练和微调的方式,实现了生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态(文本生成图像)等十大核心能力。
很显然,这些能力不仅是基础的知识问答,还可以覆盖大模型全部应用场景,为个人、为企业提供AI服务。
其次,商汤“日日新SenseNova”作为大模型体系的重要一员,“商量SenseChat 2.0”同样拥有长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且能够在与用户的互动过程中精进判断力与创作智能,实现知识实时更新。
如果根据360智脑的初衷,将大模型聚焦在C端亦或是“普惠”层面上来看,对比同细化垂直领域的大模型,那么到底谁会做得更好?
图片
就商汤“日日新SenseNova”知识实时更新这一点来看,360在实时信息这一块结合了自身的优势,在“实时”问题提问中,提供了“在网上搜索更好答案”的选项,并给出了这些回答在网页上的参考来源。
但这种实时搜索的优势仅限于部分问答,在某种特定对比内容问答以及描述生成图片层面则差了些意思。
先是两种产品之间参数的对比,知乎“橘生”曾要求360智脑要展示“三星S23”和“小米13”这两款手机的参数,并从各个方面分析优劣,并作出购买推荐。
360智脑能够提供各产品的优劣,但在数据上存在着一定的出入。
另外,就普通的描述生成图片而言,其实也并没有太多的问题,如果一旦将场景稍微具体后,生成的图片就没有那么准确了。
图片
图片来源:知乎“橘生”
或许正如360 CEO周鸿祎所说“智脑还像刚出生的孩子,仍旧有不完善的地方”。很显然,从以上问题来看,360智脑大语言模型+ 联网搜索,还有很多错误数据和场景描述生成等问题需要解决。
事实上,这与竞品之间的优缺无关,这是大模型自身数据训练数量所存在的问题。更重要的一点是,大模型背后的企业也无法保证每一项功能训练数据的比例。
即便当下大模型已经完成7B参数量,但目前国内的大模型技术仍然处于发展初期,应用场景较少,靠这个项目盈利还为时过早。
二、押宝大模型,但盈利尚早
虽然各大企业先后推出了属于自己的大模型,但在发展方向上各有不同。
例如百度与阿里更偏向于接入各行业公司;华为则聚焦在金融、气象、煤矿等多个行业;360智脑大模型应用创新领域AI数字人;腾讯和字节分别是行业大模型精选商店与大模型服务平台;商汤大模型“日日新”主要包括智驾领域。
据悉,360智脑大模型4.0目前仍未对外开放,暂时只接入浏览器、搜索、安全卫士等“360全家桶”产品。
为此,在支持商用这个竞争节点上,智脑与一边是积极接入各行业的百度文心一言,一边是上架各大应用商店,下载量达到1万多次的讯飞星火的相比较,显然是被被甩在后头。
实际上这也十分的好理解,对于360而言,会更偏向于C端用户的感受以及在方向上的垂直发展。
图片
不过,就目前而言,虽然智脑为360自研千亿参数大语言模型,但根据网友的测评,在基础性的问答中仍然会存在无法“脑筋转弯”的错误。
在主打问答、生成创作、AI数字人等层面的智脑,的确是偏向于to C,但也需要说明,目前带给用户的价值是有限的。
更何况,使用开源大模型的项目数量,每个季度都在翻倍。
其中,今年6月,美国红杉资本发现在其投资的33家创业公司和上市公司中,65%已经上线了大模型应用、94%正用OpenAI的大模型接口(API)开发应用。
它们使用大模型的方法大多较为简单:直接调用ChatGPT的接口处理私有数据完成特定任务,如多语言互译、生成文本或者网页内容摘要等。很少有公司会做更深入的开发,就目前而言更多是用大量数据进行微调模型。
图片
另一方面,对于to B端,企业一边对大模型十分向往,但一边又会在安全性有非常多的顾虑。说到底,最现实的问题就是大模型不是云计算,更不是企业数字化这么简单,极少的企业会选择直接接入大模型的API。
就拿ChatGPT来说,据媒体报道,三星公司内部曾在短期内发生了多起ChatGPT引发的数据安全事件。
大致情况就是,公司一名员工将要求ChatGPT帮助自己完成会议记录,甚至还有员工将软件源代码粘贴到ChatGPT中要求进行优化,并要求其找到问题的解决方案。
基于此, 无论是内容记录亦或是通过大模型进行代码优化,所输入源代码都有可能成为ChatGPT的训练数据库。
图片
图片来源:量子位
如果再进一步延伸就会发现,大模型实际很难成为“行业通”,因为几乎所有的企业都很难会将自身独特的知识贡献到大模型中。
这也就导致大模型难以实现对行业的深度了解,一旦问它行业问题,更多是局限于表面。
当然,360同样有着清醒的认知,就像周鸿祎所说“在数字安全方面积累了全球最多的攻击样本。我会愿意把这个贡献给行业吗?我会愿意把它训练到公有的大模型里吗?不可能。”
总得来说,这也就注定了大模型垂直发展所具有的难度。
三、360如何将大模型拉下神坛?
360周鸿祎曾在发布会上说道:把大模型“拉下神坛” 变成每个企业能直接使用的东西。
通过智脑发布会的内容简单的理解就是,对行业进行垂直训练,让大模型自上而下,变成每一个人都可以直接拿来使用的模型。
专注服务于垂直领域的模型,能做到普惠到个人,或许将是一个趋势。但就目前而言,360智脑存在一定的难度。
从当下ChatGPT的日活量来说,纯对话式、问答的大模型已经不能满足人们的个性化需求。更何况,AI带来的是效率提升,是新的工作方式,而不是直接去替代某个人或是简单“复刻”一个数字化的自己。
某种程度上也可以看出,从大模型动作频频,却缺少问答之外的互动创新。
图片
另一方面,为了更聚焦安全问题,360模型不具有连续对话能力。
根据官方的说法,360智脑作为“新搜索”的落地应用,这个产品的重点,也应该是在信息检索能力和答案准确性、用户体验以及实时性上。
换个角度,倘若360智脑去掉“联网搜索”键,那么实时性也将不再具备。
不过,语言模型+搜索引擎的模式,对背后语言模型的考验也是极大的,语言模型还需要对搜索信息作为辨别,这个在大模型发展的初期格外的明显。
直白一点来说,语言模型+搜索引擎的方式,还需要经过充分优化提升语言模型对搜索信息的辨别能力。
图片
虽然当下并没有大厂将搜索引擎与大模型结合在一起,但360智能开辟新方向的勇气,一定是独一份的,毕竟总要有人尝试走新的路。
智脑或许能够成功将大模型拉下神坛,但一定不是现在。
参考:
橘生:360智脑内测体验,国内的AI是什么水平?
新浪科技:监管号角吹响,AI大模型数据安全问题何解?
和讯网:AI大模型“诸神之战”升级,美团借道光年之外入局