文心一言疯狂发垃圾短信背后的三大启示

文心一言疯狂发短信的背后反映了什么问题?
图片
是道德的沦丧,还是人性的扭曲?
作为一名资深的产品经理,我不禁要深思,为何国内大模型这么卷,迫不及待的抢用户真的能保证用户体验和积累长期价值么?
我们今天聊聊这件事
Take Away:
1. 文心一言的产品定位是“你的智能助理”
2. 这个定位要做好需要几个关键要素
3. 狂发短信的背后反应出焦虑
01 什么是文心一言?
图片
“文心一言”作为百度全新一代知识增强大语言模型,采用一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中高效便捷地帮助人们获取信息、知识和灵感。
Slogan:你的智能助理
简单说,就是个ChatGPT的国内低配版,至于哪里智能,有多智能,就比较依赖于它的底层大模型能力了,半年前广为传播的特色菜名,体现了当初的智能程度:
图片
当然,此一时彼一时,相信随着不断的训练(修正),现在这些问题都得到了解决:
图片
为了帮助大家解决怎么“智能”的问题,文心一言很贴心的预置了大量的模版:
图片
比如我们选择职场效率里面的日报模版,支持修改【】内的文字,来实现prompt定制,从而帮助用户快速的完成输入:
图片
对于这类标准流程的内容,文心一言的生成质量还是OK的。
所以,我们看下来,就是一个预置了大量prompt模版的国内低配版ChatGPT
02 做好你的智能助理,需要几个要素?
这个问题,我问了Claude,答复是这样的:
理解用户需求:要深入分析不同用户的实际需求和痛点,不能简单地套用统一的模式。
个性化服务:应该针对不同用户提供个性化的服务和内容推荐,而不是全部用户都获取相同的经验。
多场景适应:不仅要针对聊天做优化,也要考虑到文心一言在其他场景(如搜索、提醒等)的表现。
知识图谱打通:要积累各领域知识,并建立起知识关联体系,才能更智能地处理各类问题。
持续学习:需要不断学习和积累新知识、新技能,才能随时助用户一臂之力。
语言表达能力:对话语言要更自然、流畅,减少模板和重复话语。
情感系统:要注意用户情感,提供符合交互情境的回复。
安全可控:避免产生错误信息、内容,建立可靠的安全监控系统。
按照这个划分方式,目前的文心一言,并没有做到“你的”专属,也没有做到足够的“智能”
因为1没有真的去理解用户的需求
2没有个性化服务,
完全是前端提供输入框,后端统一输出
所以,你的智能助理,在目前来看,只是一句空话。
相比于其他产品,只能靠大模型对于内容的输出能力来PK,完全是看硬实力。
由于产品并没有实现理想的定位,就急吼吼的推出,会导致用户打开后一脸茫然,使用体验后不及预期,很快在App Store榜单下迅速下滑:
图片
03 急吼吼的狂发短信到底有啥诉求
所以回过头来,我们仔细琢磨一下,为何刚通过审查,就急吼吼的发短信让用户赶紧回来用?
甚至一发发N条,直接构成骚扰呢?
图片
我认为有以下三个点:
希望构建数据飞轮
打出品牌,形成“名实唯一性”
KPI导向
在展开阐述之前,我们先聊一个很有意思的话题:
为何百度没有把文心一言全量整合到搜索里面?
很大的一个差异点在于:Bing没有市场份额,而百度是巨头
全球排名第二是微软 Bing 搜索,市场占比 3.03% 
至今年 Q1,百度搜索占国内市场份额大约为 65%
尽管微软全球第二,但只有3个点看着也非常可怜。也就是说,Bing没有什么包袱,直接干一些颠覆的事吧,于是直接在搜索引擎里整合了GPT:
图片
New Bing的使用逻辑是:
先直接给答案
答案里嵌入链接
图片
我们知道,百度的搜索是这样的:
图片
如果你仔细看,可以看到输入框下面,增加了一个“对话”按钮,我们点击后发现进入了类似New Bing的界面:
图片
这个问题的背后也很好理解,如果百度全量按照New Bing的逻辑整合,那用户很可能会在获得答案后会干三件事:
直接离开
点击推荐的链接查看
继续对话
这三种方式无论哪一种,都会影响到百度的广告业务,也就是百度搜索结果里面,被插入的大量广告不会被呈现在用户面前,会大幅影响目前还是主力营收的广告业务。
所以,文心一言使用独立App向外推广成为了一种手段。
第一. 希望构建数据飞轮
我们知道,大模型核心是三个点:
算法,算力,数据
前两个目前来看,对于大厂问题不大,更重要的变成了最后的数据。
如果海量的用户持续使用文心一言,势必会在上面产生更加多的数据,以及对于数据的反馈,这样文心一言就可以进一步的优化大模型的内容生成质量,用户体验就会更好,从而获得更多的用户以及用户数据,形成数据飞轮:
图片
早期获得更加海量的用户,先发优势一旦形成,我们设想一下Midjourney,在AI系列06:Midjourney和Discord互相成就一文里,Super详细的看了它们的数据,也确实是从太空歌剧院,这幅使用AI绘画能力的画作获奖后,引发的全球浪潮中,吃到了足够的红利,后面基于海量用户反馈做了快速的多次迭代,使得模型生成图片的质量快速提升,最终站稳了全球No1的位置:
图片
第二. 打出品牌心智
要用就用文心一言
就像在国际上,大家形成大模型产品就是ChatGPT一样,国内百度肯定希望继续吃到这个品牌心智的。
这个叫“名实唯一性”
要搜索就上百度,要买二手车就上瓜子,送礼就送脑白金
在营销层面,大干快上,铺天广告能起到一定程度的品牌心智。
对于后续的获客会有很好的帮助,这就是为何过去几年互联网企业大手笔上春晚的一个重要原因,希望获得老百姓的心智。
第三. KPI
文心一言,发布了很久了,之前由于合法合规问题,没有办法大规模推广,现在通过了,作为百度的核心产品,岂有不大力推广的道理。
在Q2财报里,李彦宏也疯狂为AI站台:
“生成式AI和大语言模型在许多行业具有巨大变革能力,为我们提供了重大的市场机会。百度不断升级模型,生成更具创造性的回答,提高训练速度并降低推理成本,保持行业领先。”百度创始人、董事长兼首席执行官李彦宏表示,“文心大模型3.5得到了云客户、AI开发者和行业专家的广泛认可。百度正在用AI原生思维重构产品和服务,为用户提供创新体验,并支持企业抓住机遇。百度致力于围绕生成式AI和大语言模型构建新引擎,推动长期增长。”
相信文心一言相关的团队和项目同事,最近也是抓紧内卷,扛着海量的KPI为了证明自己值这笔不低的工资而拼命!
如果我们有心去搜索百度的信息,会发现随着这两年大厂的裁员,人人自危,每个人都更加内卷,因为一旦被裁,就很难有公司再能接得住这么高的薪资,好不容易有个机会,还不玩了命?
用力过猛,会导致动作变形。
根据内部信息,文心一言的多轮对话次数并不理想
这意味着,有两个可能:
获得的用户并不是目标用户
产品使用体验不达预期
04 文心一言类的大模型App有什么问题?
我们看一下App Store上的用户评价:
图片
推测大量在做刷好评操作,可以看到标红的两条已经被删除了-,-
大模型产品,很容易遇到以下几个问题:
第一. 产品无法解决实际用户需求
当前所处的embedding阶段,无法满足用户实际的工作流需求
embedding阶段指的是,用户提出提示词,丢给大模型,大模型给出答案。大模型并没有办法知道用户全局需要什么,只能就着少量的信息直接给出答案。
由于文心一言并没有做到真正的“你的智能助理”,所以不可能像跟了你一年的真人助理那样,在你做出看一眼茶杯的时候就能知道你需要喝水,茶杯里没水了马上给你倒水这个动作。
变成需要你非常具体和明确的提出指令,大模型再去生成对应的内容。
在这个限制条件下,就完全依赖大模型的内容生成质量!但是目前又很难达到用户满意的程度,这也导致了用户的不满。
注意呀,这个是场景问题,我们也同时能看到,百度系产品全面整合文心一言,比如百度文库:
图片
用户停留时长翻了一倍,7天留存增加10%
这就是一个非常好的场景整合。
所以,大模型产品最大的问题就是:没有具体的场景
第二. 产品成熟度仍然不足
上半年文心一言迭代到了3.5版本,年底预计会推出4.0版本。
简单使用后会感觉到离Claude仍然有差距,但在部分场景下是可以用的,比如简单的工作日报生成。
倒是可以期待一下年底在技术层面文心一言会做到什么程度。
第三. 商业模式不清晰
现在toC应用还是处在抢用户阶段,使用免费的策略来获得用户是国内多年的常用手段啦。
但在大模型层面差异化不足的时候,单纯的大模型产品商业模式是完全谈不上的,只有真的做到了“你的智能助理”,才能真的形成清晰的商业模式。
Super给出的建议是
优先发展垂直领域应用,结合特定场景和老需求开发。
这是目前可见的,很具体的AI时代产品范式。
我们看一下百度输入法最新版本的更新说明:
基于文心一言,重磅升级!「超会写」功能上线,AI写作助手一键帮你写全文、续写、润色,全方位辅助创作
超会写 - 活动方案、工作总结、营销文案…各类文稿交给TA,高效又便捷
超会写 - 灵感枯竭不用怕,写小说、写文章一键帮你文本润色,激发创意、文采飞扬
超会写 - 分析报告、年度规划…不知从何入手,快速帮你搭框架、写大纲,打开思路、高效工作
输入是老需求,在老需求上面寻找AI可以优化的点开发,是更合理的方式。
大模型产品本身在资源充足的情况下做探索是OK的,但不要竭泽而渔。
百度本身的名声就不好,魏则西事件让我们一直记到现在。
3月份文心一言文身图的松鼠鳜鱼等出圈,带来了流量,以及很负面的评价,对于大厂来说,“黑红”不是红啊!
图片
要想一个问题,画成这个鸟样,是,用户看到了破圈之后,兴冲冲的上来使用文心一言,然后呢?然后再也不用了。
要知道,信誉是资产,不要竭泽而渔,为了短期数据去消耗
总结
文心一言上线短期内大量发垃圾短信引发争议,的确让我们感到遗憾。然而站在技术演进的高度,我们也应理性看待这个过程。
通用人工智能仍处于起步阶段,在提升自身能力的同时,也需要我们给予时间理解、引导和迭代。苛责一个婴儿不能马上跑步是不公平的。
此时此刻,技术公司应该慎重看待大模型,不能过于急功近利。而我们每个人,也应当积极承担起用户的责任,用理性、耐心和同理心,帮助AI健康成长。
这是人类社会一个全新的课题。让我们心怀开放,共同思考如何能在技术革新中,建立起共享繁荣的局面。
未来可期,道阻且长。行者何惧,无畏前行。