文心一言疯狂发垃圾短信背后的三大启示

互联网拆解坊

2023-09-07 07:00发布于北京

文心一言疯狂发短信的背后反映了什么问题?

是道德的沦丧，还是人性的扭曲？

作为一名资深的产品经理，我不禁要深思，为何国内大模型这么卷，迫不及待的抢用户真的能保证用户体验和积累长期价值么？

我们今天聊聊这件事

Take Away：

1. 文心一言的产品定位是“你的智能助理”

2. 这个定位要做好需要几个关键要素

3. 狂发短信的背后反应出焦虑

01 什么是文心一言？

“文心一言”作为百度全新一代知识增强大语言模型，采用一对一的对话式聊天场景，能够与人对话互动，回答问题，协助创作，同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中高效便捷地帮助人们获取信息、知识和灵感。

Slogan：你的智能助理

简单说，就是个ChatGPT的国内低配版，至于哪里智能，有多智能，就比较依赖于它的底层大模型能力了，半年前广为传播的特色菜名，体现了当初的智能程度：

当然，此一时彼一时，相信随着不断的训练（修正），现在这些问题都得到了解决：

为了帮助大家解决怎么“智能”的问题，文心一言很贴心的预置了大量的模版：

比如我们选择职场效率里面的日报模版，支持修改【】内的文字，来实现prompt定制，从而帮助用户快速的完成输入：

对于这类标准流程的内容，文心一言的生成质量还是OK的。

所以，我们看下来，就是一个预置了大量prompt模版的国内低配版ChatGPT。

02 做好你的智能助理，需要几个要素？

这个问题，我问了Claude，答复是这样的：

理解用户需求：要深入分析不同用户的实际需求和痛点，不能简单地套用统一的模式。

个性化服务：应该针对不同用户提供个性化的服务和内容推荐，而不是全部用户都获取相同的经验。

多场景适应：不仅要针对聊天做优化，也要考虑到文心一言在其他场景(如搜索、提醒等)的表现。

知识图谱打通：要积累各领域知识，并建立起知识关联体系，才能更智能地处理各类问题。

持续学习：需要不断学习和积累新知识、新技能，才能随时助用户一臂之力。

语言表达能力：对话语言要更自然、流畅，减少模板和重复话语。

情感系统：要注意用户情感，提供符合交互情境的回复。

安全可控：避免产生错误信息、内容，建立可靠的安全监控系统。

按照这个划分方式，目前的文心一言，并没有做到“你的”专属，也没有做到足够的“智能”

因为1没有真的去理解用户的需求

2没有个性化服务，

完全是前端提供输入框，后端统一输出。

所以，你的智能助理，在目前来看，只是一句空话。

相比于其他产品，只能靠大模型对于内容的输出能力来PK，完全是看硬实力。

由于产品并没有实现理想的定位，就急吼吼的推出，会导致用户打开后一脸茫然，使用体验后不及预期，很快在App Store榜单下迅速下滑：

03 急吼吼的狂发短信到底有啥诉求

所以回过头来，我们仔细琢磨一下，为何刚通过审查，就急吼吼的发短信让用户赶紧回来用？

甚至一发发N条，直接构成骚扰呢？

我认为有以下三个点：

希望构建数据飞轮

打出品牌，形成“名实唯一性”

KPI导向

在展开阐述之前，我们先聊一个很有意思的话题：

为何百度没有把文心一言全量整合到搜索里面？

很大的一个差异点在于：Bing没有市场份额，而百度是巨头

全球排名第二是微软 Bing 搜索,市场占比 3.03%

至今年 Q1，百度搜索占国内市场份额大约为 65%

尽管微软全球第二，但只有3个点看着也非常可怜。也就是说，Bing没有什么包袱，直接干一些颠覆的事吧，于是直接在搜索引擎里整合了GPT：

New Bing的使用逻辑是：

先直接给答案

答案里嵌入链接

我们知道，百度的搜索是这样的：

如果你仔细看，可以看到输入框下面，增加了一个“对话”按钮，我们点击后发现进入了类似New Bing的界面：

这个问题的背后也很好理解，如果百度全量按照New Bing的逻辑整合，那用户很可能会在获得答案后会干三件事：

直接离开

点击推荐的链接查看

继续对话

这三种方式无论哪一种，都会影响到百度的广告业务，也就是百度搜索结果里面，被插入的大量广告不会被呈现在用户面前，会大幅影响目前还是主力营收的广告业务。

所以，文心一言使用独立App向外推广成为了一种手段。

第一. 希望构建数据飞轮

我们知道，大模型核心是三个点：

算法，算力，数据

前两个目前来看，对于大厂问题不大，更重要的变成了最后的数据。

如果海量的用户持续使用文心一言，势必会在上面产生更加多的数据，以及对于数据的反馈，这样文心一言就可以进一步的优化大模型的内容生成质量，用户体验就会更好，从而获得更多的用户以及用户数据，形成数据飞轮：

早期获得更加海量的用户，先发优势一旦形成，我们设想一下Midjourney，在AI系列06：Midjourney和Discord互相成就一文里，Super详细的看了它们的数据，也确实是从太空歌剧院，这幅使用AI绘画能力的画作获奖后，引发的全球浪潮中，吃到了足够的红利，后面基于海量用户反馈做了快速的多次迭代，使得模型生成图片的质量快速提升，最终站稳了全球No1的位置：

第二. 打出品牌心智

要用就用文心一言

就像在国际上，大家形成大模型产品就是ChatGPT一样，国内百度肯定希望继续吃到这个品牌心智的。

这个叫“名实唯一性”

要搜索就上百度，要买二手车就上瓜子，送礼就送脑白金

在营销层面，大干快上，铺天广告能起到一定程度的品牌心智。

对于后续的获客会有很好的帮助，这就是为何过去几年互联网企业大手笔上春晚的一个重要原因，希望获得老百姓的心智。

第三. KPI

文心一言，发布了很久了，之前由于合法合规问题，没有办法大规模推广，现在通过了，作为百度的核心产品，岂有不大力推广的道理。

在Q2财报里，李彦宏也疯狂为AI站台：

“生成式AI和大语言模型在许多行业具有巨大变革能力，为我们提供了重大的市场机会。百度不断升级模型，生成更具创造性的回答，提高训练速度并降低推理成本，保持行业领先。”百度创始人、董事长兼首席执行官李彦宏表示，“文心大模型3.5得到了云客户、AI开发者和行业专家的广泛认可。百度正在用AI原生思维重构产品和服务，为用户提供创新体验，并支持企业抓住机遇。百度致力于围绕生成式AI和大语言模型构建新引擎，推动长期增长。”

相信文心一言相关的团队和项目同事，最近也是抓紧内卷，扛着海量的KPI为了证明自己值这笔不低的工资而拼命！

如果我们有心去搜索百度的信息，会发现随着这两年大厂的裁员，人人自危，每个人都更加内卷，因为一旦被裁，就很难有公司再能接得住这么高的薪资，好不容易有个机会，还不玩了命？

用力过猛，会导致动作变形。

根据内部信息，文心一言的多轮对话次数并不理想。

这意味着，有两个可能：

获得的用户并不是目标用户

产品使用体验不达预期

04 文心一言类的大模型App有什么问题？

我们看一下App Store上的用户评价：

推测大量在做刷好评操作，可以看到标红的两条已经被删除了-，-

大模型产品，很容易遇到以下几个问题：

第一. 产品无法解决实际用户需求

当前所处的embedding阶段，无法满足用户实际的工作流需求

embedding阶段指的是，用户提出提示词，丢给大模型，大模型给出答案。大模型并没有办法知道用户全局需要什么，只能就着少量的信息直接给出答案。

由于文心一言并没有做到真正的“你的智能助理”，所以不可能像跟了你一年的真人助理那样，在你做出看一眼茶杯的时候就能知道你需要喝水，茶杯里没水了马上给你倒水这个动作。

变成需要你非常具体和明确的提出指令，大模型再去生成对应的内容。

在这个限制条件下，就完全依赖大模型的内容生成质量！但是目前又很难达到用户满意的程度，这也导致了用户的不满。

注意呀，这个是场景问题，我们也同时能看到，百度系产品全面整合文心一言，比如百度文库：

用户停留时长翻了一倍，7天留存增加10%

这就是一个非常好的场景整合。

所以，大模型产品最大的问题就是：没有具体的场景

第二. 产品成熟度仍然不足

上半年文心一言迭代到了3.5版本，年底预计会推出4.0版本。

简单使用后会感觉到离Claude仍然有差距，但在部分场景下是可以用的，比如简单的工作日报生成。

倒是可以期待一下年底在技术层面文心一言会做到什么程度。

第三. 商业模式不清晰

现在toC应用还是处在抢用户阶段，使用免费的策略来获得用户是国内多年的常用手段啦。

但在大模型层面差异化不足的时候，单纯的大模型产品商业模式是完全谈不上的，只有真的做到了“你的智能助理”，才能真的形成清晰的商业模式。

Super给出的建议是

优先发展垂直领域应用，结合特定场景和老需求开发。

这是目前可见的，很具体的AI时代产品范式。

我们看一下百度输入法最新版本的更新说明：

基于文心一言，重磅升级！「超会写」功能上线，AI写作助手一键帮你写全文、续写、润色，全方位辅助创作

超会写 - 活动方案、工作总结、营销文案…各类文稿交给TA，高效又便捷

超会写 - 灵感枯竭不用怕，写小说、写文章一键帮你文本润色，激发创意、文采飞扬

超会写 - 分析报告、年度规划…不知从何入手，快速帮你搭框架、写大纲，打开思路、高效工作

输入是老需求，在老需求上面寻找AI可以优化的点开发，是更合理的方式。

大模型产品本身在资源充足的情况下做探索是OK的，但不要竭泽而渔。

百度本身的名声就不好，魏则西事件让我们一直记到现在。

3月份文心一言文身图的松鼠鳜鱼等出圈，带来了流量，以及很负面的评价，对于大厂来说，“黑红”不是红啊！

要想一个问题，画成这个鸟样，是，用户看到了破圈之后，兴冲冲的上来使用文心一言，然后呢？然后再也不用了。

要知道，信誉是资产，不要竭泽而渔，为了短期数据去消耗。

总结

文心一言上线短期内大量发垃圾短信引发争议，的确让我们感到遗憾。然而站在技术演进的高度，我们也应理性看待这个过程。

通用人工智能仍处于起步阶段，在提升自身能力的同时，也需要我们给予时间理解、引导和迭代。苛责一个婴儿不能马上跑步是不公平的。

此时此刻，技术公司应该慎重看待大模型，不能过于急功近利。而我们每个人，也应当积极承担起用户的责任，用理性、耐心和同理心，帮助AI健康成长。

这是人类社会一个全新的课题。让我们心怀开放,共同思考如何能在技术革新中,建立起共享繁荣的局面。

未来可期，道阻且长。行者何惧，无畏前行。

查看原图 246K