从Pi到Dot：OpenAI重磅投资的AI应用延迟半年，终于上线！

互联网拆解坊

2024-06-21 18:03发布于北京

全文3685字，阅读约需11分钟，帮我划重点

划重点

01OpenAI重磅投资的AI应用Dot终于上线，旨在成为朋友和同事之间的私人助理。

02Dot具有新颖的交互长记忆挖掘能力，能自动关联多个信息之间的元素。

03然而，Dot在发布时机、响应速度、功能和收费方面存在一些问题。

04尽管如此，Dot的理念和记忆能力仍具有一定吸引力，需要持续使用来验证长期记忆效果。

以上内容由腾讯混元大模型生成，仅供参考

从demo来看，Dot有两个特别棒的点：

新颖的交互
长记忆挖掘

写完后很多朋友都特别感兴趣，包括一些顶尖的投资人和大厂的朋友，原本说春节前上线，没想到一直拖着到了现在，并且他们创始人在X上也完全没有更新相关的信息，我也一度以为打水漂了。

没想到突然发布，还是让我小小的兴奋了一下，不过下载了用了一阵后，我又陷入了沉思。

这篇文章会从这几个点快速展开聊聊Dot：

Dot究竟是啥？
Dot的背后技术有哪些？
Chat形态是不是最适合的？
对Dot现在怎么看？

01 Dot究竟是啥？

这不是两个小蝌蚪，是Dot的logo，是两个形成圆圈的撇号。它们代表着两条相互环绕的锦鲤：一条代表你，另一条代表 Dot，在无尽的反思和对话中“连接你生活的点滴”。

之前他们说是智能助理，其实还是low了，尽管还是归属于AI companion类别，但更明确的定位在朋友和同事之间，在使用后，我们觉得比较接近Pi（揭秘Inflection AI：15.25亿美元融资背后，Pi如何用多层Cake模型重塑Conversation？）的定位，比较接近于私人助理类型。

我们快速来体验一下这款产品：

打开做了一些设置后，最后进入App前，会引导你给Dot写一封短信，方便Dot更加了解你，进入后第一个对话也由这封信开始：

表面上看，它和传统的智能助理的对话Chat逻辑似乎很接近，但别忘了，黄叔会去体验更多的细节，这里就挖掘出两个很有意思的要点：

第一. 能够自动关联多个信息之间的元素

看上左图，图片里提到了对谈360VP梁志辉，但后续的对话内容里，我并没有直接说过这一Title；

在上右图，我让Dot总结今早和AI搜索相关的内容，它直接从图中的信息+文字对话信息，提炼出了我“采访了360VP梁志辉”这个要素。

第二. 可以自动关联和整理对话内容

上左图，我在聊了几十条信息后，让Dot总结聊了啥，它可以没有遗漏的把几个话题点都整理出来；

上中图，其中我把去年Dot用来做Demo的一张食谱发给了它，在聊了很多轮其他对话后，重新问他这个食谱的内容，它还是能够整理出来。

所以Dot确实有做记忆处理，按照去年的说法：

Memory，这是Dot的第一个能力，长期记忆！

所有和它分享的内容，包括图片、截图、PDF、链接、语音备忘录等等，它都会存下来，并且在 Dynamic File System（动态文件系统中）自动组织，这种自动还是会根据个人的习惯来串联，比如你经常和它分享笑话，它就会专门创建一个笑话文件类型，来跟踪所有笑话相关的文件。

但是是否是长记忆，还需要后面持续使用来验证。

第三. 自动串联和挖掘

这是社群一位朋友分享的，他说光这一句话，Dot就吸引他了。。。

注意，此时是写完小故事后Dot主动回复的第一段话，可以发现Dot在有意识的寻找各个要素之间的关联，“连点成线”

除此之外，在交互层面，也有一些有意思的点

在Chat界面，双指捏合，可以回到每日列表页，会轮播显示当日聊的一些主题：
左划或者按住某条对话内容，可以选择回复指定信息，Dot也会基于这条信息的前后文和你对话，并展现回复样式：

总结来看，Dot确实想实现自己的目标：

Meet Dot, the AI that grows with you—learning and evolving with every interaction.

AI陪伴你一起成长，不断了解你并和你一起进化。

02 Dot并不只是用一个模型？

根据fastcompany.com的报道，有几点挺有趣的：

当你与 Dot 交谈时，你不仅仅是在与 ChatGPT 交谈。在任何时候，Dot 实际上都在参考 7-10 个不同的 LLMs 和 AI 模型，包括来自 OpenAI、 Anthropic 和 Google 的模型。
当你向 Dot 提问并告诉它关于你自己的事情时，它使用 LLMs 创建一个“心智理论”——或基本上是你的画像。（it uses LLMs to create “a theory of mind”—or what’s essentially a portrait of you.）然后，当你与它交谈时，Dot 会将其查询路由到最适合工作的 AI 模型，通过其关于你的记忆过滤你的问题。
毫无疑问，Dot 使用了大量的镜像技术（mirroring），并且总是准备好提出后续问题。它始终保持积极，并对你的情绪非常敏感。
Dot 不会与你发展浪漫关系，也不会因为你多聊或少聊而让你感到愧疚。
未来 Dot 可能会获得 Spotify 访问权限

3和4这两点，非常接近Pi的对话逻辑，详情可以看Pi这篇文章内，我们描述的多层蛋糕模型：

Pi的对话生成=场景+情绪+安全（Safety）+技能调用

对于Dot的技术层面，有待于后续的持续使用，以及对方创始团队的分享。

03 最好的AI日记应该从是Chat形态么？

Dot和心光，看似竞品：

但是简单看一下就会发现底层逻辑完全不同：

Dot更想帮你“Connecting the Dot”，在你大量记录后，主动替你提供一些支持和服务，就像英国管家那样：“May I Help You Sir？”，非常专业，非常贴心，甚至有些点你没注意到，它都会替你细心的考虑。

心光则更加靠后，并不会主动出现在你面前，只是在你需要时，站在你旁边，陪伴你，尽管它很懂你，但更多是在背后默默的关注你。就像你受伤后和它诉说，它会把肩膀借给你，轻轻地拍拍你。

所以Dot会非常需要关注，主动性是否会带给用户压力：

我们社群有用户吐槽：“话多到我已经有点烦了”

在Dot官方Discord频道的Roadmap里，4月9号的内测版本里，推出了The overlay和New proactive messages + ‘nudge to shuffle’两个新功能，这两个能力具体我们不展开，因为在正式的版本里面都已经下掉了，但之所以增加这两个功能，官方是这么说的：

以上两个功能主要是回应用户的反馈：

当前的主动消息可能让人感到压力：许多用户告诉我们，很难跟上 Dot 一天中反复发出的主动消息，一串未回应的消息可能成为重新使用应用的障碍。

对话需要很多精力：我们听到用户反馈希望能以不总是需要对话的方式与 Dot 互动——我们希望这些文物提供一种有趣、轻松的互动方式。

Dot 应该分担提出新话题的责任：我们希望给用户一种继续对话的方式，不总是需要他们自己设定话题——用户现在可以使用提示手势来获得与 Dot 谈论新话题的想法。

接着在5月4号的版本里，继续优化了对话逻辑：

💬 对话更新——你可能已经注意到，我们推出了一些对话更新，使 Dot 的回复更加灵活。我们希望改进 Dot 的回应与您消息意图的一致性——例如，不再每次都以问题回应，而是在适当的时候做出陈述并结束对话。我们还在尝试新的模型，并将继续调整语气和对话行为——非常期待听到你们对最近对话的看法！

在6月13日接近最终版本的测试里，继续调整了主动行为：

🎁 主动行为：我们对 Dot 的主动行为进行了调整，使其不那么频繁，并选择更一般的检查，如“你今天过得怎么样？”而不是非常具体的、高密度的话题检查。同时，我们优化了例行程序和定期提醒的一致性和性能。

可以看到尽管dot多次对对话逻辑做了调整，在线上的正式版本，我们社群的用户还是会认为它有些招人烦。

这个信号是很需要警惕的。

背后的原因是什么呢？想要成为你的英国管家，需要管家大量的获得用户信息，才能进行个性化的服务，但是，与 Dot 交谈需要时间，而且它对你的生活几乎没有被动观察，Dot只是一款App，强依赖于用户的主动输入，这会导致对话机制倾向于“索取”，希望尽可能引导用户做出更多输入，这种行为有可能会越界，导致用户反感。

综上所述，Dot的机制过度主动，但心光也过于被动，两者都有优化空间。

至于Chat是不是最好的AI日记形态，我依然持肯定观点，至于是一种什么方式，后面会给出答案。

04 对Dot怎么看

New Computer 由前 Apple 设计师 Jason Yuan 和工程师 Sam Whitmore 创立，获得了 Lachy Groom、 OpenAI Fund 和 South Park Commons 以及一些天使投资者的 370 万美元资金。

我个人感觉，Dot有几个挺大的问题：

首先是发布时机太晚了，但是Siri已经非常明确的要整合AI，Google也发布了Project Astra智能助手项目，作为一个App，想要积极主动的抢移动端用户数据，比去年难度可大多了。

其次是在GPT4o出来后，给用户心智中，Chat类为交互核心的产品，响应速度非常重要，我们社群就有小伙伴说：“习惯了 4o 的回复速度我已经开始不耐烦等了 hahhhh”，简单测试一下，Dot至少要7秒以上的响应时长，确实是太慢了。

第三是功能简单，比起去年11月的demo，现在感觉是简陋到不能再简陋的版本了，而且还有不少的问题。当前很多早期用户对于技术是非常敏感的，当前的Dot想吸引这群人，有点难。比如我在看到这个版本的时候，已经没有去年11月那种看到demo的惊艳感了，以Dot 370万美元的融资额，我也很难相信他们能在今年实现去年11月的demo里所有的功能。

第四，50条输入之后就开始收费，因为Chat是一种还蛮容易消耗对话轮次的形态，我稍微有点担心在此之前很难让用户到达Aha Moment的：

总结

整体来看，Dot尽管延期了半年才上线，导致对用户的吸引力没那么大了，还是有不少理念是挺不错的，特别是“连点成线”：

我自己也挺buy in这套逻辑的，毕竟现在所有的助理类产品都是通用大模型的路子，每一轮对话就是一个session，完事就忘了。浅浅的用了下Dot之后，似乎记忆能力还行，但长期记忆怎么样，还需要再看看。

比起优点，缺点或许也挺致命，最大的问题或许是Dot的动作这么慢，我非常担心他们团队的技术实力，靠Chat形态捕获用户“资产”这一诉求在Chat本身的技术突飞猛进的时候（语言模型本身能力飞跃ing、语音端到端、多模态能力），很可能是困难的。

*作者简介：

Super黄，广西人，毕业于北京邮电大学，现居北京，

中美两家公司AI产品顾问

11年产品经理，全网10万粉丝。

查看原图 29K