从Pi到Dot:OpenAI重磅投资的AI应用延迟半年,终于上线!

全文3685字,阅读约需11分钟,帮我划重点

划重点

01OpenAI重磅投资的AI应用Dot终于上线,旨在成为朋友和同事之间的私人助理。

02Dot具有新颖的交互长记忆挖掘能力,能自动关联多个信息之间的元素。

03然而,Dot在发布时机、响应速度、功能和收费方面存在一些问题。

04尽管如此,Dot的理念和记忆能力仍具有一定吸引力,需要持续使用来验证长期记忆效果。

以上内容由腾讯混元大模型生成,仅供参考

图片

从demo来看,Dot有两个特别棒的点:

  1. 新颖的交互
  2. 长记忆挖掘

写完后很多朋友都特别感兴趣,包括一些顶尖的投资人和大厂的朋友,原本说春节前上线,没想到一直拖着到了现在,并且他们创始人在X上也完全没有更新相关的信息,我也一度以为打水漂了。

没想到突然发布,还是让我小小的兴奋了一下,不过下载了用了一阵后,我又陷入了沉思。

这篇文章会从这几个点快速展开聊聊Dot:

  1. Dot究竟是啥?
  2. Dot的背后技术有哪些?
  3. Chat形态是不是最适合的
  4. 对Dot现在怎么看?

01 Dot究竟是啥?

图片

这不是两个小蝌蚪,是Dot的logo,是两个形成圆圈的撇号。它们代表着两条相互环绕的锦鲤:一条代表你,另一条代表 Dot,在无尽的反思和对话中“连接你生活的点滴”。

之前他们说是智能助理,其实还是low了,尽管还是归属于AI companion类别,但更明确的定位在朋友和同事之间,在使用后,我们觉得比较接近Pi(揭秘Inflection AI:15.25亿美元融资背后,Pi如何用多层Cake模型重塑Conversation?)的定位,比较接近于私人助理类型

我们快速来体验一下这款产品:

打开做了一些设置后,最后进入App前,会引导你给Dot写一封短信,方便Dot更加了解你,进入后第一个对话也由这封信开始:图片图片

表面上看,它和传统的智能助理的对话Chat逻辑似乎很接近,但别忘了,黄叔会去体验更多的细节,这里就挖掘出两个很有意思的要点:

第一. 能够自动关联多个信息之间的元素


图片图片

看上左图,图片里提到了对谈360VP梁志辉,但后续的对话内容里,我并没有直接说过这一Title; 

在上右图,我让Dot总结今早和AI搜索相关的内容,它直接从图中的信息+文字对话信息,提炼出了我“采访了360VP梁志辉”这个要素。

第二. 可以自动关联和整理对话内容

图片图片图片


上左图,我在聊了几十条信息后,让Dot总结聊了啥,它可以没有遗漏的把几个话题点都整理出来; 

上中图,其中我把去年Dot用来做Demo的一张食谱发给了它,在聊了很多轮其他对话后,重新问他这个食谱的内容,它还是能够整理出来。

所以Dot确实有做记忆处理,按照去年的说法: 

Memory,这是Dot的第一个能力,长期记忆! 

所有和它分享的内容,包括图片、截图、PDF、链接、语音备忘录等等,它都会存下来,并且在 Dynamic File System(动态文件系统中)自动组织,这种自动还是会根据个人的习惯来串联,比如你经常和它分享笑话,它就会专门创建一个笑话文件类型,来跟踪所有笑话相关的文件。

但是是否是长记忆,还需要后面持续使用来验证。

第三. 自动串联和挖掘 

图片

这是社群一位朋友分享的,他说光这一句话,Dot就吸引他了。。。

注意,此时是写完小故事后Dot主动回复的第一段话,可以发现Dot在有意识的寻找各个要素之间的关联,“连点成线”

除此之外,在交互层面,也有一些有意思的点

  1. 在Chat界面,双指捏合,可以回到每日列表页,会轮播显示当日聊的一些主题:

  2. 左划或者按住某条对话内容,可以选择回复指定信息,Dot也会基于这条信息的前后文和你对话,并展现回复样式:



总结来看,Dot确实想实现自己的目标:

Meet Dot, the AI that grows with you—learning and evolving with every interaction.

AI陪伴你一起成长,不断了解你并和你一起进化。

02 Dot并不只是用一个模型?

图片

根据fastcompany.com的报道,有几点挺有趣的:

  1. 当你与 Dot 交谈时,你不仅仅是在与 ChatGPT 交谈。在任何时候,Dot 实际上都在参考 7-10 个不同的 LLMs 和 AI 模型,包括来自 OpenAI、 Anthropic 和 Google 的模型。
  2. 当你向 Dot 提问并告诉它关于你自己的事情时,它使用 LLMs 创建一个“心智理论”——或基本上是你的画像。(it uses LLMs to create “a theory of mind”—or what’s essentially a portrait of you.)然后,当你与它交谈时,Dot 会将其查询路由到最适合工作的 AI 模型,通过其关于你的记忆过滤你的问题。
  3. 毫无疑问,Dot 使用了大量的镜像技术(mirroring,并且总是准备好提出后续问题。它始终保持积极,并对你的情绪非常敏感。
  4. Dot 不会与你发展浪漫关系,也不会因为你多聊或少聊而让你感到愧疚。
  5. 未来 Dot 可能会获得 Spotify 访问权限

3和4这两点,非常接近Pi的对话逻辑,详情可以看Pi这篇文章内,我们描述的多层蛋糕模型:

Pi的对话生成=场景+情绪+安全(Safety)+技能调用 

图片

对于Dot的技术层面,有待于后续的持续使用,以及对方创始团队的分享。

03 最好的AI日记应该从是Chat形态么?

图片

Dot和心光,看似竞品:

图片图片

但是简单看一下就会发现底层逻辑完全不同:

图片


Dot更想帮你“Connecting the Dot”,在你大量记录后,主动替你提供一些支持和服务,就像英国管家那样:“May I Help You Sir?”,非常专业,非常贴心,甚至有些点你没注意到,它都会替你细心的考虑。

心光则更加靠后,并不会主动出现在你面前,只是在你需要时,站在你旁边,陪伴你,尽管它很懂你,但更多是在背后默默的关注你。就像你受伤后和它诉说,它会把肩膀借给你,轻轻地拍拍你。

所以Dot会非常需要关注,主动性是否会带给用户压力:

我们社群有用户吐槽:“话多到 我已经有点烦了

在Dot官方Discord频道的Roadmap里,4月9号的内测版本里,推出了The overlay和New proactive messages + ‘nudge to shuffle’两个新功能,这两个能力具体我们不展开,因为在正式的版本里面都已经下掉了,但之所以增加这两个功能,官方是这么说的:


以上两个功能主要是回应用户的反馈:

当前的主动消息可能让人感到压力:许多用户告诉我们,很难跟上 Dot 一天中反复发出的主动消息,一串未回应的消息可能成为重新使用应用的障碍。

对话需要很多精力:我们听到用户反馈希望能以不总是需要对话的方式与 Dot 互动——我们希望这些文物提供一种有趣、轻松的互动方式。

Dot 应该分担提出新话题的责任:我们希望给用户一种继续对话的方式,不总是需要他们自己设定话题——用户现在可以使用提示手势来获得与 Dot 谈论新话题的想法。


接着在5月4号的版本里,继续优化了对话逻辑:

💬 对话更新——你可能已经注意到,我们推出了一些对话更新,使 Dot 的回复更加灵活。我们希望改进 Dot 的回应与您消息意图的一致性——例如,不再每次都以问题回应,而是在适当的时候做出陈述并结束对话。我们还在尝试新的模型,并将继续调整语气和对话行为——非常期待听到你们对最近对话的看法!


在6月13日接近最终版本的测试里,继续调整了主动行为:

🎁 主动行为:我们对 Dot 的主动行为进行了调整,使其不那么频繁,并选择更一般的检查,如“你今天过得怎么样?”而不是非常具体的、高密度的话题检查。同时,我们优化了例行程序和定期提醒的一致性和性能。


可以看到尽管dot多次对对话逻辑做了调整,在线上的正式版本,我们社群的用户还是会认为它有些招人烦。

这个信号是很需要警惕的。

背后的原因是什么呢?想要成为你的英国管家,需要管家大量的获得用户信息,才能进行个性化的服务,但是,与 Dot 交谈需要时间,而且它对你的生活几乎没有被动观察,Dot只是一款App,强依赖于用户的主动输入,这会导致对话机制倾向于“索取”,希望尽可能引导用户做出更多输入,这种行为有可能会越界,导致用户反感。

综上所述,Dot的机制过度主动,但心光也过于被动,两者都有优化空间。

至于Chat是不是最好的AI日记形态,我依然持肯定观点,至于是一种什么方式,后面会给出答案。

04 对Dot怎么看

图片

New Computer 由前 Apple 设计师 Jason Yuan 和工程师 Sam Whitmore 创立,获得了 Lachy Groom、 OpenAI Fund 和 South Park Commons 以及一些天使投资者的 370 万美元资金。

我个人感觉,Dot有几个挺大的问题:

首先是发布时机太晚了,但是Siri已经非常明确的要整合AI,Google也发布了Project Astra智能助手项目,作为一个App,想要积极主动的抢移动端用户数据,比去年难度可大多了。

其次是在GPT4o出来后,给用户心智中,Chat类为交互核心的产品,响应速度非常重要,我们社群就有小伙伴说:“习惯了 4o 的回复速度 我已经开始不耐烦等了 hahhhh”,简单测试一下,Dot至少要7秒以上的响应时长,确实是太慢了。

第三是功能简单,比起去年11月的demo,现在感觉是简陋到不能再简陋的版本了,而且还有不少的问题。当前很多早期用户对于技术是非常敏感的,当前的Dot想吸引这群人,有点难。比如我在看到这个版本的时候,已经没有去年11月那种看到demo的惊艳感了,以Dot 370万美元的融资额,我也很难相信他们能在今年实现去年11月的demo里所有的功能。

第四,50条输入之后就开始收费,因为Chat是一种还蛮容易消耗对话轮次的形态,我稍微有点担心在此之前很难让用户到达Aha Moment的:

图片

总结

整体来看,Dot尽管延期了半年才上线,导致对用户的吸引力没那么大了,还是有不少理念是挺不错的,特别是“连点成线”:

我自己也挺buy in这套逻辑的,毕竟现在所有的助理类产品都是通用大模型的路子,每一轮对话就是一个session,完事就忘了。浅浅的用了下Dot之后,似乎记忆能力还行,但长期记忆怎么样,还需要再看看。

比起优点,缺点或许也挺致命,最大的问题或许是Dot的动作这么慢,我非常担心他们团队的技术实力,靠Chat形态捕获用户“资产”这一诉求在Chat本身的技术突飞猛进的时候(语言模型本身能力飞跃ing、语音端到端、多模态能力),很可能是困难的。


*作者简介:
Super黄,广西人,毕业于北京邮电大学,现居北京,
中美两家公司AI产品顾问
11年产品经理,全网10万粉丝。