体验小鹏汽车新版语音助手:像个人了?

关注并标星电动星球News
每天打卡阅读
更深刻理解汽车产业变革
————————
出品:电动星球 News
作者:毓肥
上面这个视频,录制的是小鹏汽车语音助手「小 P」的新声音。
可惜我们没有录制旧版小 P 的声音做对比,但相信我们的小鹏车主读者们可以发现,新版声音有了全方位的改变。
全方位指的是音色、自然度、连贯性...等等等等。我们最直观的感受,是新版小 P 更「像人」了。
体验当天,小鹏还找来了多辆热门汽油、电动车型,让我们逐一对比各自的语音助手能力。
图片
结果没有悬念,在我们当天体验过的几款车型里,小鹏目前在「语音助手」领域,体验、性能、功能上都要明显领先友商起码一个级别。
自从 2005 年讴歌率先在车内搭载语音控制功能,「噱头」、「鸡肋」这样的定语就一直伴随着语音输入,直到现在。
即使是 16 年之后,汽车语音控制依然面临障碍。对于大部分支持语音控制的在售车型,也许「能用」已经是天花板,更不用说「好用」,甚至让用户「想用」。
小鹏和它的小 P,可以改变这一现状吗?新版小 P 除了更拟人自然,还有哪些特点?
下面开始。
一、小 P 的新生
用同行一位媒体老师的话总结,小 P「换了个人」。
其实这句话值得商榷,因为老版小 P 虽然功能突出,但「机械感」依然很强,词语和短句之间的停顿和其他车企的语音助手差不多,距离「像人」还有不少距离。
1. 因此,新版小 P 感受上最大的提升,应该说「更拟人」准确点。
小鹏这样总结有关的技术改进:真假难辨(停顿音律更自然)、HiFi 音质(高保真)、更有温度(音色亲切有情感)。
图片
有多拟人?除了文章开头大家都听得见的实录,小鹏还拿新版小 P 跑了个分。在微软的 MOS(mean opinion score)AI 语音测试中,新版小 P 拿到了 4.49 分(满分 5 分),而真人的成绩是 4.5 分。
图片
分数可以分高下,但很难准确对应用户感受。小鹏另一个做法是将新版小 P 的采样率从之前的 16K 提升到了 24K。
图片
采样率,指的是录音设备在单位时间内对模拟信号采样的多少,采样频率越高,机械波的波形就越真实越自然。
目前 24kHZ 采样率对应的,已经是 FM 调频广播级别的采样率,再往上需要达到 44.1/48kHZ,才会是有明显提升的 CD 级采样率。
图片
更自然的音色给了小鹏更多发挥空间,新版小 P 号称可以实现 14 种情绪,包括生气、害怕、悲伤、愉快等强烈情绪。
2. 除了更拟人,新版小 P 还实现了更高的在线率——97% 以上。
图片
在线率指的是小 P 在不同场景下正常工作的比例。官方表示 97% 以上已经覆盖了绝大部分的弱网、无网场景。
「端云融合多级缓存」,小鹏表示这是新版小 P 在线率的保证。端云融合,本质上是在线深度学习引擎+本地离线引擎的协作;多级缓存,则是对应的本地缓存+在线缓存。
小鹏汽车负责相关功能的产品经理郝超告诉我们,他们一共为新版小 P 设置了 3 级的缓存机制,确保适应尽可能多的网络状况。
3. 但网络卡只是语音助手不好用的其中一个诱因,性能也是。
我们当天测试的多款车型,车机芯片囊括了高通、英伟达等厂商,算力也高低不一。仅有搭载高通 820A 芯片的几款车型实现了较为灵敏的语音唤醒和响应。
图片
那么新版小 P 的功能升级,会不会带来车机芯片的负担?
郝超表示「车机能耗平衡」也是小鹏着重考虑的点。新版小 P 最终实现的效果,会是「820A 芯片占用率增加不超过 1%」。
「当然 8155 的体验会好一点,因为整体性能更强,占用率波动也就更小。但即使是 820A,用户的(流畅度)体验跟之前相比没有任何变化」,郝超说。
二、更想用的语音
前不久体验 Xmart OS 2.6.0 的时候,我们的结论里面有一句:一个功能能用、好用,这非常重要。而在这之上,如何让用户「想用」,同样值得讨论。
小鹏的全场景语音,我们一直都认为是「想用」级功能的典型。
那么,该如何描述这种「想用」?
测试现场有一辆油车,我们无法用语音控制空调、开关车窗、打开车辆设置...等等一系列可以用小 P 轻松搞定的操作。甚至于,这辆油车按语音键唤醒语音助手之后,再按一次语音键是无法退出的,只能按一下 home 键。
图片
开惯了这种车的用户,自然不会认为语音助手是可用的功能。
到了另一款以高配自动驾驶功能为主打的纯电自主品牌车型,情况好了不少。可以语音控制空调、添加导航途经点、开关车窗...等等基本操作。
这辆车的语音助手已经达到了「可用」状态,但还远谈不上好用。首先是识别率一般,其次是响应速度更一般,更何况来自第三方的语音助手无法获取更多权限,功能也就不要强求了。
至于上一个版本的小 P,我认为完全符合「好用」的要求。
截止到 2.6.0,小 P 已经实现了几乎所有车内设置的语音覆盖。开关车窗可以说「开/关百分之 XX」,听歌可以说「快进 XX 秒」...等等。
图片
而在此之上,2.6.0 的小 P 更新了语音变道功能。NGP 状态可以叫小 P「帮我想左/右变道」,而且实测反应相当敏捷,甚至不比打灯变道慢。
用语音实现手动操作的功能,这叫能用;语音覆盖绝大部分手动控制,并且反应灵敏,这是好用;语音不断实现没有先例的功能拓展,才能让用户想用。
上周活动的开场,郝超展示了这样一张 PPT:
图片
在小鹏汽车的思考中,语音应该是智能汽车的最佳交互方式。郝超则表示「人类数百万年进化得出的最佳沟通方式,就是说话」。
最后举一个小小的例子:飞机和自动驾驶。
当全自动驾驶实现,方向盘和踏板彻底消失,车内座位布局也从对着行驶方向,改成卡座式设计,我们应该如何跟汽车沟通?
不需要你开的飞机,也许是一个很好的参照方式,喊空乘过来(语音交互)或者按服务铃(按键),类比一下,它们也许真的会成为未来汽车唯二的操作方式。
如果我们把眼光放到那个时候,那么现在即使是「能用」的语音助手,也完全不及格。
因为它无法控制车辆更多的部件,比如驾驶相关、比如车辆设置,还比如第三方应用生态。
而现在「好用」的语音助手,也应该循着刺激用户使用欲望的路子前进。因为未来汽车也许只需要你有一把嗓子,而到了那个时候,语音助手或许将成为自动驾驶以外,排在第二,甚至并列第一的智能标准。
(完)
星球文章看这里
图片
NIO Power,蔚来最大的阳谋
图片
解析国产 Model Y 白车身:
「完美」的一体压铸+「最好」的安全性能