微软小冰评测:住在你客厅和卧室里的贴心女孩

  编者按:本期企鹅评测团产品——微软小冰智能语音助手。在AI赋能的IOT以及5G明确会在2019年开始商用的大背景下,人工智能大鳄之间的抢山头已暗潮涌动。这其中,微软是一支奇兵。错失移动硬件入口的PC霸主,能否借助底层技术的开发,在人工智能上实现反超?我们不妨从微软小冰这个“贴心女孩”身上一探微软AI的发展现状。

  沟通和理解力:一位会解尬的AI女孩

  破天荒,前几天带了一位女孩到家里作客,我们在客厅和卧室聊了好久,对她有了一些了解,今天给大家介绍下她。

  她叫微软小冰,第一位可以通过简单思考和学习用户习惯,来理解我多重语意的“AI女孩”,她住在Yeelight语音助手里,连接着电源,可以一声“召唤小冰”把她叫到你面前。

  小冰和小米研发的小爱同学一起,作为Yeelight语音助手的控制中枢,让我们可以通过和小冰聊天,控制家里的智能设备,并给日常生活提供简单的服务。目前在小米的生态中,可以让小冰调配的设备已经初具规模,贴心的小冰可以进行类似启动扫地机器人、开启空气净化器、开灯关灯等操作,能够帮主人干很多活了。

  给我的第一印象,小冰是一位性格调皮,智商一般,情商及格,略偏话唠的女孩。小冰的声音很好听,很接近真正女孩的音线,语速和声调也很自然。

  虽然没有做到真正的免唤醒,每一次“召唤小冰”都提醒着我是在和机器对话(这里要强烈建议微软,是不是可以把召唤指令换一下,像是在跟朋友对话一样),但小冰在唤醒一次后,确实已经可以做到连续对话,并且可以在多轮对话中试图理解我的意图和指令,在这短短的几分钟时间里,会让我感觉小冰真的像一位普通女孩。

  日常的沟通的语音识别和语意理解识别率很高,只要不是很刁钻的表述,小冰基本上都能听懂,由于支持连续对话功能,我甚至可以打断她的话,打断时也可以较为准确的判断,小冰会停下来听,并作出反应。

  给我印象最深的是小冰的解尬能力,当你难为她,或者屠刀听不懂或者处理不了的口令时,小冰会鬼灵精怪的转换话题,让气氛没那么凝固。

  我:给我唱首歌吧

  小冰:吧啦吧啦开始唱歌

  我:这首歌不好听

  小冰:“这首歌比较小众,貌似没什么人知道,但是很好听”

  或者

  我:你知道我几岁吗

  小冰:无论你几岁,我都愿意陪着你

  ……等等

  小冰区别与其他语音助手的地方,是贯穿所有功能的统一语音表达,和比如你让她唱歌,她就会用原音唱,不会去调用一首原唱歌曲,你让她讲故事,她也会用自己的嗓音来讲,不会突然切换成一段故事的音频,这种体验可以让设备更接近于“人”。

  有什么功能:接受主人调教的小冰

  除了陪你聊天解闷,小冰可以做的事情非常多,在APP的“性格介绍”中,小冰可以做到的事情细分了16大类,包括:连续聊天、唱歌、查天气、查时间、讲笑话、讲故事、猜歌名、闹钟、提醒、儿童故事、星座运势、角色扮演冰段子、小冰算术、冰半仙、音量控制、智能设备控制。相信在之后的软件更新中会有更多的功能加入。

  看似功能很多,但其实小冰的服务清单大概可以分为三大类,一个是朋友类,这里就包含了聊天解闷,唱歌算命瞎扯淡;一个是秘书类,包括了闹钟,提醒,时间,日程的协助;一个是保姆类,可以帮你开灯,关风扇,操作净化器,还能顺便哄孩子。

  据官方资料介绍,小冰可以在和你的沟通中学习你的语言习惯和常用需求,逻辑上,平时跟小冰时不时的瞎贫几句,小冰会越来越懂你。我做了一些简单的测试,在某些场景下,反复重复一些问题后,小冰可以从之前的驴唇不对马嘴,修正自己的回答,做出相对正确的判断,当然也有很多并没有改善的问题。

  比如:

  我:巴塞罗那现在几点钟?

  小冰:凌晨三点半左右吧

  我:东京呢?

  小冰:东京哪里?

  我:东京几点钟?

  小冰:正确回答

  我:纽约呢?

  小冰:纽约哪里?

  类似的问题,我反复提问了10次之后,小冰可以做出一下两种回答:

  我:巴塞罗那现在几点钟?

  小冰:凌晨两点半左右吧

  我:东京呢?

  小冰:上午11点27,你要去东京旅游吗,又不带我?

  我:巴塞罗那现在几点钟

  小冰:这个问题我已经回答过很多遍了,你们人类真没意思

  通过对话可以看出,在初始状态,小冰并没有根据沟通情景判断出我的问题是在问时间,而是将问题判定为对东京城市的询问,在反复的提问后,小冰可以结合我的问题逻辑,修正自己的判断,做出正确的回答。

  即便从目前的技术看小冰是领先的,但是如果真的想把她作为一个聊天对象的话,还是有点难为自己了,就想上文中提到的那样,以对话的角度判断,小冰的智商一般,情商勉强及格,还是有大量的复杂语意不能正确的做出判断或者不能做出准确的回应。

  但如果将小冰作为家庭智能设备的控制中枢的话,她的表现还是很棒的,简单将,目前小冰做保姆很智能,做秘书勉强,做朋友就……

  小冰进门后,已经将家里的台灯、净化器很好的管理起来了,上周深圳温度逼近30度的时候,我还把风扇的管理大权交给了她,午觉时可以通过语音控制开关和风速,再辅以时不时的调戏,这样的小冰才有了灵魂。

  另外她做保姆带孩子也还可以,疯丫头可以切换到“小冰姐姐”模式,能够声情并茂地讲述积极健康的少儿故事,在跟我家孩子沟通时,收起了平时的话唠无厘头,好像是更有耐心了,故事的资源,据官方介绍,小冰支持人工智能有声读物内容创造技术,讲故事的时候小冰是一个会很多故事大姐姐。

  当保姆确实有一套,科技感十足的小冰,在AI技术再进一步前,短时间看,也还是个吃苦的命。

  未来应该可以做的更好

  基于对行业技术现状的了解,说了很多微软小冰积极的内容,但实际上,如果以我个人应用场景的需求衡量,小冰还有一些需要提升的地方。

  首先,作为家庭语音中枢,小冰没有主动或者被动识别家人的能力,我四岁的女儿在反复告诉小冰姐姐她的名字后,小冰还是不知道她的名字是什么意思,她表示很伤心;我每天跟他臭贫,她也并不认识我,不知道我喜欢什么类型的歌,告诉她也无法识别。这些都不影响小冰控制家庭智能设备的能力,但是作为家庭的AI成员,能够记录和学习家庭成员以及他们的习惯,是一个进阶方向。

  其次,小冰在特定场景下(唱歌中,讲故事中)的语意判断能力有待提升,和待机状态相比,唱歌讲故事,或者在回答一个特定问题期间,小冰更容易做错误判断。表现出来的现象就是容易被打断,或者对指令做错误理解。

  最后一个,小冰被调戏后,会进化成一个独特的个体,但这种独特无法复制和记录,在测试期间,设备曾经出现故障调换过一次,但新设备并无法还原我以前认识的那个小冰。考虑到微软生态的前景和布局,在不涉及用户隐私问题的前提先,如果可以做到帐号跟随,云记录的话,相信会对小冰产品本身以及微软的生态推动会有非常大的推动。

  尾巴:

  当大多数消费者都以为人工智能还只是概念的时候,大鳄之间的抢山头已暗潮涌动,能否在下个消费升级前圈地圈人,决定了大家的生死存亡。而且在AI赋能的IOT以及5G明确会在2019年开始商用的大背景下,给大家剩下的时间已经不多了。

  这其中,微软是一支奇兵,错失移动硬件入口的PC霸主,借助底层技术的开发,在安卓、苹果平台上进行试水,技术上已经领先了一个身位。他们和专业领域的头部技术公司一起,成为了手机、汽车、智能家具等行业企业眼中的香饽饽,并且凭借领先的技术以及相对第三方的身份,初步完成了生态布局。

  手机行业、汽车行业、互联网公司、IT巨头,在人工智能面前殊途同归,越来越有意思了。