想看哪里点哪里,这家AI创企让盲人也能轻松读书看报

  【猎云网(微信号:ilieyun)】5月8日报道(编译:Cen

  退休的美国空军军官Stephen Hamilton在彻底失明之前曾经历过7次角膜移植和18次眼部手术,但都以失败告终。他失明了之后,也就不得不结束了他作为网络工程建筑师的工作。

  当Hamilton去参加一个帮助低视力或失明退伍军人重新适应生活的训练课程时,他有幸遇见了一样可以帮助他再次获得阅读能力的小设备。这个小设备名为OrCam MyEye,可以附着在眼镜之上。当Hamilton用手指指向某一段印刷文字(某个标志、某页书籍、某张报纸或者某份菜单)的时候,这个小设备就会用其深度学习程序解析语言然后通过一个微小的扬声器大声念给他听。

  即使Hamilton已经完全失明了,他也能够使用MyEye这个为低视力人群而设计的设备。在他第一次走回自己的房间的时候,他在门口停了下来(他之前只能通过估摸路程时间来判断房间的位置)并指向了门口的标志,这个设备就念出了“Stephen Hamilton”。Hamilton表示:“我当时都无法抑制自己的眼泪,因为我意识到我能变得稍微独立点了。”

  如今,Hamilton去哪都要带着这个小设备。而且当这家总部位于以色列的公司在2017年10月发布全新的无线版本——MyEye 2.0的时候,Hamilton在第一个月内就赶紧去更新了设备。

  可以说OrCam(在2010年由计算机科学家Amnon Shashua以及企业家Ziv Aviram创办,今年估值达到一亿美元)彻底改变了Hamilton的生活。主要还是因为这个设备能够识别人人都会的一个动作:用手指指向某样东西。用户们只需要用手指着他们希望设备读出来的东西,然后设备上的一个照相机就会识别出他们的手,接着拍一张照片并把上面的文字朗读出来。该设备的精确度很高,你甚至可以指到页面上的某一行然后它就会从你所指的那一行为起始点开始读。

  公司首席执行官Aviram说道:“我们认为指向某项东西是人类最为本能的一项行为。你看孩子们就会不停地指着一些东西并且问你那些是什么。”

  将手指指向作为整个设备的基础,MyEye在大多数情况下都能够阅读文本,以及告知用户页面上下颠倒了或者周围光线不够足。不仅如此,它还有着其它许多用途:它可以记录和识别100张面孔、识别上百万种产品、存储150个额外的物件例如信用卡或者购物单,以及辨别颜色(当用户在白天挑选衣服的时候特别实用)。尽管Hamilton表示,他经过了几个礼拜的调整之后就能顺利的使用MyEye了;但是,对于完全失明的用户来说,MyEye使用起来可能还是有点困难。

  MyEye还具备对周围人物自动面部识别,进行辨认的功能。此外,用户只要做出一个简单的手腕扭动的动作,MyEye就会自动汇报时间,就像是用户在看一个虚拟手表一样;如果用户希望MyEye停止阅读,也只需要简单地做出一个停止手势就行了。

  Hamilton表示:“我在失明之后一直认为自己是个残疾人了,然而如今那种感觉荡然无存。我感受到了一种从未体验过的自由。”

  机器是如何帮助人们“重获光明”的?

  OrCam花了5年的时间来开发MyEye,包括在2015年推出的手势识别功能。Aviram透露,在研发过程中他和团队成员与上百个潜在用户进行了交流,并且他们之中的90%表示,特别希望能够重新获得阅读能力。Aviram很是意外,因此为了更深入地去了解用户的此项需求,他尝试着让自己度过了没有阅读任何东西的一天。他说道:“只过了一个小时,我就知道了能够阅读是多么重要的一件事。只需要五分钟你就会了解到我们这个世界是离不开文字的。”

  MyEye的其它功能也都来自于用户调查。一些用户要求加上色彩识别功能,这也是Aviram先前完全没有想到的。Aviram还透露,就因为某个用户说道“我在一米以外就认不出我老婆了”,整个团队就快马加鞭地给设备加上了面部识别功能。这些功能虽然在其他产品中也很常见,但是它们一般都只具备某个单一功能。Hamilton就提到了他从收到的其它各种设备:一个笨重的文本阅读器、一个条码扫描仪以及另一个色彩分辨仪。Hamilton表示:“这些东西都没有那么实用。我总不可能总是把这些巨大的东西拖到我的邮箱那然后让它读我的信吧。”

  MyEye的第一个版本还包括一个智能手机大小的计算包,并通过电缆和相机连接在了一起。MyEye2.0版本就不再需要这个额外的计算包了——如今整个设备都只有你的手指大小并且只有0.8盎司的重量。更不可思议的是,所有的这些功能,包括阅读文本、识别人脸和识别物体,都可以通过这个小小的设备来完成,而不需要任何云设备的帮助。

  MyEye所使用的深度学习算法已经在无数的文本以及产品上试验过了。Aviram表示:“MyEye几乎可以做到像一个小孩子那样去学习新的东西。通过使用大量的数据和复杂的算法,你可以教授该设备去辨别不同的产品、不同的人以及不同的语言。”所有的这些过程都是离线完成的——这主要也是为了保护用户的隐私。

  照OrCam公司的话来说,这个设备不仅给Hamilton,也给其他成千上万的用户带来了全新意义上的一种独立。“能够独自去书店并且坐在那静静地看书真是乐趣无穷,”Hamilton说道,“除了我的拐杖之外没有人知道我看不见。当他们发现的时候常常会不知所措,因为这可是一个盲人在读一本书或者在餐厅里点餐。”

  使用这个设备之前需要几个小时的训练,并且想要彻底习惯也差不多要好几个礼拜,尤其是弄清楚如何调节自己的脑袋才能让这个设备好好地为你阅读,则需要花更多的时间。Hamilton现在对这个产品最大的不满意就是,它只能保持一个半小时到两个小时的电量,之后就又要花40分钟来充电了。所以,他只好无论去哪里都随身带着充电宝。他还希望,以后他不需要再带眼镜,而是可以把MyEye别到自己的耳朵后面去。

  这个设备并不是没有带来过混乱。Hamilton回忆起了他在一家餐厅带着第一版的MyEye的事情,当时MyEye错把为他服务的一位女服务员给识别成了男性。不过,他也表示自从使用了第二个版本的MyEye之后,这种错误识别就再也没有出现过了。

  OrCam的潜在用户不仅仅是那些低视力以及失明的人,对于那些有着阅读障碍或者无法快速阅读的老年人来说,MyEye也可以很好的帮助到他们。OrCam表示到目前为止,它已经在23个国家卖出了数万台设备,并且该设备还能应用于18种语言——研发团队目前还在开发东亚语言。

  MyEye2.0还内置了一个麦克风,以更好地“为下一个更先进的功能做准备”。Aviram设想着,通过将语音助手跟手势识别系统相结合,让用户能够更自然地与设备进行交流。例如,用户可以举着一份文件并向MyEye问到这是什么。如果用户手上拿的是电话账单,就可以接着问MyEye具体的费用是多少,而不需要再让它把整份账单都读一遍,亦或是随机地点一些地方碰碰运气。将手势识别和语音识别相结合的功能可以让MyEye先给用户读一些文章标题,然后用户就可以根据标题再让MyEye读一些特定的内容。

  目前,MyEye还不能更完整地传达给用户他们面前的所有东西的信息,这让一些用户感到失望。当OrCam的销售总监Rhys Filmer给我演示这个设备的时候,他告诉我有些人希望它能够描述出他们眼前的场景——也就是说他们希望MyEye能够完全替代他们的眼睛。但是,很可惜这项技术还没发展到那种地步。就算可以,那也需要MyEye能够连接到智能手机或者云设备上,这就又会引起人们对于隐私泄露的担忧。

  就目前而言,MyEye将手势识别功能应用的未来很好地展示了出来。未来,我们可以利用声音和肢体语言来跟一个智能助手更轻松地交流,而这个智能助手就可以将所获得所有信息反馈给我们。尽管,这项技术还是不能帮助盲人恢复他们的视力,但是起码它能够帮助像Hamilton这样的人去重新适应一个几乎不再适合他们的世界。