百度地图推出语音定制功能,可以生成个人语音包

图片
图片来源@视觉中国
钛媒体快讯 | 9月19日消息:百度地图事业部总经理李莹今日宣布,百度推出行业首个地图语音定制功能。据李莹介绍,语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。
如图,用户可从百度地图首页进入语音定制页面,可选择性别,还可以录制童声。录制的文本方面,用户也可以选择系统推荐文本,卡通文本和电影台词。特别是录制童声时,百度为低龄儿童设置了语句更短、可重复的儿童语句。录制完的语音包可以自己使用,也可通过微信或者百度地图分享给他人使用。
图片
百度地图语音定制模块图示
据悉,用户定制的语音包使用场景比较广泛,在手机地图的任何场景中都可使用,比如景区智能语音导览、智能语音交互等全部场景使用。用户可免费使用自己或家人的语音包在景区游览。
李莹也特别强调,在整个流程中百度地图遵循了业界最标准、最成熟的安全规范,采取了非常安全的保护措施,会最大程度的保障每个用户的安全隐私。“百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。”
李莹在演讲中介绍道,如果做一个通用大库的语音包,大概需要录制的语音量是上万句,制作周期近半年。如果做个人定制的,如某一个明星的语音包,需要在大库基础之上录制1000到2000句语音,要在专业的录音棚里面录制大概两周时间,而真正把这个语音包用语音技术生成出来需要两个月的时间。
新的语音定制功能大大缩减了此前语音录制的成本。百度语音首席架构师贾磊介绍了语音定制功能背后的技术:
“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低。”
图片
云端深度学习语音合成技术可形成不同风格的声音
贾磊介绍道,以前语音合成大多数都是新闻播音腔,而现在百度的语音合成可以有多重风格和声线。在现场原声与合成声音的比对测试中,两种声音几乎分辨不出差别。
当前,在数据生产方面,百度地图80%数据采集环节已实现AI化,拥有3000万的POI空间图谱、700万的用户兴趣图谱,共同组成了百度地图POI高精知识图谱。
(本文首发钛媒体,作者/芦依)