当ChatGPT开始说中国方言

作者袁博

来源AI先锋官


等了四个月的ChatGPT高级语音模式,终于上线了

就在昨天,OpenAI正式宣布,ChatGPT高级语音模式(Advanced Voice Mode)将于本周内正式面向Plus用户及Teams用户推出,企业和教育客户将于下周开始获得访问权限。

OpenAI首席执行官Sam Altman在社交平台上难掩兴奋之情,表示“希望你们觉得等待是值得的”,还加上了委屈和比心的表情。

图片

不止如此,OpenAI还发布了一个包含 14 种语言的多语言数据集,用于评估语言模型的性能。

需要注意的是,全新的语音功能适用于Open AI的GPT-4o模型,不适用于最近发布的预览模型o1。

巧的是,语言学习软件多邻国在昨天凌晨也推出了AI视频通话功能,用户可以和多邻国角色“拽姐”练习口语。不过,目前只适用于英语、西班牙语和法语。(详细内容请看:多邻国推视频通话功能,看看真人般AI+语言学习有多酷)

OK,现在回到ChatGPT,就让我们来看看它都有什么“高级功能”吧。

据介绍,ChatGPT高级语音模式支持超50多种语言

官方也发布了一条演示视频“显摆”了一下。


有意思的是,经网友测试,发现它不仅懂各种腔调的英语和很多小语种,甚至连中国方言都懂

(视频来源微博用户:互联网的那点事)

就连日本口音的英语它也学得有模有样

此外,ChatGPT高级语音模式还新增了5个各具特色的声线,分别是:阿伯(Arbor)、梅普尔(Maple)、索尔(Sol)、斯普鲁斯(Spruce)和维尔(Vale)。

加上此前的四种声线,用户现有9种声线选择,几乎与谷歌的Gemini Live一样多

值得注意的是,OpenAI 在春季更新时展示的“天空(Sky)”声音并未出现在此次更新中。

此前,著名演员斯嘉丽·约翰逊(Scarlett Johansson)指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。

除了语言丰富这一特点外,它还有两大亮点,一是支持用户为语音助手设定“自定义指令”;二是具备“记忆”功能,能记住用户偏好的交互方式。

官方也发布了其演示视频,就让我们一起来看一看吧


可以看到,在ChatGPT系统内不仅可以可以自定义对话语速,也可以预设个人姓名与住址信息,这样ChatGPT就可以使用预设的名字与用户交流。

当你预设完住址信息后,再发起新一轮对话时,如询问“这个周末天气真好,户外有什么有趣的活动可以推荐吗?”高级语音助手将调用用户之前输入的住址信息,主动推荐周边的游玩地点,甚至贴心地规划出行路线。

是不是很方便。

只不过,有一点比较遗憾,就是它有时长限制!网友们体验都发现,只能和ChatGPT聊45分钟左右

对此,OpenAI的官方回答是,每天的限制时间可能都不一样,当天还剩15分钟时,会进行提醒。

但话又说回来了,苍蝇腿也是肉,那也比吃“饼”强,OpenAI的饼可真是没少吃,所以说,有条件的小伙伴还不赶紧去试试!

 .END.

往期文章回顾