重塑百行千业,教育大模型发布

北京日报客户端 | 记者 赵语涵
7月26日,教育科技公司网易有道举办了“powered by 子曰”教育大模型应用成果发布会。会上推出了国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用:“LLM翻译”“虚拟人口语教练”“AI作文指导”“语法精讲”“AI Box”以及“文档问答”。
图片
今年以来,大模型成为科创界顶流,科技、互联网公司竞相发布大模型,其中既有通用类大模型,也有针对垂类行业的大模型,例如医疗、金融、在线办公等领域。
那么,大模型的出现能给教育带来哪些变革?网易有道CEO周枫在发布会上表示:“我认为,是助力因材施教”。
他向在场观众分享了大模型“因材施教”的三大优势。首先,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。
发布会现场展示了“子曰”大模型在多个场景中的应用成果,覆盖口语训练、作文批改、习题答疑等六大教育的细分领域。其中,最为瞩目的便是英语口语练习神器——虚拟人口语教练Hi Echo。
有道词典业务负责人与Echo进行了多组随机对话。记者看到,Echo能迅速理解场景和上下文,并给出迅速反馈。她的面部表情和口型生动自然,发音也非常地道,重音、弱读、升降调等细节处理到位。不仅如此,在对话过程中,Echo能够像真人老师一样启发式进行对话引导,还能进行实时反馈。对话结束后,Echo会从发音、语法等维度给予建议和润色。
“子曰”大模型背后有哪些技术累积和支持?据悉,从2016年开始,有道协同构建AI基础能力,同步组建语言、视觉、声音等团队,目前积累了有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算(HPC)四大底层技术能力。
以此次颇受关注的虚拟口语教练为例,“子曰”在语音识别能力、虚拟人驱动技术、内容生成和对话能力等多项技术能力方面实现突破。
在语音识别能力方面,支持多语种的流式低延迟语音识别技术,让Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者,不仅能判断用户说话的起始,还能让用户随时打断,智能触发后续流程。
在AI虚拟人的驱动方面,基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,实时驱动虚拟人的面部表情和语音同步的口型变化,使虚拟人能够贴近真人,以更加自然和生动的方式与用户一对一交互,从而显著提升对话的真实感和用户体验。