重塑百行千业，教育大模型发布

北京日报客户端

2023-07-27 10:21发布于北京北京日报客户端官方账号

北京日报客户端 | 记者赵语涵

7月26日，教育科技公司网易有道举办了“powered by 子曰”教育大模型应用成果发布会。会上推出了国内首个教育领域垂直大模型“子曰”，并发布了基于“子曰”大模型研发的六大创新应用：“LLM翻译”“虚拟人口语教练”“AI作文指导”“语法精讲”“AI Box”以及“文档问答”。

今年以来，大模型成为科创界顶流，科技、互联网公司竞相发布大模型，其中既有通用类大模型，也有针对垂类行业的大模型，例如医疗、金融、在线办公等领域。

那么，大模型的出现能给教育带来哪些变革？网易有道CEO周枫在发布会上表示：“我认为，是助力因材施教”。

他向在场观众分享了大模型“因材施教”的三大优势。首先，大模型能为学生提供个性化的分析和指导；其次，大模型能够实现引导式学习，与教师一样，提出问题并引导学生自行探索答案；最后，大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容，大模型能随时满足学生的动态需求，帮助孩子培养更综合的能力。

发布会现场展示了“子曰”大模型在多个场景中的应用成果，覆盖口语训练、作文批改、习题答疑等六大教育的细分领域。其中，最为瞩目的便是英语口语练习神器——虚拟人口语教练Hi Echo。

有道词典业务负责人与Echo进行了多组随机对话。记者看到，Echo能迅速理解场景和上下文，并给出迅速反馈。她的面部表情和口型生动自然，发音也非常地道，重音、弱读、升降调等细节处理到位。不仅如此，在对话过程中，Echo能够像真人老师一样启发式进行对话引导，还能进行实时反馈。对话结束后，Echo会从发音、语法等维度给予建议和润色。

“子曰”大模型背后有哪些技术累积和支持？据悉，从2016年开始，有道协同构建AI基础能力，同步组建语言、视觉、声音等团队，目前积累了有道神经网络翻译（NMT）、计算机视觉、智能语音AI技术、高性能计算(HPC）四大底层技术能力。

以此次颇受关注的虚拟口语教练为例，“子曰”在语音识别能力、虚拟人驱动技术、内容生成和对话能力等多项技术能力方面实现突破。

在语音识别能力方面，支持多语种的流式低延迟语音识别技术，让Echo在中式英语、英语、中英混合等场景下游刃有余；声学降噪、回声消除、自动语音检测、自动断句等技术，则让它像一个真正的倾听者和交流者，不仅能判断用户说话的起始，还能让用户随时打断，智能触发后续流程。

在AI虚拟人的驱动方面，基于自主研发的情感识别算法和实时渲染驱动引擎，对播放的语音数据进行深度分析，实时驱动虚拟人的面部表情和语音同步的口型变化，使虚拟人能够贴近真人，以更加自然和生动的方式与用户一对一交互，从而显著提升对话的真实感和用户体验。

查看原图 285K