古汉语大语言模型“AI太炎 2.0”发布会在京举行

中国教育报-中国教育新闻网讯(记者 焦以璇)8月27日,北京师范大学古汉语大语言模型“AI 太炎 2.0”发布会暨数智时代应用语言学学科建设路径与方法座谈会在京举行。教育部语言文字信息管理司司长刘培俊、北京师范大学常务副校长王守军出席发布会,项目负责人、北京师范大学文学院院长王立军和专家学者代表共同启动系统上线。来自北京高校和相关科研机构的三十余位专家学者及十余位海外汉学家参加了本次会议。

图片

在致辞环节,教育部语言文字信息管理司司长刘培俊肯定了北师大中文学科在服务国家语言文字事业方面进行的不懈探索和取得的突出成就,指出大语言模型技术可以大幅提高古籍整理研究效率,可望为普及推广国家通用语言文字、传承弘扬中华优秀语言文化、世界共享中国特色语言文明提供语言智能技术支持。北师大副校长王守军表示,项目组开展以“AI太炎”为代表的古籍整理智能化关键技术研究,是新时代国家语言文字事业发展的迫切需要,对于传承弘扬中华优秀传统文化来说具有重要意义。

据项目组负责人王立军介绍,为了致敬近代国学大师章太炎先生,秉承章黄学派弘扬中华优秀传统文化的宗旨,该模型命名为“AI太炎”。针对古汉语信息处理任务“低资源”“富知识”的特点,项目组从头构建了专门适用于古汉语文本理解的大语言模型。该模型具有较强的古典文献释读能力,支持词义注释、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务,且兼容繁简中文输入。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。

作者:焦以璇