为破解甲骨文之谜 这个团队三代人青春接力了39年

今天是五四青年节,青春的气息扑面而来。有人追寻热血青春,在军营中淬炼成钢;也有人用耐心焐热冷板凳,在实验室挥洒青春。
在河南安阳师范学院,有一支“甲骨文传承研究创新团队”,三代人青春接力,只为破解甲骨之谜。他们是如何用最先进的人工智能技术,研究最古老的中国文字呢?一起走进他们的故事。
图片
甲骨文信息处理教育部重点实验室字形识别与分析研究室主任 张展:我平时的爱好是拼图,我的工作也是拼图,不过我拼接的是3000多年前的文化拼图——甲骨文。
图片
张展,2019年博士毕业于中国科学院大学,主要研究“数字图像处理专业”技术,喜欢历史的他回到老家河南,加入了当时刚成立不久的全国甲骨学研究领域唯一的教育部重点实验室,负责研发用人工智能技术拼接甲骨碎片。
图片
释读甲骨文是甲骨学研究的核心,而“甲骨缀合”也就是拼接甲骨,则是让甲骨文走向“重生”的必经之路。
从甲骨文被发现120多年来,已发现的甲骨大约有16万片,但著录公开的不到6万片,已经缀合的不到7000组。
要从数以万计的甲骨碎片中寻找并拼出完整的一块,绝非易事。
图片
甲骨文信息处理教育部重点实验室字形识别与分析研究室主任 张展:甲骨文拼图有多个目标,像大海捞针。比如多个完整的甲骨碎成多个碎片,这属于多目标拼接,然后是图像边缘等距离拼接、图像的纹理拼接、图像中这些残词残句的拼接,我们需要开发1个软件,同时解决这4个问题,这是最难的。
图片
经过几百个日夜的潜心攻关,张展和团队利用边缘等距离拼接算法、深度拼接模型等技术,最终研发出了这套甲骨文自动缀合系统,成功缀合78对甲骨碎片。其中一对还发现了3000多年前商代的一次日食记载,为商代史和历法研究提供了新的依据。
图片
甲骨文信息处理教育部重点实验室字形识别与分析研究室主任 张展:它可以在不到两分钟时间内,就从1500片甲骨中筛选出300多片。系统还可以把这些相似度比较高的进行排序,为专家缀合甲骨提供数字依据。
图片
甲骨文研究到底有多难?拼接已是不易,拼完之后,研究上面的文字更是难上加难。
图片
目前,已知的甲骨文中,像这样的单字有大约4500个,无数中外学者倾心研究上百年,仍有大约3000个字尚未破解。而只有破解这些文字,才能研究背后的历史。
图片
眼下,张展他们正向更难的甲骨文字形结构AI匹配识别,以及甲骨文词性推理考释发起攻关。
图片
甲骨文是3000多年前刻写在龟甲、兽骨上的文字,生虫被蛀,风化剥落,保存、展示、利用都非常不易。
图片
如何更好保护甲骨文物?如何利用现代技术破译甲骨上的未解之谜?背后是甲骨文传承研究创新团队三代人39年的青春接力。
图片
39年里,团队开创了甲骨文信息处理学科,填补了学科领域空白;研发出甲骨文可视化输入法,推出了全球首个甲骨文数据库“殷契文渊”,让甲骨文研究进入“云时代”。
图片
(总台央视记者 周培培 河南台 安阳台)