【写意中国探寻汉字起源】视频|甲骨文研究进入智能时代,新技术让冷门绝学“活”在当下
【“了不起的中国汉文字”系列——甲骨文信息处理教育部重点实验室】
甲骨文,又称“契文”“甲骨卜辞”。它的发现,将有文字记载的中华文明史向前推进了一千多年。时至今日,距离甲骨文首次被发现已经过去了120余年,但人们对甲骨文的了解仍较为有限。很多人好奇,在这些充满趣味却又晦涩难懂的甲骨文里,究竟蕴藏着古人怎样的文化秘密?
识别与释读是甲骨文研究的核心问题。在已发现的甲骨文单字中,大部分未获识别。从20世纪初开始,一代又一代的专家学者们将甲骨文研究接续传承,著述不辍,并让这门古老的学问不断推出新的成果。在此期间,甲骨文破译之路也开始越走越宽。
近日,话题“破译一个未释读甲骨文单字奖励10万元”一度冲上热搜,这是甲骨文释读工作课题责任单位——中国文字博物馆,于2016年10月28日发表在《光明日报》上的公告。这则面向社会发出的“悬赏令”,一经发出便引起众多读者的注意。其中提出了“鼓励甲骨文研究者运用大数据、云计算等现代技术手段与传统研究手段相结合,形成原创性研究成果”。
在大数据、云计算飞速发展的今天,如何有效利用这些现代科技手段,助力甲骨文研究工作,是各界一直在思考和努力的方向。
地处甲骨文发源地的安阳师范学院,拥有国内唯一的甲骨文信息处理教育部重点实验室和甲骨文信息处理人才创新团队,建有甲骨文大数据平台“殷契文渊”、甲骨文活化利用中心和汉字文化体验馆等专业平台,是全国甲骨文研究的重要单位和学术中心。
研究工作的积累,促进了甲骨文信息处理学科建设。安阳师范学院计算机与信息工程学院院长、甲骨文信息处理教育部重点实验室主任刘永革介绍,目前实验室已建立四个研究方向支撑的学科体系:甲骨学与殷墟科技考古、甲骨文语言计算、甲骨文识别与字形分析、甲骨文大数据平台。同时,运用大数据和人工智能等技术对尚未破译的甲骨文单字进行多学科联合攻关,在甲骨文考释、甲骨缀合等方面实现新突破,取得了丰硕成果。
2019年,实验室向全球发布了“殷契文渊——甲骨文大数据平台”。该平台集甲骨文著录库、文献库、字形库于一体,是世界上现有资料最齐全、最规范、最权威的甲骨文数据平台,从上线之日起便面向全世界免费开放,为甲骨文研究插上了科技的翅膀,也标志着甲骨文研究进入“云时代”。
截至目前,平台数据库中共收录甲骨著录152部,种类数量为世界最多;收录甲骨图像23万多幅,甲骨文研究论著3万余篇,平台浏览量超过100万次。“通过这个平台,能让甲骨文能被更多人所看到,并且还可以借助‘人机协同’的方式,通过智能化信息提取,帮助专家破译未释读的甲骨文。”刘永革说。
“以前甲骨碎片都是靠记忆和手工一片一片地拼合。数字化介入以后,可利用人工智能图像技术进行自动缀合,团队据此研发了甲骨文自动缀合系统,目前已缀合37组甲骨碎片,这37组是人类专家还没有缀合出来的。”刘永革表示,实验室的未来目标是实现甲骨文“图形检索”,破译出一个新的甲骨文字,即用计算机人工智能图像识别系统,直接检索甲骨文拓片上的甲骨文,“这将为全球的甲骨文研究学者及爱好者的甲骨文资料查询带来极大便利,我们正在一步步向这个目标靠近”。
以甲骨文为代表的“古老绝学”,一度因为研究的人太少,而略显冷门。近年来,为推动甲骨文走向大众,让甲骨文从“绝学”变“显学”,做到“绝学”不绝,“冷门”不冷。在刘永革的支持下,安阳师范学院开设了《甲骨文信息处理》特色课程,还举办了计算机编程选拔比赛,为学生提供实验室工位以便于研究,大大提升了学生的学习和科研兴趣。
实验室科研助理刘梦婷日常负责的就是甲骨文论著信息录入工作。“因为热爱甲骨文,想到能为甲骨文整体研究贡献一点自己的力量,同时也能学到更多相关知识,就不会觉得枯燥无味。”刘梦婷说。
一片甲骨惊天下,百年研究气象新。现代科技为保护文物、研究甲骨文开辟了新的空间,而未来如何做好传承,利用好人工智能技术助力甲骨文破译,讲好甲骨文的故事,还有一段路需要走。但我们相信,这一天,并不遥远。
策划:李政葳、丁艳 拍摄:曾震宇 撰文:雷渺鑫 制作:刘昊
版权声明:凡注明“来源:中国西藏网”或“中国西藏网文”的所有作品,版权归高原(北京)文化传播有限公司。任何媒体转载、摘编、引用,须注明来源中国西藏网和署著作者名,否则将追究相关法律责任。