
张昌帆巨富配资
中青报·中青网记者 朱娟娟 雷宇
当3000多年前的龟甲兽骨文字遇上现代人工智能,会碰撞出怎样的火花?
在华中科技大学,由00后大学生管海粟领衔的“卜算子”团队,历经3年研究,以“多途径人工智能辅助甲骨文破译系统”,为溯源中华文脉注入科技动能。
“卜算子”团队在开展研讨。受访者供图
甲骨文,又称“契文”“甲骨卜辞”“殷墟文字”或“龟甲兽骨文字”,主要流行于商周时期,是汉字的源头,藏着中华民族的文明密码。然而,自1899年被发现以来巨富配资,因研究专业门槛高,考释工作一直存在着诸多困难。学者胡适曾打了个比方,“释出一字甲骨文,好比发现一颗新的行星。”
“传统破译依赖专家经验,能否用AI打破瓶颈?”2022年,作为华中科技大学未来技术学院的大二学生,管海粟通过“实验室轮转”人才培养项目加入软件学院白翔教授的本科生创新团队,萌生了这一想法。
彼时,管海粟恰逢与学校从事人工智能视觉与自然语言处理研究的刘禹良老师课题组相遇,出于对“揭开更多甲骨文神秘面纱”的兴趣,管海粟加入其课题组,开启用人工智能辅助破译甲骨文的探索之旅。
收集整理国内外相关领域的上百篇文献进行学习,暑假里到河南安阳殷墟遗址、中国文字博物馆调研,与甲骨文专家深度交流……团队发现,彼时的AI研究大多聚焦对已破译甲骨文的识别检测,对未知文字的辅助破译仍是“未充分开发的荒地”。
是否可以通过生成模型,模拟甲骨文演变成现代汉字的过程来辅助破译?管海粟的设想,得到了白翔、刘禹良两位老师的认可。
“必须攻克!”课题组5位同学达成共识,大家分别尝试用不同路径探索辅助未知甲骨文破译的方法。
破译的第一步巨富配资,是搭建高质量数据集——这是AI模型的“粮食”。
团队成员分工协作,将《甲骨文字编》《西周金文字编》等典籍与“殷契文渊”等甲骨文数据平台的样本整理录入,两个月内建成数据集,如今已升级为公开的全球规模最大的甲骨文单字和演变的破译基准库。
“甲骨文破译像拼图,既要认字形,又要懂语境。”管海粟的科研笔记里,记录着团队的破局思路。管海粟高考数学成绩148分,甲骨文相关的文科知识相对薄弱,来自人文学院古文字强基专业的2023级本科生李祎萌迅速“补位”,团队协同合作,经过数百个日夜的模型训练与优化,创新构建起“双轨字形分析破译算法”。
具体来说,团队一方面首次将“图像生成”理念引入甲骨文研究,模拟文字从甲骨文到现代汉字的演变过程,实现从模糊形态到清晰结构的转换;另一方面,研发新型部首拆解模型,将未知文字拆分为可识别的“拼图块”,并还原为现代汉字的组合逻辑。
指导老师刘禹良注意到,团队成员都是基于浓厚兴趣自发做好每项工作,“交代给他们的任务总能‘超预期’完成”;管海粟则思维严谨客观、知行合一,“这是一个‘科研新人’身上非常难能可贵的品质”。
假期里,大家也依旧投入到紧张的研发工作中来。2024年大年初一,团队成员因一组实验数据共同欢呼。“那一刻,所有熬夜改代码、反复调参数的疲惫都烟消云散了。”管海粟回忆道。
在刘禹良的指导下,团队不断优化模型与实验。最终,所构建的系统能够从“形、义、理”三个层面出发,形成甲骨文从字形结构还原、语义生成到文献佐证的全流程辅助破译路径,为专家考释提供可靠依据,有效提升破译效率。
如今,团队成果已落地生根:研究论文入选国际计算语言学年会并获评最佳论文;申请基于条件扩散模型的甲骨文辅助破译方法、基于分类模型的甲骨文辅助破译方法等AI辅助破译甲骨文相关国家发明专利9项;向金山、华为等企业提出的古籍数字化合作方案,正推动技术从实验室走向产业应用。
“卜算子本科生研究团队研发的人工智能系统,创造性地将条件扩散模型应用于甲骨文形构辨析与语义建模,相关研究成果为甲骨文研究开辟了新质技术路径。”不久前,中国社会科学院学部委员、甲骨文研究专家宋镇豪给出如是评价。
宋镇豪表示,甲骨文的考释与传承,需要一批兼具人文修养与科技素养、敢于探索、勇于创新的复合型人才。在传统破译面临瓶颈的背景下,这种跨学科融合的尝试尤显可贵。
最近,管海粟的团队还推出了AlphaOracle系统。管海粟介绍,这是首个模仿人类专家破译甲骨文流程的AI辅助工具,可以批量给出某个甲骨文在字形、语境、语义上的可能破译线索,并快速搜集专家在破译过程中所需要的大量文献,能够帮助专家缩短破译的时间。
“未来巨富配资,我们不仅要继续优化甲骨文辅助破译技术,还计划开发甲骨文数字动画、AI对话系统,让‘冷门绝学’走进大众视野。”管海粟说。
广盛网提示:文章来自网络,不代表本站观点。