深度学习碰上古文献,西南大学提出基于CNN的古彝文识别方法

发布网友 发布时间:2024-10-24 09:41

我来回答

1个回答

热心网友 时间:2024-11-13 19:29

西南大学计算机与信息科学学院陈善雄副教授联合贵州工程应用技术学院彝学研究院专家,提出使用深度学习技术识别古彝文的方法。论文《A Recognition Method of Ancient Yi Character Based on Deep Learning》指出,作为世界六大古文字之一,古彝文记录了人类几千年的历史。识别古彝文能够将珍贵文献转换为电子文档,便于保存与传播,但当前针对古彝文识别的研究成果较少。研究团队将深度学习技术应用于古老文字识别中,构建了基于卷积神经网络(CNN)的模型。

在引言部分,指出古彝文作为一种重要的少数民族文字,有八千多年历史,与甲骨、苏美尔、埃及、玛雅、哈拉般文字并列。由于历史发展与区域,古彝文识别的研究较少。现存古彝文多为手写体,识别难度较大。现有研究包括云南民族大学王嘉梅等人使用图像分割方法进行彝文识别,朱龙华等人采用组合特征分类方法,朱宗晓、吴显礼研究印刷体规范彝文识别。西南民族大学沙马拉毅教授与民族语文翻译局共同研制彝文手写体识别技术,推动彝族文字和文化保护。

文章详细介绍了使用深度学习技术识别古彝文的实验。构建了一个四层卷积神经网络(M0)作为基础模型,并在此基础上扩展出5个模型(M1-M5),通过Alpha-Beta散度作为惩罚项对输出神经元进行自编码,然后使用两个全连接层完成特征压缩,最后在softmax层重新评分古彝文字符特征,得到其概率分布,选择最高概率的字符进行识别。实验结果表明,相对于传统CNN模型,新方法在识别古彝文手写体时具有较高的精度。

基础网络结构部分,详细描述了M0模型的组成,包括4个卷积层、2个全连接层、1个softmax层。文章进一步介绍了在M0模型基础上添加额外卷积层构建的4个模型(M1-M4)及其符号化描述。模型M5则将M1-M4的操作应用于M0,并在所有卷积层前添加额外的3×3卷积层。文章还详细介绍了Alpha-Beta散度的自编码结构,使用此散度对M0-M5模型的输出神经元进行自编码,通过两个全连接层进行特征压缩,最后在softmax层重新评分。

实验及分析部分,介绍了模型训练和样本采集的过程。模型使用ReLU激活函数和Adam优化算法,样本来源于《西南彝志》中选取的2142个常用古彝文字符,并进行了增量处理以增加训练集容量。模型M6综合了M0-M5模型的优势,通过将各模型的输出概率分布作为输入进行训练,提高了识别性能。实验结果表明,模型M6在测试集上的准确率达到了93.97%,优于其他模型。

文章最后总结了使用深度学习技术识别古彝文的方法,提出了将深度学习技术结合到少数民族古文字处理中,对文化保护和发展做出有益探索的前景。同时,研究团队计划采用生成对抗网络(GANs)生成更多古彝文手写体样本,以解决训练样本不足的问题。参考文献包括与古彝文识别相关的研究和深度学习技术的综述文章。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com