您的当前位置:首页正文

术语标准化方法及装置[发明专利]

2024-01-13 来源:步旅网
专利内容由知识产权出版社提供

专利名称:术语标准化方法及装置专利类型:发明专利发明人:俞声,余丽珊

申请号:CN202110053293.X申请日:20210115公开号:CN112711652A公开日:20210427

摘要:本发明公开一种术语标准化方法及装置,方法包括:利用标准化术语语料库和标准术语集合构建三元组组成的训练数据集,三元组包括锚元、正元和负元,锚元为标准术语或不规范的术语,正元为与锚元对应同一标准术语的术语,负元为与锚元对应的标准术语不同的术语;利用训练数据集训练表示学习模型,获得训练好的表示学习模型;利用训练好的表示学习模型获得待标准化术语与标准术语集合中的每一术语的术语嵌入式表达向量,并计算待标准化术语与每一个标准术语的术语嵌入式表达向量的相似度,将相似度高于相似度阈值或相似度排行最高的标准术语作为所述待标准化术语的标准化结果。本发明可获得标准术语,适用各种语言,可获得其他语言下更合适的表述。

申请人:清华大学

地址:100084 北京市海淀区清华园

国籍:CN

代理机构:北京鸿元知识产权代理有限公司

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容