为做好2019年度云南省科学技术奖励提名工作,完善科技奖励的社会监督工作,确保科技成果奖励的公正性,根据《云南省科学技术奖励办法》(云南省人民政府令第157号)、《云南省人民政府办公厅关于印发云南省深化科技奖励制度改革实施方案的通知》(云政办函〔2018〕98号)等相关文件规定及《云南省科技厅关于2019年度云南省科学技术奖提名工作的通知》(云科奖发〔2019〕1号)的相关要求,现对以下项目的基本情况、项目简介、候选人对项目的贡献情况、代表性论文专著情况等信息予以公示,公示期为8天(2019年5月27日-2019年6月3日)。
公示期间任何对公示内容有异议的单位或个人,请在公示期内实名并提供书面材料向科学技术院反映。
联系人: 科学技术院 李老师
联系电话:0871-65916002
联系邮箱:kmustzhb@163.com
888集团官网登录
2019年5月27日
一、项目基本情况
项目名称:纳西-汉语双语语料库建设与机器翻译方法
项目完成单位:888集团官网登录
拟提名情况:云南省自然科学奖
二、项目简介
纳西语是世界上唯一活着的象形文字,纳西象形文字信息化处理及翻译研究对纳西文化的传承和保护有着重要的作用。项目主要针对纳西语语言信息处理及双语机器翻译过程中的关键难点问题深入研究。开展纳西字库制作、词典、纳西依存树库、纳西汉语双语语料库等纳西语言信息处理及机器翻译基础资源库构建。研究纳西语言输入方法、纳西语言词法及依存句法分析方法、纳西句子相似度计算方法、纳西-汉语双语词语对齐方法、纳西-汉语机器翻译方法,突破纳西语言信息处理关键技术与方法。研发纳西语输入法、纳西语言信息处理词法及句法分析系统,汉语-纳西双语机器翻译系统等系统及工具,为在纳西语言信息处理及应用提供技术及系统保障。取得以下创新成果:
1. 在纳西资源建设方面,制作了纳西字库,构建了纳西-汉语-英语三语电子词典,构建了3万句的纳西依存树库,构建了5万句汉语-纳西语词对齐语料库,形成了汉语-纳西语语言信息处理的单语及双语对齐语料库;
2. 在纳西语言信息处理平台方面,提出了基于汉语-纳西语语言对齐关系的纳西语依存树库生成方法、提出基于组块编辑距离的纳西语句子相似度计算方法,研发了中文、英文和纳西拼音三种方式的纳西文字输入法,研发了规则与统计相结合的纳西依存句法分析器,为纳西语言信息处理提供基础的算法及工具支撑;
3. 在汉语-纳西词对齐方面,针对纳西-汉语的语言特点,提出了融合特征约束及实体约束的纳西-汉语双语词语对齐方法,结合纳西动词后置、名词后置、实体组合等特点,设计了相关约束函数,并将约束函数有效融合对数线性模型,有效提高了纳西-汉语双语词对齐准确率;
4. 在纳西-汉语双语机器翻译方面,针对纳西-汉语的语法差异,在短语翻译模型的基础上,提出了融合谓词-论元的汉语-纳西语短语统计机器翻译方法;在句法统计机器翻译基础上,提出了融合依存语言模型、改进的依存树到串、树到树及子树对齐的汉语-纳西语句法统计机器翻译方法,有效利用了汉语-纳西语语言特点,提升了翻译的效果;
5. 项目发表论文16篇,其中SCI收录3篇,EI收录11篇,ISTP收录2篇,受理发明专利1项,授权外观设计专利1项,登记软件著作权4项,已经培养博士研究生2名,培养硕士研究生15名,获得省级优秀硕士论文1篇。
三、候选人对项目的贡献情况
序号 |
姓名 |
性别 |
工作单位 |
对成果创造性贡献 |
1 |
高盛祥 |
女 |
888集团官网登录 |
汉纳机器翻译方法 |
2 |
余正涛 |
男 |
888集团官网登录 |
纳西语依存句法分析及汉纳机器翻译方法 |
3 |
毛存礼 |
男 |
888集团官网登录 |
输入法及语料库 |
4 |
线岩团 |
男 |
888集团官网登录 |
汉纳双语词对齐方法 |
888集团官网登录全面负责项目的方案制定、计划实施、关键技术研发及组织管理等方面的工作,单独完成项目。
四、代表性论文专著情况
代表论文8篇
[1].Shengxiang Gao, Mingjia An, Cunli, Mao, Yantuan Xian, Zhengtao Yu*. A method for building Naxi language dependency treebank based on Chinese-Naxi language relationship alignment [J]. International Journal of Database Theory and Application, 2015, 8(2):25-32. (EI:20152200882429)
[2].Meng Su, Zhengtao Yu*, Shengxiang Gao, Lanjiang Zhou, Mingjia An. A novel Naxi dependency parsing method based on rules and statistics [C]. 2014 11th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2014. August 19-21, 2014, pp. 447-452, Xiamen, China. (WOS:000359803500080) (EI: 20150200418444)
[3].Zhengtao Yu*, Yantuan Xian, Wei Tian, Jianyi Guo, Tao Zhang. Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model [J]. CHINA COMMUNICATIONS, MAR 2012, 9(3):78-86. (WOS::000301908400009)
[4].张涛,余正涛*,郭剑毅,曹先彬. 融合特征约束模型的纳西-汉语双语词语对齐算法[J].西安交通大学学报,2011年9月,45(10):48-53. (EI: 20114614515134)
Tao Zhang, Zhengtao Yu*, Jianyi Guo, Xianbin Cao. A bilingual word alignment algorithm of Naxi-Chinese based on feature constraint models [JA]. Hsi-An Chiao Tung Ta Hsueh/Journal of Xi'an Jiaotong University, OCT 2011, 45(10): 48-53. (In Chinese) (EI: 20114614515134)
[5].Huihui Zhang, Zhengtao Yu*, Longhua Shen, Jianyi Guo, Xudong Hong. Naxi sentence similarity calculation based on improved chunking edit-distance [J]. International Journal of Wireless and Mobile Computing, JAN 2014, 7(1): 48-53. (EI:20140717307760)
[6].Shengxiang Gao, Xiuzhen Yang, Zhengtao Yu*, Xiao Pan, Jianyi Guo. Chinese-Naxi machine translation method based on Naxi dependency language model [J]. International Journal of Machine Learning and Cybernetics. FEB 2017, 8(1):333-342. DOI:10.1007/s13042-014-0325-2 (WOS:000393309600027) (EI: 20170603329646)
[7].Shengxiang Gao, Zhengtao Yu*, Chao Liu, Lin Chen, Xudong Hong. A Chinese-Naxi Tree-to-Tree Machine Translation Method Based on Subtree Alignment [J]. Mathematical Problems in Engineering, OCT 2015, 2015(4):414963. (WOS:000364699100001) (EI:20154701582105)
[8].Lei Li, Zhengtao Yu*, Cunli Mao, Jianyi Guo. The extracting method of Chinese-Naxi translation template based on improved dependency tree-to-string [C]. 14th Workshop on Chinese Lexical Semantics, CLSW 2013, May 10-12, 2013, Zhengzhou, China, pp.350-358. (EI:20140617285041)