《蒙古语依存句法自动分析研究》成果简介2022-04-18    编辑:社会科学处

奖项类别:著作论文类

出版单位:内蒙古大学出版社,2016年12月

主要作者:斯·劳格劳

学科门类:语言学

奖励等级:三等

一、篇章结构

本书内容由第一章绪论、第二章蒙古语依存关系标注体系、第三章蒙古语依存分析中的资源建设、第四章基于规则的蒙古语依存句法分析、第五章基于规则和统计的蒙古语依存句法分析、第六章蒙古语依存句法分析软件等六个部分组成。

二、主要内容

第一章主要介绍了研究背景、研究意义、研究基础、研究方法、研究内容及创新点。第二章以蒙古语传统语法学研究成果为基础,借鉴其它语言树库标注经验,尤其是依存树库标注经验,制定了蒙古语依存关系标注体系。第三章主要介绍了蒙古语依存句法分析中用到的树库资源、词典资源和统计信息资源的构建或构造方法。第四章介绍了基于规则的蒙古语依存句法分析方法,并针对蒙古语富含形态变化的特点,提出了基于复杂特征和合一运算的蒙古语依存句法分析规则描述体系。第五章以依存树库为训练数据,研制了蒙古语词汇依存概率模型,并与基于规则的系统相融合,研制了一种基于分治策略的局部寻优型分析算法。第六章基于前几章的研究,将句法分析、树库标注、句法检索等功能实现在软件系统MDPS(Mongolian Dependency Parsing System)中。

三、观点和创新方法

《蒙古语依存句法自动分析研究》在依存语法理论框架下,以蒙古语语料库句法标注体系建设为前提,以树库资源的构建为基础,有机结合基于规则和基于统计的句法分析方法,研制了蒙古语依存句法分析算法和语料库标注系统。在句法分析算法研制中,针对蒙古语富含形态变化的特点,提出了基于复杂特征和合一运算的蒙古语依存句法分析规则描述体系。从整体效果看基于规则的方法适合于长距离依存分析,而统计方法在短距离依存分析中具有一定的优势,两者之间存在互补性。针对上述特点,融合规则和统计方法后研制了一种基于分治策略的局部寻优型分析算法。另外,在机器词典和统计信息库的查询过程中采用了基于有限状态自动机的方法,从根本上解决了句法分析器速度慢的问题。

四、学术影响和社会效益

该著作是作者博士学位论文“现代蒙古语依存句法自动分析研究”的基础上完成的。先后获得内蒙古自治区优秀博士学位论文奖、内蒙古自治区哲学社会科学优秀成果政府奖和全国高等学校科学研究优秀成果奖。2011年“现代蒙古语依存句法自动分析研究”发表以来获得学界同行的积极评价和响应,截止目前,知网被引21次,下载344次。该著作为蒙古语依存句法分析理论、方法和资源打下了基础,并且所介绍的句法分析模型为蒙古文信息处理高层应用提供了底层技术支持。

 

关闭