姜文斌
- 作品数:42 被引量:103H指数:7
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字电子电信更多>>
- 维吾尔语和韩语形态分析之模型构建被引量:3
- 2018年
- 为维吾尔语和韩语形态分析建立了一种图状结构的判别式模型,该模型将语句的形态分析建模为形态成分的图状结构,通过灵活丰富的特征设计描述了词语内部形态成分之间以及分属相邻词语的形态成分之间的关联约束.相比传统的线性模型,图状模型更好地考虑了各形态成分之间的语言学关联,从而取得更高的整句分析性能.在维吾尔语和韩语上的实验结果表明,图状模型相比线性模型的性能有一定提升,形态分析词级准确率分别提升了4.4%和2.8%.
- 徐春蒋同海蒋同海姜文斌
- 关键词:形态分析
- 基于上下文的拉丁维文拼写校对的研究
- 2011年
- 根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融合的方法,实现了基于上下文的拉丁维文的自动拼写校对系统,从而大大提高了拉丁维文的校对准确率。在新疆大学提供的维文语料库的测试中,拉丁维文的校对准确率达到了90.1%。
- 何晋一陈红英姜文斌张海波刘群
- 关键词:有向图模型词语切分语言模型上下文
- 蒙古语词法分析的有向图模型被引量:3
- 2011年
- 我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词缀及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻画了词干到词干转移概率、词缀到词缀转移概率、词干到词缀生成概率、相应的标注之间的三种转移或生成概率,以及词干或词缀到相应标注相互生成概率。以内蒙古大学开发的20万词规模的三级标注人工语料库为训练数据,该模型取得了词级切分正确率95.1%,词级联合切分与标注正确率93%的成绩。
- 姜文斌吴金星长青那顺乌日图刘群赵理莉
- 关键词:词法分析词语切分词性标注词干提取有向图
- 一种用于盲人读取汉字的方法及系统
- 本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标...
- 王向东杨阳钱跃良刘宏张金超姜文斌
- 文献传递
- 翻译一致性的方法和装置及统计机器翻译方法和系统
- 本发明提供一种评价术语领域翻译一致性的方法,该方法以双语平行语料库的文档‑主题分布信息作为术语翻译的领域信息,构建双语术语库,并计算每个源语言术语的翻译一致性强度来客观地评价在领域内术语翻译的一致性。该方法充分利用领域信...
- 孟凡东熊德意姜文斌刘群
- 文献传递
- 基于词对依存分类的藏语树库半自动构建研究被引量:8
- 2013年
- 依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
- 华却才让姜文斌赵海兴刘群
- 基于线性模型的汉语词法分析方法
- 本发明提供一种基于线性模型的汉语词法分析方法,包括如下步骤:1)输入汉语语句,设定分析窗口长度;2)对语句进行逐字分析,对语句中的每一个字,将该字时间窗口内的字或字元组输入感知机分类器,得出当前字标注为某一分词标注和词性...
- 姜文斌黄亮刘群吕雅娟
- 文献传递
- 蒙古语词法分析的生成式统计建模
- 我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词级及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻面了词干到...
- 姜文斌吴金星长青赵理莉刘群那顺乌日图
- 关键词:蒙古语词法分析词语切分词性标注词干提取统计建模
- 文献传递
- 关注语言本身难题,推进民族语言翻译
- 姜文斌吕雅娟
- 异种语料融合方法:基于统计的中文词法分析应用被引量:5
- 2012年
- 基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能。高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未能充分利用,分词精度下降等问题。针对该问题,该文提出了简单有效的异种语料的自动融合方法,并通过实验验证了提案方法的有效性、较强的实用性以及对多种语料融合的可扩展性。
- 孟凡东徐金安姜文斌刘群
- 关键词:词法分析