明芳
- 作品数:6 被引量:3H指数:1
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国际科技合作与交流专项项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 融合语态特征的日英层次短语翻译模型
- 针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型...
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动语态统计机器翻译最大熵模型
- 融合被动和可能态模型的日汉统计机器翻译被引量:1
- 2016年
- 日语中谓词语态有不同的词尾变形,其中被动态和可能态具有相同的词尾变化,在统计机器翻译中难以对其正确区分及翻译。因此,该文提出一种利用最大熵模型有效地对日语可能态和被动态进行分类,然后把日语的可能态和被动态特征有效地融合到对数线性模型中改进翻译模型的方法,以提高可能态和被动态翻译规则选择的准确性。实验结果表明,该方法可以有效提升日语可能态和被动态句子的翻译质量,在大规模日汉语料上,最高翻译BLEU值能够由41.50提高到42.01,并在人工评测中,翻译结果的整体可理解度得到了2.71%的提升。
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动态可能态统计机器翻译最大熵模型
- 融合被动和可能态模型的日汉统计机器翻译
- 日语中谓词语态有不同的词尾变形,其中被动态和可能态具有相同的词尾变化,在统计机器翻译中难以对其正确区分及翻译.因此,本文提出一种利用最大熵模型有效地对日语可能态和被动态进行分类,然后把日语的可能态和被动态特征有效地融合到...
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动态可能态统计机器翻译最大熵模型
- 融合时态特征的日英层次短语翻译模型
- 2017年
- 针对基于层次短语翻译模型的统计机器翻译使用上下文信息有限,时态翻译质量不高的问题,提出一种融合时态特征的日英统计机器翻译方法。该方法通过引入翻译规则的时态分类约束信息,解码器可以根据每条规则的潜在时态分类,为相应时态的句子匹配到最合适的规则进行翻译。首先从双语训练语料中抽取时态特征构建最大熵分类模型,然后再抽取包含各类时态信息的层次短语规则的时态特征,最后将规则的时态分类结果作为一类新特征,融入基于层次短语的翻译系统中。实验结果表明,与基线系统相比,该方法在多个测试集上提高了翻译质量,在一定程度上解决了日英层次短语模型的时态翻译问题。
- 明芳徐金安王楠陈钰枫张玉洁
- 层次短语模型的日语时态翻译研究
- 统计机器翻译是自然语言处理领域具有挑战性的前沿课题之一,具有广泛应用价值和重要的商业应用前景。随着网络技术的发展和普及,信息量快速增加,各领域对机器翻译的需求量也越来越多。近几年,统计机器翻译技术发展迅速,取得了一系列令...
- 明芳
- 关键词:统计机器翻译时态信息特征抽取
- 文献传递
- 融合语态特征的日英层次短语翻译模型被引量:2
- 2017年
- 针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型,将语态特征融合到对数线性模型中以改善翻译模型。提高解码器在翻译被动语态和可能语态时规则选择的准确性。实验结果表明,该方法可以有效地改善日英统计机器翻译的句法结构调序和词汇翻译,提升被动语态和可能语态句子的翻译质量。
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动语态统计机器翻译最大熵模型