蒋宏飞
- 作品数:12 被引量:8H指数:2
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- CWMT2008机器翻译评测技术报告
- 本文对哈尔滨工业大学机器智能与翻译实验室向CWMT2008所提交的机器翻译系统及译文融合系统进行了介绍。其中包括了3个机器翻译系统和3个译文融合系统。机器翻译主评系统为一个加入了句法信息的基于短语的统计机器翻译系统,第一...
- 王博蒋宏飞梁华参张春越孙加东赵铁军刘树杰马永亮王欣欣
- 关键词:机器翻译句法分析
- 文献传递
- 基于词语对齐融合提高统计机器翻译质量
- 当前,多数统计机器翻译系统通过从并行双语语料中抽取翻译知识来建立模型。而词对齐是第一个关键技术,后面的翻译知识获取均要依赖于此。但是词对齐性能和机器翻译性能之间关系尚不明朗,而差异较大的词对齐模型也许会为机器翻译提供互补...
- 张春越蒋宏飞赵铁军
- 关键词:统计机器翻译词语对齐
- 文献传递
- 汉语二语教学领域词义标注语料库的研究及构建
- 汉语二语教学领域,词汇教学在其中占有极为重要的地位,其中多义词又是词汇教学的重点和难点。本研究通过分析三部经典领域词表,选取了1181个重点多义词,以《现代汉语词典(第六版)》为标注体系,制定了适合实际标注的多义词标注规...
- 王敬杨丽姣蒋宏飞苏靖杰付静玲
- 关键词:语料库
- 面向奥运的汉英RBMT与EBMT研究被引量:1
- 2006年
- 介绍了采用基于实例的方法和基于规则的方法在面向奥运的汉英机器翻译系统的最新进展。揭示了二者不同的翻译处理过程和翻译知识学习机制。通过2003年和2005年两次863汉英测试的结果比较了二者的性能差别。采用4元Bleu指标作为评分标准,在2005年863评测中RBMT系统的篇章类得分为0.1056。对话类得分为0.1714;EBMT系统的篇章类得分为0.0718,对话类得分为0.1454。
- 蒋宏飞杨沐昀赵铁军
- 关键词:机器翻译
- 一种基于同步树替换文法的统计机器翻译模型被引量:1
- 2009年
- 提出一种基于同步树替换文法的机器翻译模型.相对于基于短语的模型,此模型可以对远距离结构性调序和非连续短语翻译进行建模;相对于基于同步上下文无关文法模型,此模型可以对任何层次上的树节点调序进行建模.因此,该模型可以为处理语言结构间的异构对应问题提供有效的解决途径.在两组风格差异较大的数据集上进行的实验均验证了基于同步树替换文法的模型相对于基于短语模型和基于同步上下文无关文法模型的稳定优势.
- 蒋宏飞李生付国宏赵铁军张民
- 关键词:机器翻译
- EBMT翻译模型自动构建研究
- 基于实例的机器翻译方法具有系统实现周期短,容易对新的知识进行扩充,在限定领域下可以生成高质量的译文的优点。但是,由于在EBMT系统进行译文搜索的过程中往往只能依靠人为设定的启发式函数进行指导,对人为因素的依赖较大,很容易...
- 蒋宏飞
- 关键词:机器翻译机器学习算法翻译模型
- 文献传递
- 汉英EBMT系统的领域自适应研究
- EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术。为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术。自动判别待翻译文本的类型,并选择对应的翻译实例库进行...
- 蒋宏飞杨沐昀刘海洁赵铁军
- 关键词:EBMT领域自适应文本分类
- 文献传递
- 基于同步树替换文法的统计机器翻译方法研究
- 机器翻译的研究已经有五十多年的历史。目前,主导的研究方向是基于统计的机器翻译。经过近十多年的发展,统计机器翻译已经从最开始的基于词的模型演变到现在比较成熟的基于短语的翻译模型,直至目前正处于研究热点阶段的基于句法的统计机...
- 蒋宏飞
- 关键词:统计机器翻译句法限制
- 文献传递
- 哈工大语言技术研究中心CWMT2009机器翻译评测技术报告
- 本文介绍了哈尔滨工业大学语言技术研究中心参加CWMT09机器翻译评测的情况。我们参加了汉英新闻单一系统、汉英新闻系统融合、英汉新闻机器翻译和英汉科技机器翻译4个项目。在评测中,我们使用了HiTree和water两个统计机...
- 张春越蒋宏飞刘水刘宇鹏王博许冲赵铁军
- 关键词:机器翻译句法分析
- 文献传递
- 汉语二语教学领域词义标注语料库的研究及构建被引量:2
- 2017年
- 词汇教学在汉语二语教学领域占有极为重要的地位,其中多义词又是词汇教学的重点和难点。该研究通过分析三部经典领域词表,选取了1 181个重点多义词,以《现代汉语词典(第6版)》为标注体系,制定了适合实际标注的多义词标注规范和形式,在197册经典汉语二语教材上进行了多义词词义标注,构建了一个规模约350万字的面向汉语二语教学领域的词义标注语料库,并在此基础上对1 811个多义词、4 323个多义词义项进行了计量统计,分析了多义词不同词义的出现情况及其分布规律。为了更好地服务于汉语二语教学,开发了语料库检索系统,设计并实现了多义词义项的查询功能。
- 王敬杨丽姣蒋宏飞苏靖杰付静玲
- 关键词:语料库