您的位置: 专家智库 > >

铁铮

作品数:2 被引量:4H指数:1
供职机构:清华大学更多>>
发文基金:教育部留学回国人员科研启动基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 1篇自动化与计算...

主题

  • 2篇翻译
  • 2篇抽取
  • 1篇等价
  • 1篇短语
  • 1篇短语翻译
  • 1篇自动抽取
  • 1篇基于统计

机构

  • 2篇清华大学

作者

  • 2篇铁铮
  • 1篇刘颖
  • 1篇余畅

传媒

  • 1篇计算机应用与...

年份

  • 1篇2012
  • 1篇2010
2 条 记 录,以下是 1-2
排序方式:
基于统计的多词单元等价翻译对抽取及应用
铁铮
汉英短语翻译对的自动抽取被引量:4
2012年
介绍从平行语料库中如何抽取双语短语翻译对。首先用统计模型正则期望从汉语专利语料库中抽取汉语短语。抽取的短语利用统计知识和语言学知识来过滤,使得过滤后汉语短语的正确率较高;其次,利用词对齐工具Giza++从汉英平行语料库中抽取词汇对齐,在词汇对齐的基础上利用开源工具Moses抽取汉英短语对齐,根据短语对齐与抽取出的高质量汉语短语的交集来抽取候选的汉英互译的源语言短语;接着使用停用词、对数似然估计法LLR和上下文熵来对英语短语翻译进行过滤。实验结果表明,过滤后,抽取的汉语短语准确率为97.6%,汉英短语翻译对的准确率为92.4%。
刘颖铁铮余畅
关键词:抽取
共1页<1>
聚类工具0