国家自然科学基金(60873091)
- 作品数:2 被引量:13H指数:2
- 相关作者:王会珍朱靖波张俐李超朱慕华更多>>
- 相关机构:东北大学更多>>
- 发文基金:沈阳市科学技术计划项目辽宁省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域类别信息C-value的多词串自动抽取
- 文本的多词串抽取是自然语言处理领域一项重要的研究内容,其中C-value是目前广泛应用的多词串抽取方法。然而C-value方法不能有效利用领域类别信息,即使文本的领域类别已知或者容易获得。针对这种情况,本文提出了一种多类...
- 李超王会珍朱慕华张俐朱靖波
- 关键词:领域信息
- 文献传递
- 基于多阶段的中文人名消歧聚类技术的研究
- 人名消歧任务被很多的研究者看作为一个聚类任务,任务是将指向实际生活中同一个人的文档聚为同一个类。本文针对人名消歧任务提出一种新的文档聚类策略,该策略采用多阶段的聚类方式来对多个文档进行聚类,并对各种特征在每个阶段中对系统...
- 丁海波肖桐朱靖波
- 关键词:人名消歧聚类算法
- 文献传递
- 基于维基百科类别的文本特征表示
- 本文提出了基于维基百科类别体系的文本特征表示方法,该方法将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示。基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低文本特征空间维数。针对维基百科...
- 王锦王会珍张俐
- 关键词:文本分类文本表示
- 文献传递
- 基于人物互斥属性的中文人名消歧
- 本文针对人名消歧任务中,由于歧义人名处于相近领域而区分困难的情况,提出了基于人物属性互斥与非互斥的两阶段人名消歧义方法。该方法的第一阶段,利用领域知识库和启发式规则抽取人物相关属性,包括职业领域、职务、相关实体等,利用这...
- 周晓李超胡明涵王会珍
- 关键词:人名消歧文本聚类
- 文献传递
- 面向移进-归约句法分析器的单模型系统融合算法
- 本文提出了一种面向移进-归约句法分析器的单模型系统融合算法。在训练阶段,该方法通过调整训练数据的分布,来构建用于融合的多个移进-归约句法分析器。在解码阶段,该方法首先使用各个移进-归约句法分析器对待分析的句子进行句法分析...
- 马骥朱慕华肖桐朱靖波
- 关键词:句法分析
- 文献传递
- 部分监督的音乐情感分类
- 基于歌词的音乐情感分析可以看作一个分类问题。为了获得较高的性能,情感分类通常需要人工标注一定规模的数据以便训练分类模型。然而人工构建数据需要以大量的时间和精力为代价。本文以二类情感分类为例,研究在没有负类数据的情况(即只...
- 王静朱慕华胡明涵
- 文献传递
- 基于领域类别信息C-value的多词串自动抽取被引量:8
- 2010年
- 该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。
- 李超王会珍朱慕华张俐朱靖波
- 关键词:中文信息处理领域信息
- 面向统计机器翻译的重对齐方法研究被引量:5
- 2010年
- 词对齐是统计机器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。此外,该文提出的方法还可以利用大规模单语语料来强化对齐结果。实验结果表明,相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法,该文提出的方法可以使统计机器翻译系统得到更高的翻译准确率。
- 肖桐李天宁陈如山朱靖波王会珍
- 关键词:人工智能机器翻译统计机器翻译词对齐
- 基于反向转录语法的机器翻译混合解码策略
- Cocke-Younger-Kasami(CYK)解码算法和移进-归约解码算法是基于反向转录语法(ITGs)的统计机器翻译系统通常采用的两种解码算法。它们在翻译准确率和解码速度方面各有不同的优劣势。例如,基于CYK解码算...
- 张浩肖桐朱靖波
- 关键词:统计机器翻译解码算法
- 文献传递
- 面向统计机器翻译的重对齐方法研究
- 词对齐是统计机器翻译中的重要技术之一。本文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结...
- 肖桐李天宁陈如山朱靖波王会珍
- 关键词:统计机器翻译词对齐
- 文献传递