王宪刚
- 作品数:3 被引量:35H指数:2
- 供职机构:哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室更多>>
- 发文基金:国家自然科学基金云南省应用基础研究计划面上项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于上下文的查询扩展被引量:34
- 2010年
- 针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关系.在TREC信息检索测试集上进行的实验表明,相对于通常简单的语言模型,方法取得了5%~19%的提高.与流行的基于伪反馈的查询扩展方法相比,提出的方法也具有相当的平均准确率.
- 李卫疆赵铁军王宪刚
- 关键词:信息检索查询扩展上下文语言模型
- 基于统计机器翻译模型的查询扩展被引量:2
- 2008年
- 在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。
- 李卫疆赵铁军王宪刚
- 关键词:信息检索查询扩展语言模型统计机器翻译
- 文本分类技术及在辅助决策中的应用研究
- 随着因特网技术的迅速发展与日益普及,电子文本信息越来越丰富,同时人们在这些海量的信息面前又感到无从下手。因此,有效的组织和管理这些信息,并快速准确的从中找到用户所需要的信息是当前信息技术领域面临的一大挑战。文本分类技术作...
- 王宪刚
- 关键词:文本分类技术模块化设计
- 文献传递