方晓
- 作品数:3 被引量:5H指数:1
- 供职机构:北方工业大学更多>>
- 发文基金:国家自然科学基金北京市大学生科学研究与创业行动计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于深度语义信息的查询扩展被引量:5
- 2020年
- 随着互联网时代的到来,搜索引擎开始被普遍使用。在针对冷门数据时,由于用户的搜索词范围过小,搜索引擎无法检索出需要的数据,此时查询扩展系统可以有效辅助搜索引擎来提供可靠服务。基于全局文档分析的查询扩展方法,提出结合神经网络模型与包含语义信息的语料的语义相关模型,来更深层地提取词语间的语义信息。这些深层语义信息可以为查询扩展系统提供更加全面有效的特征支持,从而分析词语间的可扩展关系。在近义词林、语言知识库“HowNet”义原标注信息等语义数据中抽取局部可扩展词分布,利用神经网络模型的深度挖掘能力将语料空间中每一个词语的局部可扩展词分布拟合成全局可扩展词分布。在与分别基于语言模型和近义词林的查询扩展方法对比实验中,使用基于语义相关模型的查询扩展方法拥有较高的查询扩展效率;尤其针对冷门搜索数据时,语义相关模型的查全率比对比方法分别提高了11.1个百分点与5.29个百分点。
- 刘高军方晓段建勇
- 关键词:查询扩展语义相关度语言模型
- 基于词嵌入模型的查询优化方法研究
- 随着互联网时代的到来,搜索引擎开始被人们普遍使用。在信息检索任务中,针对冷门查询时,由于用户的搜索词范围过小,导致搜索引擎无法检索出需要的数据,从而降低了用户的使用体验。此时查询优化系统可以有效辅助搜索引擎以提供可靠服务...
- 方晓
- 关键词:查询优化查询扩展查询推荐
- 数据爬取工具在智慧旅游中的应用
- 2016年
- 在线旅游近年来取得了长足的发展,各类旅游网站积累了大量数据,获取这些数据进行精细化分析以服务智慧旅游的需要值得研究。设计了使用数据爬取工具获取在线旅游网站数据的应用方案并予以实施,结果表明数据爬取工具可以较为便捷地按需批量获取网页数据,为实现智慧旅游提供基础数据集。
- 叶玮方晓陈元贾俊卿邓文佩
- 关键词:采集器大数据智慧旅游