您的位置: 专家智库 > >

谢治军

作品数:3 被引量:55H指数:2
供职机构:重庆理工大学计算机科学与工程学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇引擎
  • 2篇隐马尔科夫模...
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 2篇主题相关
  • 2篇主题相关度
  • 2篇相关度
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 2篇马尔科夫
  • 2篇马尔科夫模型
  • 2篇垂直搜索
  • 2篇垂直搜索引擎
  • 1篇爬虫
  • 1篇主题
  • 1篇主题爬虫
  • 1篇主题漂移
  • 1篇抓取

机构

  • 3篇重庆理工大学

作者

  • 3篇谢治军
  • 2篇杨武
  • 2篇李稚楹
  • 1篇宋静静

传媒

  • 1篇计算机科学
  • 1篇重庆工商大学...

年份

  • 2篇2012
  • 1篇2011
3 条 记 录,以下是 1-3
排序方式:
垂直搜索引擎的主题网页抓取策略研究
随着计算机网络技术的飞速发展,互联网已成为海量信息的主要载体,如何有效的利用这些信息,对人们来说是一个巨大的挑战。搜索引擎作为信息检索的工具,现已成为用户访问互联网的入口和指南并受到广大用户的青睐。然而,传统的搜索引擎正...
谢治军
关键词:隐马尔科夫模型向量空间模型主题相关度垂直搜索引擎
文献传递
PageRank算法研究综述被引量:52
2011年
网页排序是搜索引擎的关键技术之一。介绍了著名的PageRank算法,针对其存在主题漂移、偏重旧网页等不足,分析了各种改进算法的基本思想和技术特点,希望为以后的研究工作提供基础性支持。
李稚楹杨武谢治军
关键词:PAGERANK主题漂移
基于HMM的主题爬虫研究被引量:1
2012年
主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的链接距离作为隐含状态,然后通过HMM模型学习用户的主题浏览模式并利用它采集更多的主题网页;实验结果表明:方法能采集大量与指定主题相关的高质量网页,主题爬行效率优于Best-First主题爬虫。
谢治军杨武李稚楹宋静静
关键词:主题爬虫隐马尔科夫模型向量空间模型主题相关度垂直搜索引擎
共1页<1>
聚类工具0