刘莉
- 作品数:3 被引量:9H指数:1
- 供职机构:北京信息科技大学中文信息处理研究中心更多>>
- 发文基金:国家高技术研究发展计划北京市教委科技发展计划北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于RSS的分布式博客搜索引擎设计
- 构建一个基于 RSS 的 P2P 分布式博客搜索引擎。利用 Pastry 协议,实现分布式博客采集系统的数据存储和传输。在各子采集系统上分别建立索引,分散了系统维护庞大索引的重负。实现分布式查询, 提高了查询响应速度。利...
- 刘莉肖诗斌王涛施水才
- 关键词:RSSPASTRY分布式搜索引擎
- 文献传递
- 基于RSS的博客采集系统的设计与实现
- 提出一种基于RSS的博客采集系统实现方案。设计了两个爬虫,一个负责广度优先遍历互联网,获取每个用户对应的RSS地址;另一个负责对每个RSS地址垂直搜索,跟踪检测是否有更新的博客文章,以增量方式将更新文章装入数据库。为算法...
- 刘莉肖诗斌王涛施水才
- 关键词:RSS
- 文献传递
- 基于RSS的博客采集系统的设计与实现被引量:9
- 2007年
- 提出一种基于RSS的博客采集系统实现方案。设计两个爬虫,一个负责广度优先遍历互联网,获取每个用户对应的RSS地址;另一个负责对每个RSS地址垂直搜索,跟踪检测是否有更新的博客文章,以增量方式将更新文章装入数据库。并为算法设计实现一个模型系统。
- 刘莉肖诗斌王涛施水才
- 关键词:RSS信息采集