李智超
- 作品数:4 被引量:17H指数:2
- 供职机构:清华大学信息科学技术学院智能技术与系统国家重点实验室更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 分布式大规模文本检索系统被引量:5
- 2007年
- 阐述了一个分布式大规模文本检索系统的结构和工作原理,并且基于TREC 2006的数据进行实验,得出了分布式检索系统具有有效性和高效性的结论。
- 李智超熊风富羽鹏马少平
- 关键词:分布式系统文本检索TREC
- 针对搜索引擎的媒体倾向性研究
- 针对某一类产品的文本倾向性分析成为了现在研究的热点。该文以搜索引擎的媒体报道为出发点,使用已有的情感词典集合,以及通过信息熵的方法从训练集合中提取特征词,采用贝叶斯分类方法对文本进行倾向性分析,将媒体新闻分为正面报道、负...
- 李智超马少平
- 关键词:搜索引擎媒体新闻文本倾向性情感词典信息熵
- 文献传递
- 针对搜索引擎的媒体倾向性研究被引量:2
- 2008年
- 针对某一类产品的文本倾向性分析成为了现在研究的热点.该文以搜索引擎的媒体报道为出发点,使用已有的情感词典集合,以及通过信息熵的方法从训练集合中提取特征词,采用贝叶斯分类方法对文本进行倾向性分析,将媒体新闻分为正面报道、负面报道和无倾向性3类,得到了比较理想的正确率.
- 李智超马少平
- 关键词:搜索引擎情感词典信息熵
- 网页作弊与反作弊技术综述被引量:11
- 2011年
- 随着网络信息爆炸式的增长,搜索引擎成为人们首选的获取信息的主要途径。能否在搜索引擎的排名中占有比较靠前的位置,将在一定程度上决定网页的访问量。一些网站并不是通过提高网页质量来提高其在搜索引擎中的排名,而是根据搜索引擎自身的特点,采用欺骗手段来提高排名,这就是网页作弊。网页作弊是搜索引擎面临的重大挑战之一。本文将结合常见的网页作弊的方法,阐述当前已经存在的比较有效的反作弊技术。
- 李智超余慧佳刘奕群马少平
- 关键词:反作弊搜索引擎