宋静静
- 作品数:3 被引量:20H指数:2
- 供职机构:重庆理工大学计算机科学与工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于HMM的主题爬虫研究被引量:1
- 2012年
- 主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的链接距离作为隐含状态,然后通过HMM模型学习用户的主题浏览模式并利用它采集更多的主题网页;实验结果表明:方法能采集大量与指定主题相关的高质量网页,主题爬行效率优于Best-First主题爬虫。
- 谢治军杨武李稚楹宋静静
- 关键词:主题爬虫隐马尔科夫模型向量空间模型主题相关度垂直搜索引擎
- 中文微博情感分析中主客观句分类方法被引量:12
- 2013年
- 采用朴素贝叶斯分类器对微博语句的主客观分类问题进行研究。首先分析微博文本和其他文本的主要区别,并针对微博文本的表述特点提取一些主客观线索特征,然后对2-POS模式的最佳选取方式进行研究,最后以特征词和主客观线索做语义特征,2-POS模式做语法特征,采用朴素贝叶斯分类器分别研究它们对分类结果的影响。实验结果表明,同时考虑语义特征和语法结构特征的分类效果比仅考虑一种特征时要好。
- 杨武宋静静唐继强
- 关键词:朴素贝叶斯
- 中文短文本情感倾向性分析研究
- 随着互联网的飞速发展,以网上论坛、微博等形式为主的带有个人情感色彩的言论信息迅速膨胀,这些言论信息多数是人们对网购商品、影视作品、公众人物、热点事件等发表的评论,蕴含着巨大的商业价值和社会价值,分析这些信息具有很大的现实...
- 宋静静
- 关键词:特征提取依存句法分析
- 文献传递