李清敏
- 作品数:3 被引量:16H指数:2
- 供职机构:工业和信息化部更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向微博情感分析的本体自动抽取关键技术研究
- 随着新型互联网应用的迅猛发展,微博快速崛起,用户数达到2.81亿,使用率达到45.5%,每天数以千万人通过微博分享自己对各类话题的观点与情感,如何自动感知微博主体的情感,并从宏观上科学研判微博社区对特定话题的观点倾向性,...
- 李清敏
- 文献传递
- 面向话题的中文微博观点倾向性分析研究被引量:7
- 2014年
- 随着微博快速崛起,每天数以千万的人通过微博分享自己对各类话题的观点与情感,如何自动感知微博社区对特定话题的观点倾向性,已经成为中文微博计算亟待解决的问题。由于微博内容短小且不规范,传统的情感分析效率低下且效果很难满足实际需求。现提出一种将情感词典分类的方法进行实验研究,针对腾讯微博20个话题约17 500条微博32 000个句子的数据进行实验,实验结果表明提出的情感词典分类方法效果很好。
- 李清敏张华平
- 情感词发现与极性权重自动计算算法研究被引量:8
- 2017年
- 随着互联网电子商务和各种社交网络应用的快速发展,产生了大量的用户评价信息。为满足快速整理这些评价信息的需求,情感倾向性分析应运而生。情感词典是各类情感倾向性识别算法的基础,收集一部全面且权重合理的情感词典,往往可以简单快速而有效地解决情感分析问题。但情感词典规模有限,而网络上新的情感词层出不穷,语言使用不规范,人工整理耗时耗力。已有的情感词收集方法较复杂,且领域性强,收集的情感词可扩展性差。本文提出一种自动挖掘潜在情感词并计算其极性权重的算法,该算法与应用领域无关,具有良好的扩展性。该方法利用共现特性,基于朴素贝叶斯公式能检测出未知的情感词,并根据其情感权重值的大小判断其情感极性,可有效地扩展情感词典,将已有的情感词典进一步量化。在理论研究的基础上,本文分别针对京东、豆瓣及大众点评网三组评论语料做了实验,其结果的准确率都基本在90%以上,验证了该方法的有效性和实用性,为情感倾向性分析提供了知识库基础。
- 张华平李恒训李清敏
- 关键词:情感词典