国家高技术研究发展计划(2012AA101701-03)
- 作品数:3 被引量:40H指数:2
- 相关作者:胡勇军江嘉欣常会友庞永师何新宇更多>>
- 相关机构:中山大学广州大学更多>>
- 发文基金:国家高技术研究发展计划国家留学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于LDA高频词扩展的中文短文本分类被引量:37
- 2013年
- 针对短文本特征稀疏、噪声大等特点,提出一种基于LDA高频词扩展的方法,通过抽取每个类别的高频词作为向量空间模型的特征空间,用TF-IDF方法将短文本表示成向量,再利用LDA得到每个文本的隐主题特征,将概率大于某一阈值的隐主题对应的高频词扩展到文本中,以降低短文本的噪声和稀疏性影响。实验证明,这种方法的分类性能高于常规分类方法。
- 胡勇军江嘉欣常会友
- 关键词:高频词LDA
- 大型公共建筑投资中公众态度网络舆情主题发现研究被引量:2
- 2017年
- 我国大型公共建筑投资因其牵涉利益主体多、涉及公众切身利益,受到各级政府高度重视。然而,受公众意见分散多样、信息不对称等影响,公众的真实态度往往难以在事前纳入决策中。在事后,如因决策不当损害到公众切身利益时,会遭致抵制,形成"邻避效应",甚至诱发群体性事件,对大型公共建筑的投资带来巨大的损失和影响。如何在事前采集公众真实态度纳入到决策中并改善决策?文章通过采集网络舆情数据,基于时空情境语义分析建立了面向事前决策的公众态度网络舆情主题发现模型,实现了对公众利益相关方中不同群体意见的挖掘及情感分类。
- 庞永师胡勇军
- 锐化高斯模板在文本特征项权重调整方法中的应用被引量:1
- 2012年
- 阐述二维高斯模板和锐化高斯模板的构建过程及其对图像的锐化处理技术,提出文本特征项权重调整方法的主要思想,并以此为依据,论述基于锐化高斯模板的文本特征项权重调整方法。以搜狗自然语言实验室的文本分类语料库中的新闻文档作为实验对象,采用宏平均F测度值作为分类效果评价标准,采用中心点法和K-最近邻方法(KNN)作为分类器的分类算法进行实验。实验结果表明:在KNN分类法下,基于锐化高斯模板的文本向量模型权重调整方法起到提升分类效果的作用,但对中心点法的影响并不大。
- 路永和何新宇
- 关键词:文本分类