张娇
- 作品数:3 被引量:74H指数:2
- 供职机构:武汉大学信息管理学院更多>>
- 发文基金:湖北省高校图工委科研基金更多>>
- 相关领域:文化科学更多>>
- 基于LDA主题模型的图书网页书目信息提取研究被引量:7
- 2016年
- 以图书网页为对象,主要研究书目信息提取方法。该方法首先利用LDA对书名与各描述性段落组合的混合文本进行建模,然后分别计算书名与各段落之间的相似度提取书目信息,有效地避免传统方法不能很好反映文档间相似性的不足。实验证明,该模型针对图书网页书目信息的提取准确率达到87.4%,较传统方法有了显著提高,同时也为图书网页信息组织管理和自动分类研究奠定了基础。
- 李湘东霍亚勇张娇
- 关键词:书目信息LDA信息提取
- 基于LDA模型的科技期刊主题演化研究被引量:66
- 2014年
- 提出一种基于LDA(Latent Dirichlet Allocation)潜在语义模型、全面研究科技期刊主题演化过程的方法。该方法根据科技期刊的特点引入时间因素,使用困惑度确定最优主题数目,通过LDA主题提取结果及JS散度,实现主题在强度和内容两方面的演化研究,并对不同时间窗口的主题稳定性做出相应分析。实验结果表明该方法可以较好地分析某一特定科技期刊的主题随时间的强度演化规律以及主题内容的演化趋势。
- 李湘东张娇袁满
- 关键词:LDA模型科技期刊
- 图书情报类期刊中电子商务相关研究的评价与分析——基于CNKI 2006-2013年文献数据被引量:1
- 2016年
- 针对电子商务领域学术期刊体系不完善,研究成果分散等现状,提出一种结合文献计量学和概率主题模型LDA评价分析电子商务在其他学科领域产出成果的方法。以CNKI2006~2013年期间主要发表在7种图书情报类期刊中的电子商务相关研究为例,通过对比载文率、web下载量、总被引频次以及期刊他引率等指标,研究各期刊在电子商务领域的学术贡献力和影响力;其次,采用LDA主题建模,提取各期刊的研究主题,以把握图书情报领域电子商务相关研究的主题现状。实验结果揭示了近八年我国图书情报学对电子商务研究的发展状况。
- 李湘东蔡义张娇
- 关键词:图书情报学电子商务LDA模型