唐祥彬
- 作品数:3 被引量:59H指数:2
- 供职机构:武汉大学信息管理学院更多>>
- 发文基金:国家自然科学基金国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 查询专指度特征分析与自动识别被引量:5
- 2015年
- 【目的】基于Sogou查询日志构建人工标注集,实现查询专指度的特征分析与自动识别,并对识别效果进行分析与评测。【方法】选取用户查询串基本特征与内容特征进行统计分析,并分别训练决策树、SVM和朴素贝叶斯分类器对专指度进行自动识别。【结果】使用以上特征的识别效果良好,十折交叉检验的宏平均F-measure均高于0.8。【局限】分类特征的选择未考虑用户点击信息;朴素贝叶斯的独立性假设在本实验中是否可以忽略仍需进一步验证。【结论】利用查询串基本特征和内容特征,可以有效识别弱、略和强专指度查询。
- 唐祥彬陆伟张晓娟黄诗豪
- 关键词:决策树SVM朴素贝叶斯
- 面向用户任务的查询推荐研究
- 2014年
- 【目的】基于AOL查询日志数据集,从Session级别实现面向用户任务的查询推荐。【方法】从用户任务级别衡量查询间关系,再通过随机游走遍历图的思想为查询构建向量,以此实现候选查询推荐。【结果】本文方法的推荐效果优于基于查询共现来衡量查询间关系的推荐效果。【局限】未对拼写错误的候选查询进行拼写纠错;未从查询级别来实现面向用户任务的查询推荐;稀有查询和模糊性查询的推荐效果不佳。【结论】基于用户任务来衡量查询之间相关关系,能提高查询推荐的实验效果。
- 张晓娟唐祥彬
- 关键词:查询推荐查询日志
- 文献下载频次与被引频次的相关性研究——以图书情报领域为例被引量:54
- 2016年
- 利用CNKI引文数据库,以图情领域共19本期刊53243篇文献为统计数据源,从单篇论文、作者、期刊三种粒度,分别对文献下载频次与被引频次进行数据正态性检验、相关性分析及曲线估计,并探讨利用下载频次预测被引频次的可行性。实验表明,下载频次与被引频次的相关性在不同粒度下差异较大:单篇论文粒度下相关性不强,作者粒度下呈显著的二次函数正相关,而期刊粒度下呈显著的三次函数正相关。因此,从作者或期刊粒度,利用下载频次预测被引频次是可行的。
- 陆伟钱坤唐祥彬
- 关键词:下载频次被引频次