冯娟娟
- 作品数:3 被引量:6H指数:1
- 供职机构:安徽农业大学信息与计算机学院更多>>
- 发文基金:国家自然科学基金安徽省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于用户-项目特征的协同过滤推荐改进算法被引量:1
- 2017年
- 基于用户的协同过滤推荐算法是当前使用范围最广的推荐算法之一。传统的协同过滤推荐算法仅依靠用户对项目的打分记录,数据稀疏度高而且来源单一,对用户间相似度测算的可信度影响较大。针对这一问题,引入用户画像信任度和类别评分差异度两个概念,对传统基于用户的协同过滤推荐算法进行改进,提出一种多维用户相似性计算方法,该算法通过调节用户画像信任度和类别评分差异度在用户相似性计算中的贡献系数,进而影响推荐算法评价指标MAE的变化,实验结果表明,新算法较原算法在命中率和准确率上有较大提高。
- 朱珠辜丽川舒贵阳冯娟娟王超陈卫
- 关键词:协同过滤
- 基于集群的协同过滤实时推荐系统研究
- 2018年
- 大数据环境下的信息挖掘已成为推荐系统研究较为活跃的领域,通过对现有大数据处理框架的对比,采用Spark大数据计算处理引擎,结合基于隐式反馈的ALS协同过滤推荐算法,提出一种Spark框架下ALS算法并行化解决方案,设计了分布式流式计算系统(Spark Distributed-ALS,SD-ALS)。实验结果验证了ALS算法在Spark集群环境下预测精度与单机环境基本保持一致,随迭代次数的增大,RMSE逐渐趋于稳定,并且计算效率显著提升,满足实时推荐的性能要求。
- 舒贵阳辜丽川冯娟娟陈卫赵子豪王超
- 关键词:流式数据SPARKALS协同过滤推荐系统
- 基于客户画像和GBDT算法的客户价值预测方法被引量:5
- 2018年
- 针对现今客户价值的差异对企业服务运营的影响,本文基于对Superstore Sales客户消费数据的分析,提取客户特征构建基于消费行为的客户画像;抽取客户价值评价指标,经主成分分析法(PCA)优化后形成客户价值评价指标体系;利用K-Means聚类算法为客户贴上价值标签,构建基于梯度提升决策树算法(GBDT)的客户价值预测模型。实验结果表明,该方法预测结果具有较高的准确率,可挖掘隐藏的高价值客户,对于企业客户关系管理具有一定的研究借鉴价值与实际意义。
- 冯娟娟辜丽川辜丽川史先章焦俊王超焦俊
- 关键词:客户分类