山西省自然科学基金(2008011029-2) 作品数:5 被引量:13 H指数:2 相关作者: 吴瑞 郑富兰 宁玉富 郭长友 张艳芳 更多>> 相关机构: 山西师范大学 德州学院 临汾职业技术学院 更多>> 发文基金: 山西省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于用户特性的Web会话模式聚类算法 被引量:2 2014年 Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。 郑富兰 吴瑞关键词:WEB挖掘 WEB用户聚类 聚类算法 模式聚类 K-MEANS 基于双层聚类方法的网页推荐模型 被引量:6 2013年 研究web用户访问模式的聚类问题,提出了双层的用户访问模式的聚类方法.第一层采用简单易实现的LVQ(学习向量量化)神经网络方法对日志中的用户访问模式进行简单聚类,在第二层的聚类中,采用加权的模糊c-均值的方法对第一层的聚类结果进行聚类.最后根据聚类结果产生描述该类用户行为的加权访问模式,并以此作为网页推荐依据.实验结果验证了该算法的有效性和可行性. 吴瑞关键词:WEB挖掘 WEB聚类 用户访问模式 模糊C-均值 基于模糊粗糙近似的web浏览模式的聚类 被引量:4 2010年 提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类. 吴瑞 宁玉富 郭长友关键词:WEB聚类 用户浏览模式 一种有效的Web用户访问模式聚类算法 2013年 用户在一个网站的访问行为反映了用户特定的兴趣,本文提出了一种用户访问模式的聚类算法.利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法.通过一系列的实验分析,结果表明,该算法在可承受的计算时间内可对web日志中的用户存取模式进行有效聚类.聚类结果可应用于山西师范大学网站,对相应用户进行分析,给出个性化的服务等. 郑富兰 杨勇 贺丽春关键词:粗糙集 聚类分析 基于leader的k-means改进算法 被引量:1 2014年 针对传统k-means算法中初始聚类中心选取的随意性对于聚类结果影响较大的问题,提出了基于Leader算法的k-means改进算法——Lk-means算法.该算法有效避免了初始聚类中心选取的边缘化和随意性.实验证明,Lk-means算法的聚类结果更加有效合理. 郑富兰 张艳芳 吴瑞关键词:聚类 K-MEANS算法