吴瑞 作品数:21 被引量:31 H指数:4 供职机构: 山西师范大学数学与计算机科学学院 更多>> 发文基金: 山西省自然科学基金 国家自然科学基金 山西省软科学研究计划 更多>> 相关领域: 自动化与计算机技术 文化科学 建筑科学 机械工程 更多>>
使用语义限定的加权浏览模式的挖掘 2006年 提出了一种加权的Web挖掘技术,从Web日志中发现语义限定的加权序列模式。每个网页由不同的专家给出语义上的重要性评估,这些语义评估再被转化成表示权重的模糊集。最后由用户指定语义上的最小支持度和最小偏爱度进行挖掘。这种语义上的输入和输出更自然、更易被理解。最后通过一个例子描述了所提出的方法。 吴瑞关键词:WEB挖掘 以Web用户关联关系为属性的浏览模式聚类 2010年 在Web使用挖掘中,用户浏览模式的聚类结果有助于网站设计者理解Web用户的浏览特点和需要。设计了一种有效的Web浏览模式的聚类方法,网页是否被浏览及网页上的浏览时间反映了用户的浏览兴趣,它们被刻画成等长的用户浏览模式向量中的相应分量,此外,浏览模式之间的关系被刻画并被作为属性加入到该向量中,形成扩展的用户浏览模式向量,对这些向量使用粗糙k-均值法可对用户浏览模式进行有效的聚类。实例和实验分析说明,使用该方法的聚类结果更合理。聚类结果可用于个性化网站的设计。 吴瑞关键词:用户浏览模式 WEB挖掘 聚类 粗糙集 模糊环境下的Web用户浏览模式的挖掘 2007年 提出加权支持度和加权偏爱度用来准确反映用户的访问兴趣.其中,专家给定网页的语言评估被刻画成相应的模糊语言变量,使用模糊模拟的方法把这些模糊语言变量转化成表示网页重要性的权重.为了避免用户重要浏览信息的丢失,建立包含所有用户浏览信息的频繁链表加存权树(FLAAT),并从中挖掘用户偏爱的浏览模式.此外网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它被表示成相应的模糊语言变量,因而所获得的带有模糊浏览时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱. 吴瑞关键词:WEB挖掘 用户浏览模式 并行分布式的Web访问模式双层聚类 被引量:3 2019年 Web日志挖掘可以通过对用户访问模式进行分析,以获取用户的访问兴趣程度。目前,大多数的web日志挖掘是基于频率的,其挖掘的信息没有太大的价值。而提出的聚类技术是基于访问时间的,使用模糊向量表示用户浏览模式,记录用户是否浏览过该页面以及停留的时间。通过不同的聚类方法对用户的访问序列进行聚类分析。将模糊粗糙k-均值和夹角余弦相结合,提出了一种双层聚类技术,减少了对初始聚类中心的敏感性,并且通过一系列实验,论证了该聚类方法的可行性。而且,实验通过使用Davies-Bouldin指标来验证不同聚类方法的效果并进行比较。由于数据量大时,仍然存在算法效率低的问题,因此,使用MapReduce实现双层聚类的并行化,提高了聚类的效率。 贾晓莉 吴瑞 吴思颖关键词:WEB挖掘 WEB访问模式 Web日志中模糊泛化关联规则的提取 被引量:4 2011年 大多数传统的数据挖掘算法,通常是在二进制值的事务数据库中在单一层次上发现属性之间的关联关系即关联规则,但是大多数的数据库包含有大量量化的值.通常人们采用分区的方法处理量化值,然而这种处理方法带来分区过硬的问题.本文使用模糊的方法从Web日志中发现模糊泛化的Web网页之间的关联规则,它们能够体现出带模糊浏览时间的网页之间的关联关系.通过实例分析表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效的模糊泛化关联规则的提取. 吴瑞关键词:模糊数据挖掘 用户访问模式 网络环境下基于粗糙近似的Web事务的聚类 2006年 针对Web日志中事务的类与类之间边界的不确定性,提出使用粗糙理论对Web事务中用户存取模式进行聚类的方法;给出任意两个用户存取模式之间的相似性度量的定义,并在聚类的过程中把具有相同上近似的模式归为一类,以便根据用户的行为建立可适应的Web服务器。 韩勇 吴瑞关键词:WEB使用挖掘 粗糙集 基于模糊模拟的加权偏爱浏览模式的挖掘 被引量:1 2007年 每个网页由不同的专家给出语义上的重要性评估,这些语义评估再被刻画成相应的模糊语言变量,通过模糊模拟的方法,这些模糊语言变量被转化成表示网页重要性的权重。此外,简单地认为用户的访问频度反映了用户的访问兴趣是不准确的,因此在提出的加权支持度和偏爱度概念的基础上,从建立的包含了所有用户浏览信息的FLaAT(Frequent Link and Access Tree)上,挖掘用户偏爱的加权浏览模式。试验证明该算法是行之有效的。 吴瑞关键词:WEB挖掘 用户浏览模式 基于FLAAT模糊的WEB挖掘算法 被引量:2 2005年 为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。 吴瑞关键词:WEB日志 WEB挖掘 模糊集 基于模糊粗糙近似的web浏览模式的聚类 被引量:4 2010年 提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类. 吴瑞 宁玉富 郭长友关键词:WEB聚类 用户浏览模式 基于FLAAT的加权偏爱模式的挖掘算法 被引量:1 2005年 在实际应用中,一个网站的网页对用户有着不同的重要性。该文每个网页由不同的专家给出语义上的重要性评估,这些语义评估再被转化成表示权重的模糊集。此外,由于树结构在挖掘频繁项目时不需要产生频繁项集及对这些频繁项进行测试而被广泛应用于数据挖掘中。然而,单纯的树结构可能造成有用信息的丢失。因此,该文提出了一种新的结构——频繁链表加存取树(简称为FLAAT),并在此结构上提出了一种有效的加权偏爱模式的挖掘算法。试验证明该文的算法是行之有效的。 吴瑞 张秀玲