杨莉
- 作品数:3 被引量:4H指数:1
- 供职机构:西安科技大学计算机科学与技术学院更多>>
- 发文基金:陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 分布式全局最大频繁项集更新挖掘算法被引量:2
- 2011年
- 提出了针对数据水平分布的分布式数据集下的全局最大频繁项集更新挖掘算法(UDMFI),用于解决当最小支持度阈值发生变化时全局最大频繁项集的更新挖掘问题.通过提出的带项目头表的频繁模式树(HFP-Tree)来存储数据,然后根据最小支持度阈值变小时,原最大频繁项集的集合中的元素一定是新最大频繁项集的集合中某些元素的子集的特性,以及最小支持度阈值变大时,原最大频繁项集中的一些最大频繁项集将可能不再是新最大频繁项集的集合中的最大频繁项集的特性,充分利用已挖掘的结果,从而减少挖掘过程中的费用.实验结果表明该算法具有较好的效率.
- 杨君锐杨莉
- 关键词:数据挖掘数据存储最大频繁项集
- 分布式最大频繁模式挖掘算法的研究
- 关联规则挖掘是数据挖掘领域的一个重要研究方向,而频繁模式挖掘作为其中的一个关键技术和步骤,目前已经取得了较丰硕的成果。然而由于频繁模式挖掘的计算复杂度,因此业界提出了最大频繁模式挖掘问题。最大频繁模式不但隐含了所有的频繁...
- 杨莉
- 关键词:分布式关联规则频繁模式树
- 文献传递
- 分布式全局最大频繁项集挖掘算法被引量:1
- 2012年
- 提出一种分布式全局最大频繁项集挖掘算法(DMFI),该算法含局部挖掘与全局挖掘2个阶段。提出一个基于FP-tree的改进频繁模式树(IFP-tree)来存储数据信息。在局部挖掘阶段,先在各站点上分别建立该模式树,并使用有序方式存储频繁项目,然后,通过对各局部数据库的扫描,挖掘出局部最大频繁项集。在全局挖掘阶段,利用各局部数据库生成的最大频繁项集以及利用组通信播报消息的方式,从而挖掘出全局最大频繁项集的集合。对算法的实现以及在多种情况下进行测试。研究结果表明:DMFI算法具有较好的性能。
- 杨君锐何洪德杨莉李海文薛萍
- 关键词:数据挖掘关联规则分布式挖掘最大频繁项集