章志刚
- 作品数:7 被引量:68H指数:4
- 供职机构:南京师范大学计算机科学与技术学院更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论天文地球更多>>
- 云计算环境下频繁项目集挖掘算法研究
- 频繁项目集挖掘是数据挖掘研究中的基础研究内容。它在电子商务、网页查询分析、网络入侵检测和疾病诊断等领域有着广泛的应用。随着信息社会的不断发展,尤其是互联网领域的蓬勃发展,人类社会产生的数据呈爆炸式的增长,“大数据”研究应...
- 章志刚
- 关键词:频繁项目集并行挖掘算法数据挖掘MAP/REDUCE云计算
- 文献传递
- 并行挖掘频繁项目集新算法——MREclat被引量:4
- 2014年
- 针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。
- 章志刚吉根林唐梦梦
- 关键词:频繁项目集并行挖掘算法MAPREDUCE
- 基于迭代式MapReduce的Apriori算法设计与实现被引量:8
- 2012年
- 为提高Apriori算法挖掘频繁项目集的效率,基于迭代式MapReduce模型对Apriori算法进行并行化,设计出了能够在云计算环境下进行频繁项目集挖掘的新算法.与传统的Apriori并行算法相比,新算法利用事务约减规则进行改进,减少了每次扫描时所需扫描事务的个数,能够显著减少运行时间.介绍了新算法的设计思想,研究了算法的性能.实验结果表明所提算法比已有方法具有更高的运行效率及较好的可扩展性.
- 章志刚吉根林
- 关键词:云计算数据挖掘关联规则APRIORI
- AP算法在图像聚类中的应用研究
- 文章提出采用分块加权颜色直方图作为图像特征,将Affinity Propagation(AP)聚类算法应用到图像聚类中,并将该算法加以实现,进行算法性能研究,实验结果表明AP聚类算法应用于图像聚类能够取得较好的效果。
- 杨传慧吉根林章志刚
- 关键词:图像聚类颜色直方图
- 一种基于FP-Growth的频繁项目集并行挖掘算法被引量:44
- 2014年
- FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。
- 章志刚吉根林
- 关键词:频繁项目集FPMAPREDUCE
- AP算法在图像聚类中的应用研究被引量:6
- 2012年
- 文章提出采用分块加权颜色直方图作为图像特征,将Affinity Propagation(AP)聚类算法应用到图像聚类中,并将该算法加以实现,进行算法性能研究,实验结果表明AP聚类算法应用于图像聚类能够取得较好的效果。
- 杨传慧吉根林章志刚
- 关键词:图像聚类颜色直方图
- 基于分块加权颜色直方图的图像聚类算法研究被引量:5
- 2013年
- 提出采用分块加权颜色直方图作为图像特征,分别利用Affinity Propagation(AP)算法和k-means算法对彩色图像进行聚类,将两种图像聚类算法加以实现,进行算法性能研究.实验结果表明,应用AP算法对图像聚类的效果优于k-means算法对图像聚类的效果.
- 杨传慧吉根林章志刚
- 关键词:图像聚类颜色直方图K-MEANS算法