您的位置: 专家智库 > >

闻丹丹

作品数:3 被引量:5H指数:1
供职机构:江苏大学计算机科学与通信工程学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇离群点
  • 2篇离群点检测
  • 2篇聚类
  • 2篇分布式
  • 1篇隐私
  • 1篇隐私保护
  • 1篇数据集
  • 1篇索引
  • 1篇全息
  • 1篇小波
  • 1篇小波变换
  • 1篇离群点挖掘
  • 1篇聚类算法
  • 1篇空间离群点
  • 1篇基于小波变换
  • 1篇安全多方计算
  • 1篇波变换
  • 1篇大规模数据
  • 1篇大规模数据集

机构

  • 3篇江苏大学

作者

  • 3篇薛安荣
  • 3篇闻丹丹
  • 2篇刘彬
  • 1篇何峰

传媒

  • 2篇计算机应用
  • 1篇计算机应用研...

年份

  • 2篇2014
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
加速大规模数据集的离群点检测
2013年
针对现有基于距离的离群点检测算法在处理大规模数据时效率低的问题,提出一种基于聚类和索引的分布式离群点检测(DODCI)算法。首先利用聚类方法将大数据集划分成簇;然后在分布式环境中的各节点处并行创建各个簇的索引;最后使用两个优化策略和两条剪枝规则以循环的方式在各节点处进行离群点检测。在合成数据集和整理后的KDD CUP数据集上的实验结果显示,在数据量较大时该算法比Orca和iDOoR算法快近一个数量级。理论和实验分析表明,该算法可以有效提高大规模数据中离群点的检测效率。
薛安荣闻丹丹刘彬
关键词:离群点聚类索引分布式
基于全息熵的空间离群点挖掘算法研究被引量:4
2014年
基于距离和基于密度的离群点检测算法受到维度和数据量伸缩性的挑战,而空间数据的自相关性和异质性决定了以属性相互独立和分类属性的基于信息理论的离群点检测算法也难以适应空间离群点检测,因此提出了基于全息熵的混合属性空间离群点检测算法。算法利用区域标志属性进行区域划分,在区域内利用空间关系确定空间邻域,并用R*-树进行检索。在此基础上提出了基于全息熵的空间离群度的度量方法和空间离群点挖掘算法,有效解决了混合属性的离群度的度量和离群点的挖掘问题。由于实现区域划分有利于并行计算,从而可适应大数据量的计算。理论和实验证明,所提算法在计算效率和实验结果的可解释性方面均具有优势。
薛安荣何峰闻丹丹
关键词:空间离群点离群点检测
基于小波变换的分布式隐私保护聚类算法被引量:1
2014年
针对现有隐私保护聚类算法无法满足效率与隐私之间较好折中的问题,提出一种基于安全多方计算(SMC)与数据扰动相结合的分布式隐私保护聚类算法。各数据方用小波变换实现数据压缩和信息隐藏,并用属性列的随机重排来防止数据重构可能产生的信息泄露。该算法仅使用压缩重排后的数据参与分布聚类计算,因此计算量和通信量小,算法效率高,而多重保护措施有效保护了隐私数据。因小波变换具有高保真性,所以聚类精度受小波变换的影响较小。理论分析和实验结果表明,所提算法安全高效,在处理高维数据时全局F测量值和执行效率优于基于Haar小波的离散余弦变换(DCT-H)算法,解决了效率与隐私之间的折中问题。
薛安荣刘彬闻丹丹
关键词:隐私保护聚类小波变换安全多方计算分布式
共1页<1>
聚类工具0