甘肃省自然科学基金(3ZS042-B2S-038)
- 作品数:5 被引量:11H指数:2
- 相关作者:郑丽英李旭辉张淳晟何知军贾海鹏更多>>
- 相关机构:兰州交通大学湖北工业大学更多>>
- 发文基金:甘肃省自然科学基金教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征赋权的离群数据再聚类算法
- 2008年
- 离群数据发现与分析是数据挖掘的重要组成部分,现有离群数据挖掘算法主要针对如何检测离群对象,缺乏对挖掘出的离群数据集进行解释与分析的有效方法.通过对离群数据来源及特性进行分析,定义了离群贡献度的概念,提出了一种基于特征赋权的离群数据再聚类算法.实验表明,该算法可以有效地揭示离群数据产生来源,有助于对整体数据集的更全面了解.
- 李旭辉郑丽英
- 关键词:离群点关键域子空间K-MEANS算法
- 一种基于高维空间聚类的离群数据发现算法被引量:4
- 2007年
- 针对高维稀疏聚类CABOSFV算法仅能解决二态变量高维稀疏聚类问题而对其他类型变量算法将失效的情况,通过定义"属性绝对值距离"解决了CABOSFV算法固有的这一缺陷。另外,针对聚类后产生伪孤立点问题,提出相应的异常数据处理策略,从而得到较为精确的离群数据。
- 李旭辉郑丽英徐顼贾海鹏何知军
- 关键词:离群数据聚类
- 数据流挖掘研究被引量:1
- 2008年
- 数据流挖掘技术是数据挖掘领域的新研究方向之一。本文介绍了数据流基本特点以及数据流模型的基础上,对流行的数据流处理技术和现有数据流挖掘算法进行了总结,并进一步提出了数据流挖掘技术的研究方向和前景。
- 王少娟郑丽英祁凤林
- 关键词:数据流数据流挖掘
- 基于网格的数据挖掘算法被引量:2
- 2010年
- 为了克服传统数据挖掘算法与分布式数据挖掘算法的不足.提出了一种基于网格平台的数据挖掘算法,并改进了原有的Apriori算法,使其应用于网格平台。基于网格的数据挖掘算法具有合并计算力,安全,高效,节约硬件成本等优势已越来越受到学术界的重视。
- 齐玉成郑丽英高三营
- 关键词:数据挖掘分布式数据挖掘网格关联规则
- 基于XML的搜索引擎倒排索引研究被引量:4
- 2009年
- 随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高。XML不仅仅关注文档结构,而且关注其中的语义内容。而倒排索引则是搜索引擎的核心技术。结合两种技术设计了一个基于XML的检索系统,并对其中的关键技术倒排索引更新优化提出新的方法。
- 张淳晟郑丽英
- 关键词:XML搜索引擎倒排索引