河南省自然科学基金(0211050100) 作品数:12 被引量:76 H指数:5 相关作者: 范明 职为梅 柴玉梅 王黎明 任红伟 更多>> 相关机构: 郑州大学 更多>> 发文基金: 河南省自然科学基金 更多>> 相关领域: 自动化与计算机技术 医药卫生 更多>>
集成异种分类器分类稀有类 被引量:1 2007年 稀有类识别问题在现实生活的很多方面都有广泛应用.由于数据的高度倾斜,很多传统分类算法在稀有类上效果不佳.使用一种新的集成方法,称为EDKC(ensemble of different kind of classifiers)用来分类稀有类. EDKC集成不同的分类器形成组合分类器,并且通过加权投票表决对未知样本进行分类.在UCI机器学习数据库的多个稀有类数据集上的实验结果表明,EDKC对稀有类分类不仅具有较高的F-度量值,能达到目标类召回率和精度的平衡,而且能够取得很高的分类准确率. 范明 孙丽娜 任红伟关键词:稀有类 分类器 投票 通过Boosting改进基于EP的分类器 2007年 显露模式(EP)是支持度从一个数据集到另一个数据集显著提高的项集. EP具有很强的区分能力,可以建立很好的分类器.提出了一种通过Boosting改进基于EP的分类器的算法BoostEP. BoostEP使用Boosting技术建立多个基于EP的基分类器形成组合分类器,并对每个基分类器预测加权投票得到未知样本的类标号.在UCI机器学习数据库的21个基准数据集上的实验表明,BoostEP的分类准确率足以与NB,C4.5,CBA和CAEP等优秀分类法相媲美. 范明 任红伟 孙丽娜关键词:数据挖掘 协商Agent的历史学习算法研究 被引量:5 2005年 文章以买方Agent的观点对交易平台上获得的对方Agent历史协商信息进行分析,并根据其特点做初步过滤。在此基础上,该文针对现有协商模型中存在的问题,提出了一个Agent协商历史学习算法,并实验说明了其可行性。该算法可用于Agent协商前初始信念的创建,对Agent在协商中策略的选择、执行具有指导作用。 张少魁 王黎明关键词:AGENT协商 电子商务 集成基于EP的分类器用于分类数据流 近年来,数据流挖掘已成为知识发现领域中的一个研究热点.数据流中数据的无限性和概念漂移等特征使得传统的分类算法不能很好地适用于数据流环境.提出了一种基于eEP的分类器集成算法CEEPCE(classification by... 陈崇超 施鸿喜 范明关键词:数据流 文献传递 利用基本显露模式分类稀有类 被引量:2 2005年 提出了一种新的稀有类分类方法,称作VeEPRC。该方法使用一种特殊的EP(基本显露模式,eEP)构造基于eEP的分类器,并对它们“装袋”,建立有效的组合分类器VeEPRC。在UCI机器学习数据库的基准数据集上的实验表明,VeEPRC不仅对稀有类具有较高的召回率和精度,而且具有较高的分类准确率。 范明 刘艳霞关键词:稀有类 装袋 一种基于基本显露模式的分类算法 被引量:12 2004年 本文提出了一种新的基于EP的分类法CEEP。CEEP仅使用最短的EP(eEP)建立分类器,并使用不同于早先的基于EP的分类法(如,CAEP)的评分标准。文中还讨论了eEP的有效挖掘,最小支持度和最小增长率阈值的自适应选取等问题。在UCI机器学习库中的12个数据集上的实验表明,本文的分类方法具有很好的分类正确率。如何保证eEP有足够的履盖率,以及如何处理稀有类的分类,尚待进一步研究。此外,如何将装袋(bagging)和推进(bootstrap)的思想与CEEP的方法相结合,进一步提高分类的正确率,也是值得深入研究的问题。 范明 刘孟旭 赵红领关键词:分类器 最小支持度 数据集 EP 正确率 稀有类分类问题探讨 被引量:2 2010年 分类是数据挖掘中的重要任务之一,稀有类分类问题是分类中的一个重要分支,可以描述为从一个分布极不平衡的数据集中标识出那些具有显著意义却很少发生的实例,在现实生活中的很多领域都有广泛的应用。详细地介绍了稀有类分类的问题,探讨了稀有类分类的一些特征、影响稀有类分类的一些因素和对稀有类分类进行评估的标准,介绍了当前分类稀有类的主要方法:基于数据集的方法和基于算法的方法。介绍了当前几种流行的稀有类分类算法。 职为梅 范明关键词:稀有类 Bagging基于eEP的分类器分类稀有类 1引言稀有类分类是当前数据挖掘的研究热点之一。所谓稀有类是指我们关注的目标类在数据集中所占比例非常小(通常远低于10%)。许多实际问题,如网络入侵检测、欺诈检测、疾病诊断等都可看作稀有类识别问题。 刘艳霞 范明关键词:BAGGING SAMPLE 文献传递 集成基于EP的分类器用于分类数据流 被引量:3 2006年 近年来,数据流挖掘已成为知识发现领域中的一个研究热点.数据流中数据的无限性和概念漂移等特征使得传统的分类算法不能很好地适用于数据流环境.提出了一种基于eEP的分类器集成算法CEEPCE(classification by eEP-based classifiers ensemble)对数据流进行分类.CEEPCE使用eEP建立基分类器,当新数据块流入时训练新的分类器,并调整集成分类器中的基分类器.依据基分类器在新流入数据上的分类误差对其进行加权,集成权重最高的若干个基分类器来分类未来数据.实验表明,与单分类器相比,CEEPCE具有更好的分类准确率,并足以与以C4.5为基分类器的集成方法相媲美. 陈崇超 施鸿喜 范明关键词:数据流 一种基于密度单元覆盖的聚类数据流算法 1前言近年来,一种新型数据形式数据流得到了广泛的应用和研究,数据流是持续快速到达的数据序列,数据量巨大,并且数据分布具有时变性。聚类是数据流处理的一个中心问题。 施鸿喜 陈崇超 范明文献传递