张友强 作品数:6 被引量:6 H指数:2 供职机构: 青岛科技大学信息科学技术学院 更多>> 发文基金: 国家自然科学基金 山东省自然科学基金 山东省高等学校科技计划项目 更多>> 相关领域: 自动化与计算机技术 更多>>
基于近似约简的集成学习算法及其在入侵检测中的应用 被引量:1 2016年 为了获得较大差异性的基学习器来构建集成学习器,从属性空间划分的角度来考虑集成学习问题,通过粗糙集理论定义了近似约简的概念,进一步提出了基于近似约简的集成学习算法;本方法将数据集的属性空间划分为多个子空间,基于不同子空间对应的数据集训练得到的基学习器具有较大的差异性,从而保证了集成学习器具有较强的泛化性能.为了验证本算法的有效性,本算法被应用于网络入侵检测中.在KDD CUP 99数据集上的实验表明,与传统的集成学习算法相比,本文所提出的算法具有更高的检测率和更低的计算开销,更适合于从海量高维的网络数据中检测入侵. 江峰 张友强 杜军威 刘国柱 眭跃飞关键词:近似约简 入侵检测 一种基于抽样与约简的集成学习算法 被引量:2 2016年 集成学习的一个重要目标是获得一组差异性大的基分类器来构建集成分类器。为实现这一目标,提出一种基于抽样与约简的集成学习算法ELSR。该算法采用多模态扰动策略来训练基分类器。首先,采用多次抽样策略从训练集中抽样产生k个抽样集;其次,使用粗糙集的属性约简技术对每个抽样集进行约简;第三,在每一个约简之后的抽样集上分别训练一个基分类器;最后,利用一个验证集对每个基分类器进行性能测试,并根据测试结果选择一组合适的基分类器来构建集成分类器。在UCI数据集上的实验表明:当采用KNN算法或者C4.5算法来训练基分类器时,ELSR的分类性能总是要优于现有的集成学习算法。 江峰 张友强 杜军威 刘国柱 冯云霞关键词:属性约简 粗糙集 基于依赖决策熵的决策树分类算法 被引量:2 2016年 针对传统的基于信息熵的决策树算法所存在的问题,本研究从粗糙集理论的角度来考虑信息熵,定义了依赖决策熵的概念,并提出一种基于依赖决策熵的决策树算法DTDDE。在DTDDE算法中,采用依赖决策熵的概念来度量每个条件属性的重要性,并选择重要性最大的属性作为当前的分离属性。通过在多个UCI数据集上的实验表明:与现有的决策树算法相比,本研究所提出的算法能够获得更好的分类性能。 王希玲 江峰 张友强 刘国柱关键词:决策树 信息熵 粗糙集 基于随机贪心选择的选择性集成算法 2017年 针对现有的基于贪心选择的选择性集成算法易过早陷入局部最优的问题,提出一种基于随机贪心选择的选择性集成算法(SERGS);该算法引入了随机化策略来扩展贪心搜索的搜索空间,从而降低了算法陷入局部最优的可能性,并且算法的计算性能也得到了改善。在UCI数据集上的实验表明,与现有的集成学习算法和选择性集成算法相比,SERGS的分类精度高于其他算法,且建模时间少于同类型的算法。 江峰 张友强 杜军威 刘国柱 眭跃飞基于近似约简与最优采样的集成剪枝 2022年 集成学习被广泛用于提高分类精度,近年来的研究表明,通过多模态扰乱策略来构建集成分类器可以进一步提高分类性能.本文提出了一种基于近似约简与最优采样的集成剪枝算法(EPA_AO).在EPA_AO中,我们设计了一种多模态扰乱策略来构建不同的个体分类器.该扰乱策略可以同时扰乱属性空间和训练集,从而增加了个体分类器的多样性.我们利用证据KNN(K-近邻)算法来训练个体分类器,并在多个UCI数据集上比较了EPA_AO与现有同类型算法的性能.实验结果表明,EPA_AO是一种有效的集成学习方法. 王安琪 江峰 张友强 杜军威关键词:近似约简 粗糙集 属性约简 基于重采样与属性约简的多模态选择性集成学习 被引量:1 2021年 通过对重采样技术和属性约简方法进行研究,提出一种多模态选择性集成学习算法SE_RSAR。采用重采样方法扰乱样本空间,采用一种基于相对决策熵的属性约简方法扰乱特征空间,通过这种多模态的扰乱策略增加个体分类器之间的差异性。实验在多个UCI数据集上完成,KNN算法被用来训练个体分类器。实验结果表明,相对现有的集成学习算法,SE_RSAR算法能够取得更好的分类效果。 江峰 李瑞 张友强 杨爱光关键词:重采样 粗糙集