倪春鹏
- 作品数:5 被引量:45H指数:5
- 供职机构:天津大学管理与经济学部更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 决策树在数据挖掘中若干问题的研究
- 决策树是一种有效的数据挖掘方法。进一步改进决策树,提高决策树的性能,使其更加适合数据挖掘技术的发展要求具有重要的理论和实践意义。本文对决策树算法中涉及的连续属性离散化问题进行了深入研究,提出了一种高效的离散化算法并对两种...
- 倪春鹏
- 关键词:决策树数据分类属性离散化数据挖掘神经网络
- 文献传递
- 一种高效的连续属性离散化算法被引量:15
- 2009年
- 分析了基于熵的离散化标准的切点特性,提出并证明了一种基于边界点属性值合并和不一致度检验的离散化算法。与传统离散化算法相比,此算法只对边界点属性值进行合并,切点个数无需设定,自动生成,且合并规则简单易行,大大减小了计算量,适用于处理大规模高维数据库的离散化。同时由于采用了不一致度对备选切点集合进行调整,使本算法具有全局性。试验表明,该算法有效提高了分类规则的简明性和预测精度。
- 赵静娴倪春鹏詹原瑞杜子平
- 关键词:离散化决策树数据挖掘
- 一种大规模数据库的组合优化决策树算法被引量:5
- 2009年
- 提出了一种适合于大规模高维数据库的组合优化决策树算法。相比于传统的类似算法,该算法从数据的离散化,降维,属性选择三方面进行改进,对决策树建立过程中不适应大规模高维数据库的主要环节进行了优化,有效解决了处理大规模高维数据库问题的效率和精度之间的矛盾。仿真试验表明,该算法在大大减少了计算代价的同时提高了决策树的分类精度。
- 赵静娴倪春鹏詹原瑞杜子平
- 关键词:离散化降维决策树
- 一种新型决策树属性选择标准被引量:14
- 2004年
- 讨论传统决策树算法中三种常用的基于熵的属性选择标准,提出一种基于属性重要性排序的建立决策树的新方法。该方法在决策树的每个内结点首先依据属性重要性将属性进行排序,然后选择最重要的属性作为分类属性生成决策树,并抽取出规则。与传统的决策树数据分类方法相比,此方法可有效地选择出对于分类最重要的分类属性,增强决策树的抗干扰能力,并提高规则的预测精度。
- 倪春鹏王正欧
- 关键词:决策树数据分类
- 一种基于神经网络和决策树相结合的数据分类新方法被引量:7
- 2005年
- 提出了一种将神经网络和决策树相结合的数据分类新方法。该方法首先依据属性重要性将属性进行排序,然后通过RBF神经网络进行属性裁减,最后生成决策树,并抽取出规则。与传统的决策树分类方法相比,此方法可依据属性重要性直接生成最小决策树,避免了树的裁减过程,大大加快决策树的生成效率,并进一步提高了规则的预测精度。该方法适用于大规模及高维属性的数据分类问题。
- 倪春鹏王正欧
- 关键词:决策树RBF神经网络数据分类