尹军梅
- 作品数:5 被引量:40H指数:3
- 供职机构:南京师范大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 不平衡数据分类方法综述被引量:30
- 2008年
- 分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,如果用这些方法来对不平衡数据进行分类就会导致分类器的性能下降,因而研究用于处理不平衡数据集的分类方法显得相当重要.为便于读者更清晰地了解数据不平衡分类问题的研究现状和未来研究的动向,本文对相关的研究进行了综述和展望.
- 杨明尹军梅吉根林
- 关键词:不平衡数据过抽样子空间
- 不平衡数据分类方法综述
- 分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,...
- 杨明尹军梅吉根林
- 关键词:不平衡数据集过抽样
- 文献传递
- 基于Fisher判别技术的不平衡数据分类算法研究
- 现实世界中数据分类的应用通常会遇到数据不平衡的问题,即数据中的一类样本在数量上远多于另一类,例如欺诈检测和文本分类问题等。其中少数类的样本通常具有巨大的影响力和价值,是我们主要关心的对象,称为正类,另一类则称为负类。正类...
- 尹军梅
- 关键词:不平衡数据
- 文献传递
- 一种面向不平衡数据集的核Fisher线性判别分析方法被引量:7
- 2010年
- 实际应用中,很多分类问题是面向不平衡数据的分类,而不平衡数据集会导致许多分类器的性能下降.文中介绍核Fisher线性判别分析的分类机制,分析不平衡数据导致核Fisher线性判别分析失效的原因,进而提出一种加权核Fisher线性判别分析方法.该方法通过调整两类样本的核协方差矩阵对核类内离散度矩阵的贡献,可克服不平衡数据对分类性能的影响.为进一步测试该方法,对UCI数据集进行实验测试,实验结果表明该方法可有效改进分类器的分类性能.
- 尹军梅杨明万建武
- 关键词:不平衡数据集过抽样
- 一种面向单个正例的Fisher线性判别分类方法被引量:3
- 2008年
- 提出了一种解决不平衡数据集中少数类只有一个样本的方法,找出单个正例在负类中的k个近邻,按照一定规则依次在单个正例和它的各个近邻的连线上产生合成样本,并把这些合成样本添加到原始的正类中,用加权F isher线性分类方法对新的数据集进行训练.实验结果表明该方法可有效地提高少数类的分类性能.
- 尹军梅杨明
- 关键词:不平衡数据集FISHER线性判别过抽样