中国科学院自动化研究所复杂系统与智能科学重点实验室开放课题基金(20070101) 作品数:34 被引量:184 H指数:6 相关作者: 闫德勤 郑宏亮 刘胜蓝 张岩 吴晓婷 更多>> 相关机构: 辽宁师范大学 大连理工大学 沈阳医学院 更多>> 发文基金: 中国科学院自动化研究所复杂系统与智能科学重点实验室开放课题基金 辽宁省教育厅高等学校科学研究项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于粗糙集理论的连续属性离散化新算法 被引量:7 2010年 粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对连续属性进行离散化。实验通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测,实验结果证明了算法的有效性。 李慧 闫德勤 韩丽关键词:连续属性离散化 粗糙集 决策表 数据挖掘 改进的非线性数据降维方法及其应用 被引量:6 2011年 局部线性嵌入算法(Locally Linear Embedding,LLE)是基于流形学习的非线性降维方法之一。LLE利用样本点的近邻点的线性组合对每个样本点进行局部重构,而不同近邻个数的选取会产生不同的重构误差,从而影响整体算法的实施。提出了一种LLE的改进算法,算法有效地降低了近邻点个数对算法的影响,并很好地学习了高维数据的流形结构。所提方法的有效性在人造和真实数据的对比实验中得到了证实。 吴晓婷 闫德勤关键词:数据降维 流形学习 局部线性嵌入 图像检索 粗糙支持向量机 被引量:11 2009年 支持向量机(SVM)是一种重要的数据机器学习工具,其有效性依赖于对数据信息获取的准确性。以往的支持向量机模型都没有考虑到数据等价类信息。为此,基于粗糙集理论和支持向量机思想,提出了一种新的支持向量机模型——粗糙支持向量机(RSVM)。采用UCI机器学习数据库中的数据做对比实验,结果表明RSVM比传统支持向量机(SVM)和模糊支持向量机(FSVM)都有较高的测试精度。 梁宏霞 闫德勤关键词:支持向量机 等价类 信息表属性约简新方法 被引量:11 2010年 在研究区分能力大小的基础上建立一个用于指导信息表的绝对属性约简的粗糙集模型,研究区分能力和分类能力之间的关系,提出决策依赖区分精度概念,为指导决策表的相对属性约简提供了一个新的判据。给出区分精度、近似精度和决策依赖区分精度在属性约简过程中相互关系的研究结论,通过一组对比实验说明决策依赖区分精度比近似精度对分类能力的描述更细致客观。 张迎春 张丹枫 闫德勤基于熵和蚁群算法的模糊支持向量机新方法 被引量:3 2009年 针对当前模糊支持向量机(FSVM)一般使用特征空间样本与类中心之间的距离构建隶属度函数的不足,首次利用熵的不确定性定量化度量特征和蚁群算法(ACO)的智能性与FSVM结合,提出一种基于熵和ACO的FSVM新方法(EAFSVM)。求得的聚类中心和隶属度能更准确地反映数据本身的特点,提高测试精度。实验对比SVM和FSVM,结果表明EAFSVM测试精度较高,尤其对多类数据、大规模数据具有较好的分类能力。 王琳 闫德勤 梁宏霞关键词:模糊支持向量机 蚁群算法 聚类 结合概率和等价类的双系数支持向量机 2009年 支持向量机(SVM)的有效性依赖于对数据信息获取的准确性。针对传统SVM模型获取数据信息单一导致分类精度不高、泛化能力不强的问题,结合概率分布特性和等价类关系,提出了一种双系数控制分类的新模型。该模型优化了SVM,以双系数方式改进传统参数,为每一个样本同时赋予概率值和等价类系数,充分挖掘数据信息内在规律和联系。实验结果证明:该模型能有效利用数据信息,与SVM、FSVM和RSVM相比有较高的测试精度,能有效提高分类能力,具有较高鲁棒性。 王琳 闫德勤 梁宏霞关键词:支持向量机 等价类 可视密码学的Contourlet域图像水印 被引量:4 2011年 将可视密码学引入到水印的预处理中,提出了一种Contourlet域的安全性较高的图像水印算法。该算法首先根据可视密码理论将水印信息隐藏到一定数目的图片中,选取其中任一图片作为水印,然后对载体图像进行分块,通过聚类找出适合嵌入水印的块,并进行Contourlet变换,在变换系数的最大奇异值上嵌入水印。水印提取时只需用特定数目的图片对提取出的信息进行叠加,其过程无需大量计算和密码学知识。实验表明,该算法还具有抵抗噪声、滤波J、PEG压缩等常规攻击和抗剪裁等功能。 韩宁 闫德勤 韩丽丽关键词:数字水印 CONTOURLET变换 模糊聚类 奇异值 NMF和Isomap相结合的图像检索新方法 被引量:1 2011年 非负矩阵分解(NMF)能够提取图像的局部特征,是一种基于局部的数据挖掘方法,在一定程度上勾勒出了相关图像在基矩阵所代表空间上的分布,但NMF并未考虑数据的内在几何结构。提出了一种新颖的基于非负矩阵分解与非线性降维方法Isomap相结合的新方法,全局的非线性降维方法Isomap能发现数据的内在结构和相关性,使高维数据在低维空间变得可视化。将本算法应用于图像检索,实验表明,该方法能够更加准确地获取信息,提高检索的准确性。 刘婷婷 闫德勤 郑宏亮关键词:非负矩阵分解 数据降维 多维尺度分析 ISOMAP 图像检索 强相关树基因选择方法及AE-RSVM分类研究 2013年 对肿瘤基因表达谱进行分析,从而有效区分正常样本与肿瘤样本的关键是:准确找出能够决定样本类别的最少特征基因,并用一个性能较好的分类器进行分类预测。针对该问题,用修订的特征记分准则(RFSC)去除分类无关基因;对两两冗余法进行改进,提出强相关树法用于冗余基因的去除;对粗糙支持向量机(RSVM)改进,提出近似等价粗糙支持向量机(AE-RSVM)对样本集进行分类测试。以肿瘤样本集为例进行测试,实验结果表明了提出方法的可行性和有效性。 张岩 闫德勤 吕志超 郑宏亮关键词:基因表达谱 肿瘤分类 基因选择 支持向量机 等价类 非球形分布数据集的去噪方法 2011年 针对传统支持向量机(SVM)对噪声点过于敏感,模糊支持向量机(FSVM)又对样本集几何形状过分依赖等问题,提出基于噪声过滤系统的粗糙支持向量机(NFS-RSVM)。该方法首先用噪声过滤系统(NFS)将极可能为噪声点的样本过滤掉;然后将数据间隐含的等价类信息作为双惩戒因子融入到支持向量机模型中,进一步区分有效样本和噪声样本。基于UCI数据集的仿真结果表明,NFS-RSVM方法能有效地将数据中的大部分噪声点去除,与传统的SVM和FSVM相比分类精度有一定程度的提高。因此,该方法在处理噪声样本较多又呈现非球形分布的数据集时,表现出较好的抗噪性、分类效果和泛化能力。 张岩 闫德勤 郑宏亮关键词:支持向量机 等价类 去噪