严涛 作品数:8 被引量:22 H指数:3 供职机构: 南京理工大学理学院 更多>> 发文基金: 国家自然科学基金 高等学校大学数学教学研究与发展中心教学改革项目 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
基于熵与邻域约束的模糊C均值改进算法 2021年 针对模糊C均值(FCM)聚类算法没有考虑样本不同属性的重要程度、邻域信息等问题,提出一种基于熵与邻域约束的FCM算法。首先通过计算样本各属性的熵值来为各属性赋予权重,结合属性权重改进距离度量函数;随后根据邻域样本与中心样本间的距离计算邻域隶属度权重,加权得到邻域隶属度,利用邻域隶属度约束目标函数,修正隶属度迭代过程,最终达到提升FCM聚类算法性能的目的。理论分析和在人造数据集、多个UCI数据集的试验结果表明,改进后的算法在聚类效果、鲁棒性上均优于传统FCM算法、PCM算法、KFCM算法、KPCM算法和DSFCM算法,表明了本文算法的有效性。 冯俊淇 张正军 章曼 严涛关键词:模糊C均值算法 聚类算法 邻域信息 熵权法 基于自适应可达距离的密度峰值聚类算法 被引量:6 2022年 针对基于快速搜索和发现密度峰值的聚类(CFSFDP)算法中截断距离需要人工选取,以及最近邻分配带来的误差导致的在具有不同密度簇的复杂数据集上的聚类效果不佳的问题,提出了一种基于自适应可达距离的密度峰值聚类(ARD-DPC)算法。该算法利用非参数核密度估计方法计算点的局部密度,根据决策图选取聚类中心,并利用自适应可达距离分配数据点,从而得到最终的聚类结果。在4个合成数据集和6个UCI数据集上进行了仿真实验,将所提算法ARD-DPC与基于快速搜索和发现密度峰值的聚类(CFSFDP)、基于密度的噪声应用空间聚类(DBSCAN)、基于密度自适应距离的密度峰聚类(DADPC)算法进行了比较,实验结果表明,相比其他三种算法,ARD-DPC算法在7个数据集上的标准化互信息(NMI)、兰德指数(RI)和F1-measure取得了最大值,在2个数据集分别取得F1-measure和NMI的最大值,只对模糊度较高、聚类特征不明显的Pima数据集聚类效果不佳;同时,ARD-DPC算法在合成数据集上能准确地识别出聚类数目和具有复杂密度的簇。 章曼 张正军 冯俊淇 严涛关键词:聚类算法 基于加权马氏距离的改进深度嵌入聚类算法 被引量:3 2019年 针对深度嵌入聚类(DEC)算法在数据降维后的特征空间中采用欧氏距离度量嵌入点之间的距离,容易忽视各特征不同量纲以及不同重要性的问题,提出了基于加权马氏距离的改进DEC算法,并同时给出基于加权马氏距离的间隔统计量(GS)方法判断最佳聚类数。该算法使用信息熵加权的马氏距离作为距离度量,规范化了欧氏距离的计算,并利用信息熵加大了对聚类重要的特征的权重。实证表明,基于加权马氏距离的改进DEC算法准确率优于原DEC算法,在UCI的路透社新闻等文本数据集上的聚类效果有明显的提升。利用改进的GS方法判断的最佳聚类数也有很大的可行性。 颜子寒 张正军 王雅萍 金亚洲 严涛关键词:信息熵 无监督学习 求解绝对值方程的PRP型梯度算法 2016年 给出了一种求解绝对值方程Ax-|x|=b的新方法.在矩阵A为对称正定的假设条件下,绝对值方程可转化为一个无约束优化问题,进而用PRP共轭梯度型方法对转化的无约束优化问题进行求解,从而获得原问题的解.证明了新算法在适当条件下可收敛到原问题的解.数值实验也表明了新方法的有效性. 祝文娟 严涛关键词:收敛性 无约束最优化 基于自然最近邻的密度峰值聚类算法 被引量:11 2021年 针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离d c,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering based on Natural Nearest Neighbor,NNN-DPC)。该算法无需指定任何参数,是一种非参数的聚类方法。该算法首先根据自然最近邻的定义,给出新的局部密度计算方法来描述数据的分布,揭示内在的联系;然后设计了两步分配策略来进行样本点的划分。最后定义了簇间相似度并提出了新的簇合并规则进行簇的合并,从而得到最终聚类结果。实验结果表明,在无需参数的情况下,NNN-DPC算法在各类数据集上都有优秀的泛化能力,对于流形数据或簇间密度差异大的数据能更加准确地识别聚类数目和分配样本点。与DPC、FKNN-DPC(Fuzzy Weighted K-nearest Density Peak Clustering)以及其他3种经典聚类算法的性能指标相比,NNN-DPC算法更具优势。 汤鑫瑶 张正军 储杰 严涛关键词:聚类算法 常系数非齐次线性微分方程特解的注记 被引量:1 2019年 针对常系数非齐次线性微分方程的一种特解公式,给出两个简化计算的定理,并对如何应用这两个定理进行特解计算给出了具体算例. 顾新丰 严涛关键词:常系数非齐次线性微分方程 特解 公式法 基于马氏距离和SLIC算法的云检测模型 被引量:1 2022年 本文采用超像素分割方法,针对传统的SLIC算法进行研究,通过提高分割精度来提高云检测的准确率。为了改进SLIC算法中的聚类效果,采用马氏距离代替SLIC算法中的欧氏距离进行聚类,利用阈值法对划分出的每个超像素进行二值化处理,即将云和地物分类。本文设改进前算法为O-SLIC,改进后算法为M-SLIC。在本文建立的云图数据库上将二者进行了比较,得到以下结果:M-SLIC算法的云识别率比O-SLIC算法的高;M-SLIC云检测的ROC曲线面积比O-SLIC算法大且最优分类点更靠近(0, 1)点。这些结果说明对于云图数据库中的大部分图像,M-SLIC算法相比于O-SLIC算法具有改良效果。M-SLIC算法综合了聚类和分类的特点,利用马氏距离,使算法在云检测的准确率上有所改善。 郭玲 韩迎春 蔡浩宇 张正军 严涛关键词:云检测 ROC曲线 基于熵函数的梯度型算法求解绝对值方程 被引量:1 2016年 本文中,在假设矩阵A的奇异值大于1的条件下,给出了求解绝对值方程的一个新的光滑化梯度型算法.通过引入极大熵函数对绝对值方程进行光滑化处理,得到一个非线性光滑方程组,再引入适当的目标函数,把绝对值方程转化为无约束优化问题,进而利用共轭梯度算法对其求解,从而获得原问题的解.数值实验表明了新方法的有效性. 祝文娟 严涛关键词:极大熵函数 共轭梯度法 无约束最优化