国家自然科学基金(61263035)
- 作品数:9 被引量:58H指数:4
- 相关作者:吴林雷聪黄发良朱晓峰张师超更多>>
- 相关机构:广西师范大学福建师范大学桂林航天工业学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LPCA的谱聚类算法
- 2019年
- 针对传统谱聚类在构建关系矩阵时只考虑样本的全局特征而忽略样本的局部特征、在聚类划分时通常需要指定聚类个数、无法对交叉点进行正确划分等问题,提出了一种改进的基于局部主成分分析和连通图分解的谱聚类算法。首先自动学习挑选数据集的中心点,然后使用局部主成分分析得到数据集的关系矩阵,最后用连通图分解算法完成对关系矩阵的划分。实验结果表明该改进算法性能优于现有经典算法。
- 童涛文国秋谭马龙吴林杜婷婷
- 关键词:谱聚类
- 基于mutual KNN和标准化的谱聚类算法被引量:4
- 2019年
- 在谱聚类算法中,利用K近邻算法构建拉普拉斯矩阵时,会造成聚类的算法复杂度提高和聚类结果不佳的问题,为此提出一种基于mutual KNN和标准化矩阵的谱聚类算法,能有效提升聚类划分的执行效率和准确率。将提出算法与多组对比算法在多个数据集上进行实验比较,比较结果表明,多个评测指标(如聚类准确率、聚类的标准化互信息、方差等)全面验证了该算法能有效提高聚类性能和执行效率,适用于高维大数据的聚类分析。
- 谭马龙文国秋童涛吴林杜婷婷
- 关键词:拉普拉斯矩阵谱聚类
- 基于多目标优化的网络社区发现方法被引量:30
- 2013年
- 社区发现是复杂网络挖掘中的重要任务之一,在恐怖组织识别、蛋白质功能预测、舆情分析等方面具有重要的理论和应用价值.但是,现有的社区质量评判指标具有数据依赖性与耦合关联性,而且基于单一评判指标优化的网络社区发现算法有很大的局限性.针对这些问题,将网络社区发现问题形式化为多目标优化问题,提出了一种基于多目标粒子群优化的网络社区发现算法MOCD-PSO,它选取模块度Q、最小最大割MinMaxCut与轮廓(silhouette)这3个指标进行综合寻优.实验结果表明,MOCD-PSO算法具有较好的收敛性,能够发现分布均匀且分散度较高的Pareto最优网络社区结构集,并且无论与单目标优化方法(GN与GA-Net)相比较,还是与多目标优化算法(MOGANet与SCAH-MOHSA)相比较,MOCD-PSO算法都能在无先验信息的条件下挖掘出更高质量的网络社区.
- 黄发良张师超朱晓峰
- 关键词:复杂网络多目标粒子群优化
- 局部PCA与k近邻相结合的谱聚类算法被引量:8
- 2019年
- 为解决传统谱聚类方法构造相似矩阵时使用距离度量无法充分反映复杂样本空间的全局一致性,且存在聚类个数需要人为指定等问题,提出一种基于近邻与局部PCA结合的谱聚类算法。使用kNN获取邻域子集,使用局部主成分分析保持样本的局部结构,同时考虑样本的全局和局部信息,为相似矩阵提供综合信息,对得到的相似矩阵进行图分割,直接得到聚类的结果。在真实数据集上的实验结果表明,该算法能够自动得到类的个数且聚类准确率有所提高,其在非真实类时有更好的聚类效果。
- 吴林文国秋童涛谭马龙杜婷婷
- 关键词:谱聚类K-近邻相似矩阵
- 基于K近邻的众包数据分类算法被引量:3
- 2020年
- 针对众包数据处理中的质量控制问题,提出了一种加权K近邻投票分类方法。该方法不单单只是考虑了某个样例的标记来返回一个答案,而是通过综合考虑样例的近邻来得到更加准确的答案。同时对样例的近邻加以适当的权重来进一步提高算法的性能,并保持了传统多数投票分类的简单性。K近邻投票分类算法可以有效地解决缺乏标记的情况,通过对近邻加以权重可以解决不平衡标记造成的影响,从而使算法的泛化性更强。通过各种场景下的实验,结果表明加权K近邻投票分类方法取得了很好的效果。
- 李佳烨余浩
- 基于局部结构学习的非线性属性选择算法
- 2020年
- 针对大多数高维数据之间不仅有相似性,而且还有非线性关系等特点,提出一种基于局部结构学习的非线性属性选择算法。该算法首先通过核函数把数据映射到高维空间,在高维空间中表示出数据属性之间的非线性关系;然后在低维空间中通过局部结构学习来充分挖掘属性之间的相似性,同时通过低秩约束来排除噪声的干扰;最后通过稀疏正则化因子来进行属性选择。其通过核函数映射来找出数据属性之间的非线性关系,运用局部结构学习来找出数据属性之间的相似性,是一种嵌入了局部结构学习的非线性属性选择算法。实验结果表明,该算法相比其他对比算法有更好的效果。
- 李佳烨张乐园雷聪甘江璋吕治政
- 关键词:核函数
- 基于核函数的低秩非线性属性选择算法被引量:1
- 2019年
- 高维的数据之间除了有线性关系之外,还有非线性的关系,为此提出一种基于核函数的低秩非线性属性选择算法。通过核函数把数据的每个属性都映射到高维空间,在高维空间中表示出属性之间的非线性关系;通过低秩约束排除噪声的干扰,利用高维空间中数据属性对应的稀疏正则化因子进行属性选择。核函数映射可以找出数据属性之间的非线性关系,低秩约束相当于对高维数据的全局结构进行子空间学习。该算法是一种嵌入了低秩结构的非线性属性选择算法。实验结果表明,该算法比其它的属性选择算法具有更好的效果。
- 李佳烨张乐园雷聪
- 关键词:核函数子空间学习
- 一种高效的K值自适应的SA-KNN算法被引量:6
- 2015年
- 传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性。为此,提出引入稀疏学习理论,利用训练样本重构测试样本的方法,重构过程使用了样本间的相关性,也用到局部保持投影LPP保持数据结构不变,同时引入l2,1范数用于去除噪声样本的方法来寻找投影变换矩阵W,进而利用W确定KNN算法中K值的SA-KNN算法。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN分类算法和Entropy-KNN算法有更高的分类准确度。
- 孙可龚永红邓振云
- 关键词:K近邻分类局部保持投影
- 基于局部协方差矩阵的谱聚类算法被引量:7
- 2019年
- 针对传统谱聚类算法没有解决簇划分过程中,簇间交叉区域样本点对聚类效果有影响这个问题,提出一种基于局部协方差矩阵的谱聚类算法,主要介绍了一种新的计算样本之间相似度亲和矩阵的方法,即通过计算样本点之间的欧氏距离划分出小子集,计算小子集的协方差,通过设定阈值剔除交叉点,由剩下的点构造相似矩阵,对相似矩阵进行特征值分解,用经典的k -means算法对由特征向量组成的矩阵聚类。通过在Control等真实数据集上的实验结果表明,该算法在聚类准确率、标准互信息等指标上比较对比算法获得更优秀的效果。
- 杜婷婷文国秋吴林童涛谭马龙
- 关键词:谱聚类协方差矩阵相似矩阵