张维
- 作品数:7 被引量:48H指数:4
- 供职机构:同济大学电子与信息工程学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金上海市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- WilsonTh数据剪辑在邻域粗糙协同分类中的应用研究
- 结合邻域粗糙集和协同学习理论构建的邻域粗糙协同分类模型可以处理连续型数据并可有效利用无标记数据提高分类的性能.在迭代学习过程中,分类器给无标记数据加上类别标记以扩大训练集使分类器再训练能获得更好的性能.然而无标记样本常被...
- 张维苗夺谦李峰
- 关键词:邻域粗糙集
- 邻域粗糙协同分类模型
- Pawlak粗糙集理论是一种有监督学习模型并且只适合处理离散型数据.但在一些现实问题中存在着大量的连续型数据,并且有标记数据很有限,更多的是无标记数据.结合邻域粗糙集和协同学习理论,提出了适合处理连续型数据并可有效利用无...
- 张维苗夺谦高灿岳晓冬
- 关键词:邻域粗糙集
- 一种处理部分标记数据的粗糙集属性约简算法被引量:5
- 2017年
- 属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。
- 张维苗夺谦高灿李峰
- 关键词:粗糙集半监督学习
- 基于互信息的粒化特征加权多标签学习k近邻算法被引量:23
- 2017年
- 传统基于k近邻的多标签学习算法,在寻找近邻度量样本间的距离时,对所有特征给予同等的重要度.这些算法大多采用分解策略,对单个标签独立预测,忽略了标签间的相关性.多标签学习算法的分类效果跟输入的特征有很大的关系,不同的特征含有的标签分类信息不同,故不同特征的重要度也不同.互信息是常用的度量2个变量间关联度的重要方法之一,能够有效度量特征含有标签分类的知识量.因此,根据特征含有标签分类知识量的大小,赋予相应的权重系数,提出一种基于互信息的粒化特征加权多标签学习k近邻算法(granular feature weighted k-nearest neighbors algorithm for multi-label learning,GFWML-kNN),该算法将标签空间粒化成多个标签粒,对每个标签粒计算特征的权重系数,以解决上述问题和标签组合爆炸问题.在计算特征权重时,考虑到了标签间可能的组合,把标签间的相关性融合进特征的权重系数.实验表明:相较于若干经典的多标签学习算法,所提算法GFWML-kNN整体上能取得较好的效果.
- 李峰苗夺谦张志飞张维
- 关键词:互信息粒化K-近邻
- 基于粗糙集成学习的半监督属性约简被引量:6
- 2016年
- 属性约简是粗糙集理论重要研究内容之一.Pawlak粗糙集约简的对象一般是有监督数据或者是无监督数据.而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据.仅利用有标记数据一般难以计算出质量较好的属性约简.为此,基于粗糙集理论,结合集成学习与半监督学习,提出有效地利用无标记数据计算半监督数据属性约简算法.该算法在有标记数据上构造一组差异性较大的属性约简构造集成基分类器,在半监督自训练学习过程中,用集成分类器对无标记数据做出预测,扩大有标记数据集,从而获得质量更好的约简.UCI数据集实验分析表明该算法是有效可行的.
- 张维苗夺谦高灿李峰
- 关键词:属性约简粗糙集半监督学习
- WilsonTh数据剪辑在邻域粗糙协同分类中的应用被引量:2
- 2014年
- 邻域粗糙协同分类模型结合了邻域粗糙集和协同学习理论,可以处理连续型数据,并可有效利用无标记数据提高分类的性能。但在学习过程中,无标记数据常被错误地标记,从而给训练集引入噪声数据,并导致分类性能不稳定。针对该问题,探讨了WilsonTh数据剪辑在邻域粗糙协同分类模型中的应用。在每一次迭代学习过程中,分类器给无标记数据加上类别标记后,应用WilsonTh数据剪辑选出最大可能标记正确的样本加入训练集,分类器在扩大的训练集上再训练以获得更好的性能。UCI数据集上实验结果表明,WilsonTh数据剪辑能有效地提高加入训练集的数据质量,从而增强邻域粗糙协同分类的性能。
- 张维苗夺谦李峰
- 关键词:邻域粗糙集
- 邻域粗糙协同分类模型被引量:12
- 2014年
- Pawlak粗糙集理论是一种有监督学习模型,只适合处理离散型数据.但在一些现实问题中存在着大量的连续型数据,并且有标记数据很有限,更多的是无标记数据.结合邻域粗糙集和协同学习理论,提出了适合处理连续型数据并可有效利用无标记数据提升分类性能的邻域粗糙协同分类模型.该模型首先构建了邻域粗糙半监督约简算法,并利用该算法提取两个差异性较大的约简构造基分类器,然后迭代地在无标记数据上交互协同学习.UCI数据集实验对比分析表明,与其他同类模型相比,该模型有较好的性能.
- 张维苗夺谦高灿岳晓冬
- 关键词:邻域粗糙集