杨琬琪
- 作品数:10 被引量:19H指数:2
- 供职机构:南京大学更多>>
- 发文基金:国家自然科学基金江苏省普通高校研究生科研创新计划项目教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 多视图特征选择与降维方法及其应用研究
- 针对多视图数据,以往大多数研究工作往往关注多视图分类与聚类算法层面的研究,而对多视图特征选择与降维方法研究较少。随着近年来数据采集设备的迅速发展,高维多视图数据随处可见。针对高维的多视图数据,直接进行分类或聚类,往往很难...
- 杨琬琪
- 关键词:降维方法
- 文献传递
- 面向复杂交互场景的新型机器学习技术
- 高阳史颖欢霍静杨琬琪王皓陈兴国胡裕
- 机器学习是模式识别、机器视觉、数据挖掘等方向的支撑技术之一,被广泛应用到安防、医疗、大数据分析等领域。基于样本的独立同分布假设,监督学习技术通过学习已标记数据来训练模型。然而在复杂交互场景下,当处理动态、多源、弱标记等非...
- 关键词:
- 基于Group Lasso的多源电信数据离网用户分析被引量:2
- 2014年
- 随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失.通过电信企业的数据来做离网用户的预测,从而进一步作出挽留客户的正确决策,成为电信企业日益关注的问题.面对电信后台汇总的多源数据,经分析发现其呈现天然的组结构.为了选择对于离网类别最具判别性的特征,本文使用了一种基于Group Lasso的组特征选择方法,在此基础上用交叉验证法选择适当的特征组,最终将选择出的少量组特征用于预测离网和停机的宽带用户.实验表明,在江苏某地级市电信离网用户分析数据中取得了比其他特征选择方法的精度平均高至少10%的预测性能.
- 孙良君范剑锋杨琬琪史颖欢高阳周新民
- 关键词:客户流失多源数据GROUP
- 基于加权样本选择与主动学习的视频异常行为检测算法被引量:13
- 2016年
- 随着日益突出的公共安全问题,视频监控异常行为检测成为计算机视觉的一个研究热点.文中结合视频异常检测数据集,提出基于加权样本选择与主动学习的视频异常行为检测算法.根据视频监控数据集的分布特性,选择合适的权重值消除不平衡数据集对分类器的影响,通过主动学习的方式选取少量异常不确定样本,不断迭代更新检测模型,适应复杂多变的异常事件.实验表明,在UCSD异常行为检测数据集上,相比传统方法,文中方法具有更好的检测性能.
- 林玲廖德高阳杨琬琪
- 关键词:视频监控异常行为检测
- 基于分布相似度迁移的关键路由设备检测
- 2014年
- 在基础设施网络(如电力网、互联网等)设施中,往往会出现关键节点,主要表现为节点流量大、在网络中位置关键等,其性能不稳定将制约网络部分区域的功能。因此从提高关键基础设施的性能和安全性的角度出发,针对关键基础设施的检测成为一个重要的研究课题。提出了一种新颖的基于分布相似度迁移的互联网关键路由设备的检测算法,其目的是自动地检测当前互联网线路中的关键路由设备。在真实环境中,不同线路中不同路由设备的行为特征由于若干客观因素(网络状态、路由设备性能等)导致其分布通常不相同。因此,所提方法主要基于路由之间的分布相似度迁移:首先在目标域(当前路由)中通过谱聚类方法自动判断出可疑的路由设备,然后通过提出的基于分布相似度迁移的分类器对上一步中检测出的可疑路由设备进行分类。在华为公司提供的真实数据集上进行的测试表明,所提方法能够有效发现线路中的关键路由设备,同时能够根据不同线路之间的分布相似度迁移来提高分类结果。
- 孟庆锴张剡杨琬琪胡裕靖史颖欢潘红兵王浩
- 关键词:谱聚类
- 多模态张量数据挖掘算法及应用被引量:4
- 2012年
- 近年来,多模态数据挖掘技术备受关注,如何高效地挖掘大量多模态数据成为一个研究热点。其中,基于张量表示的多模态数据挖掘,即多模态张量数据挖掘,是一个重要的研究问题。综述了多模态张量数据挖掘算法进展及其在计算机视觉中的应用。首先根据算法的样本标记、任务和核心技术的不同,对这些方法进行分类,并给出了相应的介绍和分析。其次,讨论了一些多模态张量数据挖掘算法在计算机视觉问题中的典型应用。最后,就多模态张量挖掘在计算机视觉领域的研究现状与研究前景进行了简要的分析。
- 杨琬琪高阳周新民杨育彬商琳
- 关键词:数据挖掘计算机视觉
- 基于高斯特征和聚类分组的Ratio计算方法
- 随着城市化进程的进一步深化和3G、4G等数据通讯服务的进一步扩展,手机用户群对数据服务不断增长的需求和电信基站的服务性能之间的矛盾日益突出。如何准确地预测各个基站的话务量并且以最优的方案对基站性能进行扩展成为了电信网络优...
- 孙良君杨尚东范剑锋杨琬琪王皓
- 基于GroupLasso的多源电信数据离网用户分析
- 随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失。通过电信企业的数据来做离网用户的预测从而进一步作出挽留客户的正确决策,成为人们日益关注的问题。面对电信后台汇总的多源数据,经分析发现其呈现...
- 孙良君范剑锋杨琬琪史颖欢高阳
- 面向后台多源数据的特征提取和特征选择方法
- 一种面向后台多源数据的特征提取和特征选择方法,其特征在于,包括如下步骤:(1)在多个月份的后台数据上划分训练集和测试集;(2)训练集上针对不同的源数据提取相应分组特征;(3)使用Group Lasso方法,在测试集上通过...
- 范剑锋杨琬琪高阳史颖欢孙良君
- 文献传递
- 面向后台多源数据的特征提取和特征选择方法
- 一种面向后台多源数据的特征提取和特征选择方法,其特征在于,包括如下步骤:(1)在多个月份的后台数据上划分训练集和测试集;(2)训练集上针对不同的源数据提取相应分组特征;(3)使用Group Lasso方法,在测试集上通过...
- 范剑锋杨琬琪高阳史颖欢孙良君
- 文献传递