程晓涛
- 作品数:5 被引量:55H指数:3
- 供职机构:国家数字交换系统工程技术研究中心更多>>
- 发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术政治法律更多>>
- 基于关系图特征的微博水军发现方法被引量:25
- 2015年
- 随着网络水军策略的不断演变,传统的基于用户内容和用户行为的发现方法对新型社交网络水军的识别效果不断下降,水军用户可以变更自身的博文内容与转发行为,但无法改变与网络中正常用户的连结关系,形成的结构图具有一定的稳定性,因此,相对于用户的内容特征与行为特征,用户关系特征在水军识别中具有更强的鲁棒性与准确度.由此,本文提出一种基于用户关系图特征的微博水军账号识别方法.实验中通过爬虫程序抓取新浪微博网络数据;然后,提取用户的属性特征、时间特征、关系图特征;最后,利用三种机器学习算法对用户进行分类预测.仿真结果表明,添加新特征后对水军账号的识别准确率、召回率提高5%以上,从而验证了关系图特征在水军识别中的有效性.
- 程晓涛刘彩霞刘树新
- 关键词:网络水军分类器
- 基于同质子图变换的异质网络表示学习被引量:1
- 2019年
- 目前针对信息网络的研究多数基于同质网络,关于异质信息网络的网络表示学习研究相对较少。为此,提出一种结合不同元路径将异质信息网络转化成带权同质子图的网络表示学习算法。基于不同元路径在同类节点间构建带权重的连边,从异质网络中抽取出带权同质子图,通过带偏置的随机游走方式得到同类节点序列,并利用Skip-gram模型生成该类节点的表示向量。实验结果表明,与只考虑单一路径的算法相比,该算法处理节点分类、相似性搜索等数据挖掘任务时均能得到较好的效果。
- 尹赢吉立新程晓涛黄瑞阳刘正铭
- 关键词:异质网络随机游走
- 基于多维多粒度分析的电信网用户行为模式挖掘被引量:1
- 2018年
- 为了更好地理解电信网用户行为规律,以大规模电信网用户通信详细记录(CDR, call detail record)数据为研究对象,运用混合概率模型与特征工程方法,从用户群体与个体的角度分析了用户呼叫中的通话时长、通话频次、通联关系等多维度特征,并从小时、天、周等不同时间粒度上进一步细化,实现了对不同用户群体通话行为模式的有效发现。通过混合概率模型对用户行为中的分布特性进行建模,解决了用户通话时长、频次等分布特征难以刻画的问题。实验中采用某地区电信网的真实数据作为数据集,对比了决策树、朴素贝叶斯、SVM等常见分类算法的实验效果,证明了所提用户行为特征的有效性与计算可行性;并以快递、航班、银行等服务号码为例,对比了不同群体通信行为模式的差异性。
- 程晓涛吉立新黄瑞阳于洪涛杨奕卓
- 关键词:电信网多维度多粒度高斯混合模型行为模式挖掘
- 基于局域信息的社交网络信息传播模型被引量:11
- 2015年
- 针对传统传播模型更适用于均匀网络而无法有效应用于现实非均匀无标度社交网络的问题,提出一种基于用户局域信息的社交网络信息传播模型。模型中考虑了无标度网络中用户间拓扑特征差异和用户影响力不同对信息传播的影响,根据节点周边邻居节点的感染情况和权威性计算感染概率,模拟现实社交网络中的信息传播情况。通过在采集的真实微博网络数据上进行仿真实验,结果表明该模型较传统的SIR模型更能体现社交网络中信息传播的快速性与范围的广泛性;同时,通过调整模型中的相关参数,验证了相关管控措施对传播效果的影响。
- 程晓涛刘彩霞刘树新
- 关键词:社交网络信息传播复杂网络传染病模型
- 一种基于用户轨迹的跨社交网络用户身份识别算法被引量:17
- 2018年
- 针对现有的基于用户轨迹的跨社交网络用户身份识别算法未考虑用户轨迹中的位置访问顺序特征的缺点,该文提出一种基于Paragraph2vec的跨社交网络用户轨迹匹配算法(CDTraj2vec)。首先将用户轨迹转化为易于处理的网格化表示,并按照一定的时间粒度、距离尺度对原始的用户轨迹进行划分,使用户轨迹中的位置访问顺序特征易于抽取;然后利用Paragraph2vec算法中PV-DM模型抽取轨迹序列中位置访问顺序特征,得到用户轨迹的向量表示。最后通过用户轨迹向量判定轨迹是否匹配。在社交网络BrightKite上的实验结果表明,与基于位置访问频率或者基于轨迹间距离的方法相比,F值提高了2%~4%个百分点,所提算法能够有效地抽取出用户轨迹中的位置访问顺序特征,更加准确地实现了基于用户轨迹的跨社交网络用户身份识别。
- 陈鸿昶徐乾黄瑞阳程晓涛吴铮
- 关键词:社交网络用户身份识别