国家重点基础研究发展计划(2014CB340401)
- 作品数:35 被引量:363H指数:8
- 相关作者:李兵何鹏程学旗何克清马于涛更多>>
- 相关机构:武汉大学湖北大学中国科学院更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金武汉市青年科技晨光计划更多>>
- 相关领域:自动化与计算机技术理学交通运输工程电子电信更多>>
- 一种基于调用序列网络的API推荐方法
- 2018年
- 随着计算机程序的日益复杂,代码自动补全功能需求越来越迫切。围绕软件编码过程中API调用问题进行探究,利用代码中API之间的调用序列,构建API关系网络模型,从服务推荐角度实现精准的API推荐,从而提高软件项目开发效率。实验结果表明,基于API序列关系网络模型推荐方法具有可行性,且在推荐列表长度较大的情况下方法更具优势,相比基准方法推荐精度可提高7.5%。在推荐过程中提供的API子序列越长,推荐结果越准确,但耗时明显增加。在子序列长度为5时,方法推荐精度与运行时间可达到相对适中的效果。
- 肖海涛王鹏包义祥何鹏
- 关键词:复杂网络
- 一种基于h指数的软件网络中重要类的度量方法被引量:6
- 2017年
- 在软件开发过程中,为加快新开发者对系统的了解,往往优先推荐他们关注一些更重要的类,从而快速掌握系统最基本的概念.目前,关于网络节点重要性度量的方法很多,h指数作为一种成功用于定量评估研究人员学术成就的指标却很少应用于软件网络中重要类的识别.以Tomcat、Ant和Jung项目为研究对象,使用h指数来度量软件系统中类的重要性,并与已有的中心性指标进行对比,验证该指标的可行性以及评估的效果.实验结果表明,h指数能够很好的识别出软件系统中更重要类,尤其是考虑节点的连边权重时,且相比已有的中心性指标效果更好.
- 胡思文李兵何鹏赵玉琦刘海洋
- 关键词:H指数软件网络
- 开源社区中开发者的commit提交行为挖掘分析被引量:2
- 2017年
- 以Github开源社区为研究对象,分析社区中开发者在commit提交过程中的行为,探索开发者之间的交互关系.研究内容包括分析影响开发者提交行为的因素,探析commit的提交者与创作者关系,进一步分析commit的评论者的行为.研究结果发现:1)构建项目团队的成员组织数不宜超过10,但开发者规模可以适当扩大;2)项目commit的提交90%以上都以核心成员为主,未充分调动开源社区中广大爱好者参与的积极性;3)参与一个commit评论的开发者数大多在5人以内,且参与同一个commit评论的开发者多来自不同的项目或组织.
- 陈丹何鹏
- 关键词:开源社区软件开发
- 一种基于因子图模型的半监督社区发现方法被引量:11
- 2016年
- 社区发现是社交网络分析中一个重要的研究方向.当前大部分的研究都聚焦在自动社区发现问题,但是在具有数据缺失或噪声的网络中,自动社区发现算法的性能会随着噪声数据的增加而迅速下降.通过在社区发现中融合先验信息,进行半监督的社区发现,有望为解决上述挑战提供一条可行的途径.本文基于因子图模型,通过融入先验信息到一个统一的概率框架中,提出了一种基于因子图模型的半监督社区发现方法,研究具有用户引导情况下的社交网络社区发现问题.在三个真实的社交网络数据(Zachary社会关系网、海豚社会网和DBLP协作网)上进行实验,证明通过融入先验信息可以有效地提高社区发现的精度,且将我们的方法与一种最新的半监督社区发现方法 (半监督Spin-Glass模型)进行对比,在三个数据集中F-measure平均提升了6.34%、16.36%和12.13%.
- 黄立威李彩萍张海粟刘玉超李德毅刘艳博
- 关键词:社交网络因子图
- 开源社区中已有开发者的合作行为分析被引量:7
- 2016年
- 理解开发者的合作行为是促进开源社区协作开发的关键一步。已有文献主要对社区成员的加入与迁移展开研究,而对社区中已有开发者之间的实际合作行为关注甚少。主要从开发者的交互关系与个人技能两个角度出发,探析社区已有开发者如何建立新合作以及哪些因素影响他们的合作。应用Sourceforge.net平台公开的数据进行实验,结果表明不同的开发者的偏好合作模式不同,拓扑距离上的优势("朋友的朋友"关系)对开发者间首次合作的影响不大,开发者之前的合作次数越多越有利于他们再次建立合作,而开发环境(操作系统)与开发者(管理)经验对合作也有明显的影响。所得结论有助于提高开源社区已有开发者的合作意识,促进社区的稳定与可持续性。
- 陈丹王星何鹏曾诚
- 基于概念格和随机游走的社交网朋友推荐算法被引量:8
- 2015年
- 在社交网络朋友推荐上,现有方法通过用户注册的共同属性或者用户共同邻居来对用户进行朋友推荐,由于缺乏对用户之间关系的深入的挖掘,推荐精度不高。采用概念格从数据中挖掘知识,利用用户特征属性和社交网络图建立概念格,提出了弹性随机游走方法 SRWR,并在此基础上用概念格知识指导随机游走,提出了融合概念格和随机游走的FCASRWR方法,度量了用户之间的相似性,算法最终根据相似度进行朋友推荐。实验采用Facebook的真实数据集,采用AUC和精确度评价指标,实验结果表明,该方法比目前主流的方法在指标上有较大提高,验证了方法的准确性。
- 李宏涛何克清王健彭珍连田刚
- 关键词:社交网络概念格随机游走
- 交互时代指挥控制跨越式发展
- 以互联网为代表的信息技术飞速发展,形成了与物理世界平行的网络虚拟世界,交互、分享和群体智能成为网络世界的显著特征,信息成为战略资产,人类社会进入利用信息和信息技术精确调控物质和能量的时代。网络交互的复杂性、动态性和难以预...
- 刘玉超李琳李晖
- 关键词:网络交互指挥控制
- 文献传递
- 基于概率交易模型的线下百货推荐
- 2016年
- 该文提出了一种新颖的概率交易模型PTM,针对线下百货进行个性化的推荐。传统的推荐模型,如K-近邻算法、矩阵分解等,或者仅利用局部的数据,使得模型面临线下数据极大的稀疏性挑战,或者忽略百货数据中的交易维度,使得模型损失了同一交易中多商品共现的强相关信息,最终导致它们在面对线下百货推荐问题时性能低下。针对以上的问题,本模型从交易的维度出发,建模交易记录中的共现模式,并利用全局的交易数据来学习商品的相关分量,在此基础上推断出用户的兴趣分布,实现个性化的推荐。在真实的线下百货交易数据上的实验结果表明,该模型能够极大地提高线下百货领域个性化推荐的准确性。
- 王鹏飞郭嘉丰兰艳艳晏小辉程学旗
- 关键词:PTM
- 一种基于h指数变体的软件网络节点重要性度量方法被引量:1
- 2017年
- 新成员在参与软件项目开发和维护系统时,往往需要花费大量时间去理解系统的结构和功能,为了加速新成员对系统的理解,通常优先推荐他们关注一些系统中更重要的类。大量研究表明软件系统具有明显的复杂网络拓扑形态,可以将软件系统抽象为软件网络模型,通过网络节点重要性度量方法识别软件系统中更重要的类,辅助新成员快速掌握系统的核心结构和功能。目前,关于网络节点重要性度量的方法很多,大多数方法仅考虑邻居节点的度或边的权重。另外,h指数作为一种成功用于定量评估研究人员学术成就的指标也很少应用于软件网络中重要类的识别。作者以Ant、Jung和Maven项目为研究对象,构建对应的加权软件网络模型,结合节点的度和连边的权重信息提出H-NWD、A-NWD和G-NWD 3个h指数的变体指标来度量软件系统中类的重要性,并与已有的度中心性、介数中心性、接近度中心性、特征向量中心性、Page Rank中心性5个常用的复杂网络中心性度量指标进行对比。实验结果表明,本文所提的H-NWD和G-NWD指标与已有的度量指标交集达到80%以上,能够很好地识别软件系统中重要类;在确定类的修改情况下,H-NWD指标与度中心性、特征向量中心性、Page Rank中心性共同识别的重要类节点rank值更靠前,且被识别的其他类节点修改更频繁,相比于已有指标在识别关键类上更准确。
- 丁沂李兵程璨赵玉琦
- 关键词:H指数软件网络
- 基于随机区域合并的自动彩色图像分割算法被引量:7
- 2018年
- 针对彩色图像分割精度不高的问题,提出了一种具备多尺度空间约束的自动彩色图像分割算法。基于改进的随机区域合并方法,该算法首先实施双边分解并执行基于多通道信息和多尺度梯度的过度分割;然后,在CIE L*a*b*颜色空间中使用规范化的颜色直方图来表示每个子区域,构造一个基于过度分割结果的区域邻接图;最后,在区域邻接图上执行具备空间约束条件的随机区域合并策略,为每个尺度构造一张分割图。在BSDS图像数据库中进行对比实验,结果表明,在直接视觉对比和量化分析上,相比现有的分割算法,所提方法表现出了更好的分割效果。
- 辜卫东李兵
- 关键词:目标检测彩色图像分割图像处理