国家高技术研究发展计划(2011AA01A205) 作品数:23 被引量:167 H指数:6 相关作者: 马少平 刘奕群 张敏 茹立云 刘轶 更多>> 相关机构: 清华大学 北京航空航天大学 中国科学院 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 更多>>
情景感知系统的数据挖掘模型研究 近年来情景感知己成为国内外学术界和商业界的研究热点,由于情景数据的多元性,亟需探索有效的数据挖掘方法从海量数据中获取有用的信息,为人机交互的智能化提供支撑。论文通过对情景感知技术和数据挖掘方法的研究分析,构建了基于情景感... 杨文漪 叶丹 肖波 蔺志青 陆月明关键词:情景感知 数据挖掘 系统模型 普适计算 本体 基于用户行为的微博用户社会影响力分析 被引量:77 2014年 社会影响力分析是当前在线社会网络研究中的热点方向.随着微博成为了一种至关重要的大众媒体,更好的分析和衡量微博用户的社会影响力引起越来越广泛的关注.基于从新浪微博收集的大规模数据集,作者结合社会影响力在微博环境中的传播情况,分析了用户行为因素之间的关系.然后提出了一个通过预测用户传播信息能力大小来分析和度量用户社会影响力的方法.该方法结合了来自社会网络结构和用户行为因素两方面的信息,获得了更好的影响力估计结果.基于大规模数据的实验结果表明,作者提出的方法是较为有效的. 毛佳昕 刘奕群 张敏 马少平关键词:用户行为分析 社会网络 社会影响力 信息传播 社会计算 基于在线社会网络的用户影响力研究 被引量:3 2016年 对大规模的在线社会网络图结构进行了较为系统的分析,结果表明社会网络的入度、出度、发文数等基本符合幂律分布。社会网络的小世界属性也使得强连通关系呈现"纺锤体"形状。该文从用户的阅读概率角度引入用户的发文行为、浏览行为与标签社区小世界属性等对用户的社会影响力模型进行建模。实验结果显示PTIM模型融合了发文行为与小世界属性等特性,在最具影响力用户节点、用户粉丝数、认证用户数与人工标注的相对用户影响力大小等指标上均表现出稳定的性能。 许丹青 刘奕群 张敏 马少平关键词:社会影响力 信息扩散 社会网络 长尾查询搜索性能评价方法的研究 2014年 各大搜索引擎公司都致力于准确而快速的帮助用户找到信息目标,搜索性能评价变得非常重要,而目前尚无对长尾查询性能评价的方法。该文通过分析长尾查询结果数据,提取了长尾查询三种类型特征,并对特征进行叠加分析。进一步地针对数据集的严重不平衡问题提出两种数据平衡方法。最后提出并改进了长尾查询评价方法。在真实搜索引擎结果数据集上的实验验证了所提出的评价方法取得一定的评价效果,其中对不相关文档的评价取得较高的准确率。 霍帅 张敏 刘奕群 马少平 金奕江 茹立云一种面向大规模音乐库的音乐推荐方法 文中提出一种满足大规模音乐库检索要求的音乐推荐方法。音乐推荐系统是音乐信息检索领域的研究热点,目前的主流系统能够实时处理百万量级的音乐库,但在线音乐库的规模已突破千万量级,因而难以满足用户的检索要求。该文给出的方法以音乐... 郑尧 肖利民 唐文琦 姚光超 阮利关键词:GPU加速 文献传递 搜索引擎中基于内容的图像重排序 被引量:2 2013年 针对基于文本的图像搜索结果的排序不能很好满足用户查询期望的问题,提出两种基于内容的图像搜索结果重排序方法:基于相似性积分的重排序算法(SI算法)和基于Dijkstra算法的重排序算法(D算法)。这两种方法把图像作为节点,利用图像的颜色和形状特征计算图像间的相似性,并将相似性作为边的权重构建相似性图,SI算法根据每个节点图像相似性积分的大小来进行排序,D算法则利用Dijkstra算法从指定图像开始对所有图像节点进行遍历排序。实验结果表明,两种方法都能很好地改善图像搜索排序结果,其中SI算法适合使用在初始查准率在0.5~0.9的情况;而D算法不要求初始查准率,但对图像间相似性值的精确度要求高,可以用于用户指定一张查询相关图像的重排序。 谢辉 陆月明关键词:图像检索 图论 视觉特征 DIJKSTRA算法 PPAT:一种Pthread并行程序线程性能分析工具 被引量:3 2012年 随着多核/众核处理器技术的快速发展,程序需要越来越多地采用多线程并行技术以提升性能。随着线程个数的增多,线程并行运行过程中相互间同步/互斥及资源竞争关系更加复杂,导致程序性能优化的难度增大。为了使编程人员直观地了解线程的动态运行过程,特别是线程间同步及资源共享带来的影响,帮助其进行程序性能优化,设计实现了一种面向Pthread的并行程序线程性能分析工具PPAT(Pthreads program analysis tool),该工具可在程序运行过程中动态获取线程运行及线程间互斥/同步信息,生成线程通信图,并以多种可视化的方法显示,为编程人员优化程序性能提供依据。 温莎莎 刘轶 刘弢宋 平李 博钱 德沛关键词:多线程 资源共享 资源竞争 不同层次MPI并行程序容错的比较 被引量:2 2011年 随着超级计算机系统规模的不断扩大和系统结构的日益复杂,系统容错已经成为大规模超级计算机系统必须解决的一个关键问题。MPI并行程序的容错也日益受到关注,其中检查点设置和回卷恢复是MPI并行程序容错中一种重要的容错技术。本文对MPI标准、各种版本MPI实现的容错情况及检查点设置/回卷恢复的容错技术进行了介绍,给出了深腾7000上不同层次MPI并行程序的容错实例和性能测试结果,最后对不同层次MPI并行程序容错的开销进行了分析比较。 赵毅 曹宗雁 朱鹏 迟学斌关键词:MPI 容错 检查点设置 回卷恢复 基于GPU集群的科学计算可视化平台的性能测试与分析 2011年 应用于高性能计算集群的科学计算可视化软件发展日趋成熟,GPU加速的应用使得这类软件处理大规模数据的能力不断提高。本文介绍了可视化软件VisIt在GPU集群上安装及性能测试的一些工作,探讨了包括VisIt的基本架构、安装过程中遇到的问题及其解决方案、VisIt图像绘制中的并行性能测试、计算过程可视化的实现。 张亚南 田东 阚圣哲 单桂华关键词:可视化 VISIT GPU集群 科学计算可视化 基于批量作业提交的网格门户的设计与实现 2011年 传统的网格Portal大多不能很好地满足用户同时提交多作业的需求。本文提出了一个支持批量作业提交、可动态精确授权的网格计算门户。提供了简单易用的作业管理系统,支持作业的批量提交、作业状态的实时查看、作业的批量重做及终止、结果文件批量下载等功能;实现了基于LDAP的全网格用户认证及管理;根据批量提交的特点设计了基于组和个数受限应用规则结合的访问控制机制,实现了动态、精确的应用授权。分析及实验表明,用户通过该Portal能够高效、安全的完成计算任务。 刘阳 曹荣强 肖海力 迟学斌关键词:网格门户 动态授权