赵毅
- 作品数:16 被引量:72H指数:4
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家高技术研究发展计划中国科学院战略性先导科技专项中国科学院知识创新工程更多>>
- 相关领域:自动化与计算机技术自然科学总论文化科学更多>>
- 不同层次MPI并行程序容错的比较被引量:2
- 2011年
- 随着超级计算机系统规模的不断扩大和系统结构的日益复杂,系统容错已经成为大规模超级计算机系统必须解决的一个关键问题。MPI并行程序的容错也日益受到关注,其中检查点设置和回卷恢复是MPI并行程序容错中一种重要的容错技术。本文对MPI标准、各种版本MPI实现的容错情况及检查点设置/回卷恢复的容错技术进行了介绍,给出了深腾7000上不同层次MPI并行程序的容错实例和性能测试结果,最后对不同层次MPI并行程序容错的开销进行了分析比较。
- 赵毅曹宗雁朱鹏迟学斌
- 关键词:MPI容错检查点设置回卷恢复
- 基于通信优化的Infiniband集群MPI作业加载被引量:1
- 2011年
- 针对如何缓解Infiniband集群中因通信冲突引起的MPI程序性能下降问题进行了研究,从系统管理的角度出发,提出了通过改变进程映射来优化MPI作业加载方案从而优化应用程序通信性能的方法,设计了用于评价MPI作业加载方案的通信性能损失系数(CPLR)指标,基于模拟退火算法设计了优化加载方案的搜索算法,并对所提出的指标和算法进行了实现和测试。测试结果表明,经过优化加载后的MPI程序在通信性能上有一定程度的提高。
- 曹宗雁牛铁赵毅朱鹏迟学斌
- 关键词:高性能计算机INFINIBAND集群MPI通信优化
- 浅析高性能计算应用的需求与发展被引量:32
- 2007年
- 高性能计算应用在高性能计算技术的支持下为科技创新做出了巨大贡献,并且和高性能计算技术在相辅相成中不断发展.自2004年以来,中国科学院计算机网络信息中心超级计算中心针对中国科学院在"十一五"期间的高性能计算需求在全院范围内开展了多次调研活动,对中国科学院在"十一五"期间高性能计算的整体需求及各应用领域需求的分布情况有了比较全面的了解,其调研结果对"十一五"中国科学院高性能计算环境建设和高性能计算应用的发展具有良好的借鉴作用.首先介绍了国内外高性能计算应用的发展现状,并结合中国科学院高性能计算环境建设和高性能计算应用的发展情况,分析了"十一五"中国科学院高性能计算的应用需求,最后对我国高性能计算应用的发展前景进行了展望.
- 赵毅朱鹏迟学斌牛铁曹宗雁
- 关键词:高性能计算机网格
- 超大规模药物虚拟筛选的实现与应用被引量:1
- 2023年
- 基于分子对接的药物虚拟筛选技术通过评估多个配体化合物与受体的结合强度来筛选最强结合的分子。在新冠病毒疫情全球蔓延形势下,超大规模快速药物虚拟筛选对于从海量配体结构中筛选出潜药分子至关重要。超级计算机的强大算力为药物虚拟筛选提供了硬件保障,但超大规模的药物虚拟筛选还面临着很多挑战,影响了计算的有效进行。在对挑战进行分析的基础上,提出了以中央数据库进行集中任务分发的方案,设计了多层级任务分发框架,并通过多层级智能调度、海量小分子文件多层级压缩处理、动态负载均衡、高容错管理等技术有效应对了面临的各种挑战,开发了简单易用的“树”形多层级任务分发系统,实现了快速高效稳定的药物虚拟筛选任务分发、计算和结果处理功能,计算效率近线性。在此基础上,采用异构计算技术在国产先进计算系统上针对新冠病毒两种不同活性位点快速完成了超过20亿化合物的药物虚拟筛选,为应对暴发性恶性传染病的超大规模快速虚拟筛选提供了强大计算保障。
- 张宝花李辉刘倩刘倩黄荷赵毅赵毅金钟
- 关键词:分子对接容错管理动态负载均衡
- IB网上CPU-GPU异构超算平台容器性能评估及优化被引量:1
- 2021年
- 为了实现资源和系统环境的隔离,近年来新兴了多种虚拟化工具,容器便是其中之一。在超算资源上运行的问题通常是由软件配置引起的。容器的一个作用就是将依赖打包进轻量级可移植的环境中,这样可以提高超算应用程序的部署效率。为了解基于IB网的CPU-GPU异构超算平台上容器虚拟化技术的性能特征,使用标准基准测试工具对Docker容器进行了全面的性能评估。该方法能够评估容器在虚拟化宿主机过程中产生的性能开销,包括文件系统访问性能、并行通信性能及GPU计算性能。结果表明,容器具备近乎原生宿主机的性能,文件系统I/O开销及GPU计算开销与原生宿主机差别不大。随着网络负载的增大,容器的并行通信开销也相应增大。根据评估结果,提出了一种能够发挥超算平台容器性能的方法,为使用者有针对性地进行系统配置、合理设计应用程序提供依据。
- 胡鹤赵毅王宪贺
- GPU加速高性能计算平台上容器性能评估被引量:1
- 2021年
- 容器是近年来新兴的虚拟化工具,可以实现资源和系统环境的隔离.容器能够帮助高性能计算应用程序将依赖打包进轻量级可移植的环境中,解决因软件配置无法在高性能计算资源上运行的问题.容器在虚拟化宿主机过程中具有性能开销,为了解GPU加速高性能计算平台上容器虚拟化技术的性能特征,使用标准基准测试工具对Docker容器进行了全面的性能评估,包括文件系统访问性能,并行通信性能及GPU计算性能.评估结果表明,在文件系统I/O开销及GPU计算开销方面,容器具备近乎原生宿主机的性能,容器的并行通信开销随着网络负载的增大而增大.在仅考虑性能的情况下,容器方案适用于通信负载不大的并行应用程序.
- 胡鹤赵毅庞飞
- 关键词:虚拟化
- 一种数据异常检测方法及装置
- 本发明实施例涉及一种数据异常检测方法及装置。方法包括:获取当前时刻流量的观测值;计算所述观测值和当前时刻流量的预测值所对应的当前时刻的残差;建立时间序列滑动窗口;将所述当前时刻对应的残差按时间序列放入当前时刻所对应的所述...
- 尉书宾杨校林何群辉李菁菁胡颖赵毅邓鑫
- 超级计算环境容错机制研究
- 中科院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的三层架构超级计算环境。为提升超级计算环境的可靠性,提供稳定可靠的计算服务,其容错机制的研究成为超级计算环境的一个研究重点。本文在对容错基本思想及各类计算机容...
- Zhao Yi赵毅Cao Zongyan曹宗雁Zhu Peng朱鹏Chi Xuebin迟学斌
- 关键词:容错技术
- 文献传递
- 面向集群服务器系统的监控平台综述被引量:4
- 2018年
- 为保证云计算、高性能计算集群服务器系统的服务能力,需构建监控平台对各种来源数据的实现统一管理、统计分析和展现。本文面向集群服务器系统监控平台的搭建方式,综述当前各种常见的监控平台架构和组件,分析各类平台在部署、数据规模、统计分析能力以及时效性等方面的不同。分析结果表明,集群服务器系统监控平台搭建方案应根据监控数据规模、时效性要求、查询和统计需求选择方案。
- 胡鹤赵毅牛铁曹荣强
- 关键词:索引大数据报警ELKMAP-REDUCESPARK
- 高性能计算技术及其应用被引量:25
- 2007年
- 简要介绍了当前高性能计算机、并行算法、并行编程环境和高性能计算应用的国际研究现状和发展趋势,阐述了近几年中科院高性能计算环境建设和高性能计算应用的发展情况,最后对我院发展高性能计算技术及应用给出了几点思考。
- 迟学斌赵毅
- 关键词:高性能计算技术并行编程环境