您的位置: 专家智库 > >

陈莉

作品数:28 被引量:76H指数:5
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 15篇期刊文章
  • 6篇科技成果
  • 4篇专利
  • 2篇会议论文
  • 1篇学位论文

领域

  • 25篇自动化与计算...

主题

  • 7篇编程
  • 4篇异构
  • 4篇接口
  • 4篇编程模型
  • 3篇调度
  • 3篇优化技术
  • 3篇消息传递接口
  • 3篇MPI
  • 3篇并行编程
  • 2篇信息提取
  • 2篇信息提取方法
  • 2篇中节点
  • 2篇神威
  • 2篇数据重组
  • 2篇通信
  • 2篇通信模式
  • 2篇通信行为
  • 2篇拓扑
  • 2篇拓扑信息
  • 2篇网格

机构

  • 28篇中国科学院
  • 3篇山东科技大学
  • 2篇中国科学技术...
  • 2篇中国科学院大...
  • 1篇中国科学院研...
  • 1篇澳大利亚新南...

作者

  • 28篇陈莉
  • 13篇冯晓兵
  • 9篇张兆庆
  • 5篇乔如良
  • 4篇王蕾
  • 4篇崔慧敏
  • 3篇刘雷
  • 3篇吴承勇
  • 3篇唐生林
  • 3篇高琳
  • 3篇吕方
  • 3篇李恒杰
  • 3篇刘颖
  • 3篇李玉祥
  • 2篇张定飞
  • 2篇支援
  • 2篇李鹏程
  • 2篇王轶然
  • 2篇桑春雷
  • 2篇王毅

传媒

  • 3篇计算机研究与...
  • 3篇计算机科学
  • 2篇计算机工程与...
  • 2篇小型微型计算...
  • 2篇软件学报
  • 1篇计算机学报
  • 1篇计算机工程
  • 1篇高技术通讯
  • 1篇2008年全...
  • 1篇863计划智...

年份

  • 1篇2024
  • 2篇2020
  • 2篇2019
  • 1篇2016
  • 3篇2014
  • 2篇2013
  • 1篇2011
  • 2篇2010
  • 4篇2009
  • 2篇2008
  • 1篇2006
  • 1篇2005
  • 1篇2004
  • 1篇2003
  • 2篇2002
  • 2篇2001
28 条 记 录,以下是 1-10
排序方式:
异构数据中心中自适应编程环境技术的研究与应用
冯晓兵赵家程崔慧敏刘颖王蕾吕方陈莉唐生林霍玮李丰衷璐
随着云计算、互联网与物联网技术的快速发展,数据中心已经成为核心的计算和服务提供方。而伴随着大数据处理、高通量计算、人工智能等多样化应用在数据中心的广泛部署,传统的通用处理器难以满足来自于应用的性能、功能、延迟的多维度需求...
关键词:
关键词:数据处理方法
UPC 细粒度重叠优化
高性能并行计算的唯一目的就是追求尽可能高的极限性能,这一尝试包括使用最先进的超级计算机,最快的并行算法,也包括选择更合适的编程模型与最大化程序性能的优化方法。现代网络支持RDMA以及PGAS语言,如UPC,支持远端CPU...
商磊陈莉李恒杰
关键词:并行计算单边通信管理程序
文献传递
带类型恢复的编译器源源翻译技术被引量:7
2010年
源源翻译是使编译器的分析和优化可重定向的一种重要方式.它被广泛用来支持并行语言扩展或者各种体系结构无关的优化,并且可以帮助程序员进行正确性或者性能的调试.在多核/众核时代,程序分析和优化倾向于让用户更多地参与,这种平台无关而且用户友好的代码生成方式也越来越受到欢迎.在简单的编译器中添加源源翻译的支持很容易,但在实现了复杂的程序分析和激进的优化的编译器中,却很少有编译器提供健壮的源源翻译支持.优化对程序结构的改变是造成翻译困难的首要原因.结合大量出错实例对优化给源源翻译带来的困难进行分析,提出了一套基于类型恢复的翻译技术,并在Open64编译器中实现了这种方法.通过supertest和spec2000测试集的测试,验证了这种方法对源源翻译的健壮性有很大改善.该方法的实现模块集成在源源翻译器内,与编译器各种分析优化模块独立,所以该方法容易移植到其他编译器中.
米伟李玉祥陈莉冯晓兵张兆庆
关键词:编译器
支持算法组件自动替换的编程范式及编译框架被引量:1
2013年
针对算法组件的自动替换蕴含的算法组件的兼容性判定问题,提出了一个算法组件的约束模型,从而将算法组件的兼容性判定转化为约束模型的兼容性判定。为解决转化后的兼容性判定,采用了分治思想,即只需判定原子约束强度,约束模型间的兼容性可由原子约束强度结合约束强度推导规则与放松的组件接口兼容性判定规则自动导出。为使算法自动替换更具实用性,提出了支持算法自动替换的编程范式,使得自动替换前期涉及的手工工作在编程所涉及的不同角色之间得到合理分配。设计了编译框架原型,或支持算法与编译优化选项的自动选择。实验结果显示,该系统在9个测试用例上获得的平均加速比为2.29。
李恒杰何文婷陈莉刘雷吴承勇
关键词:编程范式
片上并行系统的编程模型与支撑环境
高光荣冯晓兵张兆庆乔如良吴承勇武成岗陈莉臧斌宇漆锋滨王蕾吕方崔慧敏唐生林邢明杰杨欣张卫华陈榕
随着摩尔定律延长和片上多核/众核时代的到来,并行处理将成为21世纪主流技术。现在整个工业界和学术界都在重新考虑,并行计算今后到底应该向什么方向走?面向大众的并行应用开发的产能、效能和正确性应该是研究的最终目标。该项目在这...
关键词:
关键词:模拟器软件开发
分布存储系统中优化通信的冗余计算分割被引量:2
2003年
针对并行循环套序列 ,提出一种冗余计算分割的通信优化方法 .根据数据流分析 ,文中给出用以确定每个循环套的冗余计算量的一般方法 ,并在此基础上提出冗余计算分割的实现和判定 .针对规则依赖的程序 ,该文还提出了一个高效的冗余计算分割的实现方法 .该技术已经在一个并行编译器中实现 ,试验结果表明 ,它比传统的通信优化技术有明显的优越性 .
陈莉张兆庆冯晓兵
关键词:分布存储系统冗余计算通信优化
基于动态profiling技术的流水粒度调优被引量:4
2005年
结点间流水是解决数据分布和计算分割不一致时的一种重要的并行发掘技术.结点间流水通过计算与通信的重叠获得并行度.精确的流水粒度是获得良好的流水性能的关键.流水分块取决于很多因素,如程序规模、程序的访问模式、结点规模、结点的计算能力和存储体系、通信系统的性能、通信库开销等等.提出了动态profiling方式并实现在流水粒度的推导中,运行时信息收集部分典型分块,结合代价模型推导流水粒度,该模型考虑局部性优化;探索如何减少插桩执行的开销的同时保证代价模型的精度.实验证明,这种方式有更好的适应性,能获得较好的流水并行.
马琳陈莉冯晓兵
异构并行编程模型研究与进展被引量:13
2014年
近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑战提供了相应的解决方案.最后,结合目前的研究现状以及异构系统的发展,提出了异构并行编程模型的未来方向.
刘颖吕方王蕾陈莉崔慧敏冯晓兵
关键词:异构系统GPU编程接口
分布式并行处理系统中节点间软流水的优化技术
在分布式系统中如何发掘并行性和极小化同步、通讯的开销是一个重要的课题.全局优化的数据分布和计算分割的模型的推导,都无法避免在程序的某些循环中引入数据重分布、通讯和同步.本文提出一种通过循环合并,发掘流水并行的算法,从而获...
陈莉张兆庆乔如良冯晓兵高琳
文献传递
POM:一个MPI程序的进程优化映射工具被引量:1
2009年
现代超级计算机具有越来越多的计算结点,同时结点内具有多个处理器核。由于互联带宽的差异,结点间与结点内构成两个通信性能不同的通信层次,后者的通信性能好于前者。但是,目前MPI程序的默认进程映射未考虑该通信层次差异,无法利用结点内较好的通信带宽,严重束缚了超级计算机的性能发挥。针对该问题,本文设计实现了能利用层次通信差异的MPI程序自动进程优化映射工具POM,提供了高效、低开销获取MPI程序通信信息的方法,最终通过优化通信在通信层次上的分布提高了程序的通信效率,从而提高了应用程序的性能。本文解决了硬件平台通信层次的抽象、MPI程序通信信息的低开销获取与映射方案的计算三个问题。首先,按照通信能力差异将超级计算机结构抽象为高速互联的不同计算结点与相同结点上的多个处理器核两层。其次,提出了将集合通信转化成点到点通信的简单实现方法。最后,利用无向加权边图来表示MPI程序的进程间通信关系,将MPI程序的进程映射问题转化为图划分问题。在曙光5000A和曙光4000A上的实验结果表明,利用POM工具能够显著提高MPI程序的性能。
卢兴敬商磊陈莉
关键词:图划分
共3页<123>
聚类工具0