安徽省自然科学基金(090412068)
- 作品数:11 被引量:53H指数:3
- 相关作者:郑启龙王向前王昊汪胜汪睿更多>>
- 相关机构:中国科学技术大学安徽省高性能计算重点实验室合肥工业大学更多>>
- 发文基金:安徽省自然科学基金国家科技重大专项国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 推测执行技术在HPMR系统通信优化中的应用被引量:2
- 2010年
- HPMR(high performance MapReduce)系统是一个采用MapReduce模型的高性能计算软件支撑平台.在进行高性能计算时,HPMR往往需要很多轮Map-Reduce过程,中间的通信过程由KV路由和KV传输组成.KV传输依照KV路由阶段产生的KV路由表进行.HPMR程序的典型通信特征是每一轮的KV传输以高概率使用上一轮的KV路由表.根据这一特点,提出在HPMR的通信模型中引入推测执行技术,由此减少了KV路由的次数,使得HPMR的通信性能得到大大地提升.
- 王昊王向前郑启龙
- 关键词:MAPREDUCE
- 基于编译制导的复数乘法优化设计被引量:1
- 2012年
- 数字信号处理芯片不能充分利用其自身提供的复数乘法指令,会造成复数乘法运算性能低下。为此,提出一种基于编译制导的复数乘法优化模块。采用传递编译制导命令,使得编译器在指令控制块中,能运用识别算法识别出与复数乘法运算相关的所有指令,并替换其中的乘法指令为单条复数乘法指令。实验结果表明,该优化模块能缩短fft_radix2和fft_radix4程序的执行时钟周期。
- 付和萍郑启龙陈思灵冯玉谦
- 关键词:数字信号处理复数乘法控制块
- 基于IMPACT的嵌入式汇编设计与实现被引量:1
- 2012年
- DSP的底层特性与传统的C语言特性差别很大,有DSP领域的特殊指令集,这些指令很难被编译器生成,或者根本不能被编译器生成.程序员也有需求直接访问底层特性.为了解决这个问题,通过对IMPACT的基础编译器框架进行拓展实现嵌入式汇编功能模块.
- 冯玉谦郑启龙卢世贤陈思灵付和萍
- 关键词:DSP编译器IMPACT
- DSP分块内存和多AGU的编译指示优化被引量:3
- 2012年
- 分块内存和多地址生成器(AGU)是DSP普遍采用的体系结构.传统的C语言编译器没有针对分块内存和多AGU结构进行代码优化,导致生成代码无法满足性能需求,影响了C语言编译器在数字信号处理领域的应用.为了解决这个问题,提出基于编译指示,与分块内存和多AGU结构相关的编译优化算法.该算法利用定义引用链和引用定义链中的数据流信息,为地址计算指令和访存指令分配AGU,从而提高生成代码的指令级并行度.实验结果表明此算法能够达到较好的优化效果.
- 郑启龙卢世贤洪兴勇陈元夏霏
- 关键词:DSP
- HPMR系统KV路由算法设计
- 2010年
- 提出一种针对HPMR系统的KV路由算法。HPMR系统是MapReduce模型的一个实现,改进了MapReduce模型以适应高性能计算的需求。HPMR的KV路由算法生成KV路由表,所有数据的收发动作将依据该路由表进行。KV路由算法产生的KV路由表直接决定HPMR系统在通信阶段的时间开销。实验结果表明,该KV路由算法产生的KV路由表可以提高HPMR系统的通信性能。
- 郑启龙王向前王昊
- 关键词:MAPREDUCE模型
- DSP编译器中一种基于子图的分簇算法被引量:1
- 2010年
- 为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进行分簇的算法.最后,验证了该算法能够提高分簇效率.
- 郑启龙汪胜夏霏
- 关键词:数字信号处理器分簇编译器依赖图
- HPMR内存管理模块优化设计
- 2011年
- HPMR系统是一个采用MapReduce模型的高性能计算软件支撑平台,它改进了MapReduce模型以适应高性能计算的需求。高效的HPMR系统内存管理模块是保证其效率的重要模块。HPMR系统中有两个角色,Master和Worker。Master负责从输入数据文件中读入数据块并分配给Workers。Worker负责接收master分配的数据块、管理map函数的输入输出模块的输入输出数据、管理reduce函数输入输出数据。目前的内存管理模块存在管理通信冗余、管理低效、数据处理并行不足等缺点。本文根据成熟的内存优化理论,重新设计了HPMR底层的数据管理机制,提出了基于内存池的内存管理。实验表明,新的内存管理模块是保证HPMR系统高效的必要条件。
- 郑启龙汪睿王向前
- 关键词:MAPREDUCE内存池数据管理
- HPMR在并行矩阵计算中的应用被引量:3
- 2010年
- 为了解决传统并行编程难度大、效率低的问题,提出一种基于MapReduce模型的并行编程方法,在高性能MapReduce平台上实现矩阵并行LU分解。实验结果表明,相比传统并行编程模型,MapReduce模型并行程序可较好满足高性能数值计算需求,其编程简洁性和可读性能有效提升并行编程效率。
- 郑启龙吴晓伟房明王昊汪胜王向前
- 关键词:并行编程LU分解
- KD60集群消息传递接口群集通信算法优化
- 2011年
- 大规模集群已经发展到多核的时代,多核架构对并行计算提出了新的要求。消息传递接口(MPI)是最常用的并行编程模型,而群集通信又是MPI中的重要组成部分。研究高效的群集通信算法对并行计算效率的提升有着重要的作用。KD60平台是采用首款国产多核芯片——龙芯3号搭建的国产万亿次多核集群。首先分析了KD60平台多核集群的体系特征以及多核架构下通信具有的层次性特征;然后分析原有群集通信算法实现原理及其不足;最后以广播为例,在原有算法基础上,采用一种基于片上多核(CMP)架构改进算法,改变原有算法通信模式,同时结合实验平台KD60体系特征,对算法做了体系相关优化。实验结果表明,改进算法能够很好地利用多核结构的特点,提高了群集通信广播算法的性能。
- 郑启龙汪睿周寰
- 关键词:消息传递接口多核集群
- 基于MapReduce模型的并行科学计算
- 随着多核处理器日渐普及,开发高效易用的并行编程模型成为新的挑战.MapReduce是Google开发的一种并行分布式计算模型,在其搜索业务中获得了巨大的成功.将MapReduce模型引入科学计算领域,并结合实例阐述了如何...
- 郑启龙房明汪胜王向前吴晓伟王昊
- 关键词:并行编程模型MAPREDUCE
- 文献传递