李建江
- 作品数:51 被引量:282H指数:6
- 供职机构:北京科技大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术石油与天然气工程自然科学总论理学更多>>
- 一种直接求解结构化三角稀疏线性方程组的并行计算方法
- 本发明提供一种直接求解结构化三角稀疏线性方程组的并行计算方法,属于异构多核平台通信优化及高性能数值计算领域。所述方法包括:输入结构化线性方程组的求解问题规模大小和网格计算模板,接收求解矩阵和右端向量,自适应选择求解映射方...
- 李建江梁佳碧薛巍胡正丁李琳石金梁
- 文献传递
- MapReduce并行编程模型研究综述被引量:189
- 2011年
- MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望.
- 李建江崔健王聃严林黄义双
- 关键词:MAPREDUCE并行编程模型海量数据处理
- 一种动力学蒙特卡洛并行模拟的通信优化方法及其系统
- 本发明提供一种动力学蒙特卡洛并行模拟的通信优化方法及系统,其中,所述方法包括:构造通信数据结构;构建邻居进程的图状拓扑结构;开启进程外迭代;按照预设顺序从多个子区域中选择一个子区域;进程当前选择的子区域数据通过构造的所述...
- 李建江胡长军汪岸王先梦
- 一种非结构化三角稀疏线性方程组的并行计算方法及装置
- 本发明提供了一种非结构化三角稀疏线性方程组的并行计算方法及装置,涉及高性能数值计算领域。包括:接收求解矩阵和右端向量,对求解矩阵的非零元按列存储;对求解矩阵进行预处理,根据分析结果自适应选择求解算法,开启多核并行处理;在...
- 李建江李琳薛巍王庆伟梁佳碧石金梁
- MD与KMC的耦合模拟研究与实现
- 2018年
- 材料辐照损伤是当前材料领域和计算机领域研究的热点之一。分子动力学(MD)和动力学蒙特卡罗(KMC)耦合模拟是材料辐照损伤模拟中常用的方法。MD和KMC模拟体系中的原子类型、变量种类以及数据表示形式都不同,如何实现两个体系间数据的传输,是耦合模拟中的一个重要问题。为了解决这一问题,该文设计并开发了一个中间程序,提出了识别系统中原子类型的最短距离(SD)算法,通过计算原子位置与标准网格点之间的距离,来判断系统中的间隙原子、空位和正常原子。最后通过实验验证了该方法,MD及KMC耦合模拟的正确性和有效性。
- 李建江魏鹏杨少峰贺新福胡长军
- 关键词:分子动力学
- 一种异构多核平台处理器内的通信优化方法及电子设备
- 本发明公开了一种异构多核平台处理器内的通信优化方法及电子设备,该方法包括:将异构多核平台的从核阵列按列划分为多列核组,并将每列核组中的多个从核分别划分为至少一个存储从核和多个连续的计算从核;对位于同一列的从核进行池化处理...
- 李建江刘志国焦惠慧冯灿
- 一种直接求解结构化三角稀疏线性方程组的并行计算方法
- 本发明提供一种直接求解结构化三角稀疏线性方程组的并行计算方法,属于异构多核平台通信优化及高性能数值计算领域。所述方法包括:输入结构化线性方程组的求解问题规模大小和网格计算模板,接收求解矩阵和右端向量,自适应选择求解映射方...
- 李建江梁佳碧薛巍胡正丁李琳石金梁
- 一种单GPU程序向多GPU移植的模板化技术被引量:5
- 2010年
- 图形处理器(GPU)作为一种高度并行化的处理器架构,已得到越来越多的重视,目前已诞生了以NVIDIA CUDA为代表的各种GPU通用计算技术,同时多GPU并行计算也已有了实际的应用.多GPU并行计算涉及GPU与CPU两者之间的协调和交互,对程序员有着更高的要求.为此,提出一种基于模板的源代码生成技术,通过模板转化来支持单GPU程序的并行化移植.最后通过一个实例表明使用提出的CUDA源代码移植框架能够自动生成与手写程序等价的代码,可以显著降低多GPU下CUDA程序的开发代价,提高CUDA应用程序员的生产效率.
- 李建江李兴钢路川樊少明
- 关键词:代码生成CUDAOPENMP数据分解数据通信
- 基于动态获取高频率键的MapReduce性能优化算法
- 2018年
- 在云计算技术领域中,MapReduce能够帮助人们快速处理海量数据,因此在学术界以及工业界越来越受到重视。但是MapReduce在处理以文本为中心的应用时,中间结果中数据重复较多。针对该情况,已有的高频率缓冲(frequency buffering,FB)算法提出在环形内存缓冲之前添加哈希表,并将高频率键存储在哈希表中。该算法通过采样来实现,有额外开销并且统计出的高频率键并不一定准确。该文提出一种基于动态获取高频率键的MapReduce性能优化算法,通过在环形内存缓冲之前增加计数Bloom过滤器(counting Bloom filter,CBF)和哈希表,将高频率键动态地存储在哈希表中。该算法获得的高频率键更准确,同时大大减少了数据排序和磁盘I/O的开销。实际测试结果表明:该算法明显提高了作业的执行速度,比原始MapReduce提高17.04%,比FB算法提高9.31%。
- 李建江滑水亮吴杰张凯
- 关键词:MAPREDUCE
- 一种高效的多细胞分子动力学算法
- 2013年
- 多细胞分子动力学算法是分子动力学模拟中普遍使用的并行算法.因为利用不同作用路径的多细胞分子动力学算法的消息传递次数彼此不同,利用作用路径能够优化消息传递次数.优化消息传递次数是一种设计高效并行算法的方法.因此,本文研究十六个不同的作用路径,推导出十六个表示消息传递次数的数学模型,并在高性能通信和负载平衡方面决定十六个模型中最好的.实验结果表明模型的平均正确率是99.1391%,它的一个时间步骤的并行效率比HS算法平均提高了5.16%,处理器数的增加和截断半径的优化提高其并行效率.
- 金明灿胡长军李建江李越韩载浩
- 关键词:并行计算