肖玄基
- 作品数:2 被引量:0H指数:0
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:中国科学院知识创新工程重要方向项目国家重大技术装备创新研制项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 异构平台数学库MAGMA性能测试与分析
- MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU...
- 肖玄基张云泉李玉成袁良
- 关键词:MAGMAGPU矩阵分解
- 文献传递网络资源链接
- PLASMA自适应调优与性能优化的设计与实现
- 2012年
- PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
- 吕渐春张云泉王婷肖玄基
- 关键词:LAPACKPLASMA