您的位置: 专家智库 > >

肖玄基

作品数:2 被引量:0H指数:0
供职机构:中国科学院软件研究所更多>>
发文基金:中国科学院知识创新工程重要方向项目国家重大技术装备创新研制项目国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇理学

主题

  • 1篇异构
  • 1篇异构平台
  • 1篇数学库
  • 1篇矩阵
  • 1篇矩阵分解
  • 1篇PLASMA
  • 1篇GPU
  • 1篇LAPACK
  • 1篇MAGMA

机构

  • 2篇中国科学院软...
  • 1篇中国科学院研...

作者

  • 2篇张云泉
  • 2篇肖玄基
  • 1篇李玉成
  • 1篇王婷
  • 1篇袁良
  • 1篇吕渐春

传媒

  • 1篇计算机科学
  • 1篇2012全国...

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
异构平台数学库MAGMA性能测试与分析
MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU...
肖玄基张云泉李玉成袁良
关键词:MAGMAGPU矩阵分解
文献传递网络资源链接
PLASMA自适应调优与性能优化的设计与实现
2012年
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
吕渐春张云泉王婷肖玄基
关键词:LAPACKPLASMA
共1页<1>
聚类工具0