您的位置: 专家智库 > >

孙明明

作品数:2 被引量:9H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家科技重大专项更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇自动向量化
  • 2篇向量
  • 2篇向量化
  • 2篇龙芯
  • 1篇龙芯3A
  • 1篇SIMD

机构

  • 2篇中国科学院
  • 2篇中国科学技术...
  • 2篇安徽省计算与...

作者

  • 2篇彭飞
  • 2篇顾乃杰
  • 2篇高翔
  • 2篇孙明明

传媒

  • 2篇小型微型计算...

年份

  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
一种多倍数据供应的编译优化方法
2011年
数据的快速及时供应对访存密集型程序的性能有着直接的影响.提出一种多倍数据供应MDS(Multiple Data Supply)的编译优化方法,在不增加处理器设计复杂度的前提下,利用现有处理器的高带宽,一次对内存进行多个数据的读写,减少访存次数,提高应用程序效率.在编译优化阶段,利用自动向量化技术,生成向量形式的树结构,增加一条新的扩展路径来处理从向量化的树结构到底层结构的扩展.针对向量化后树结构的多样性问题,设计新的优化遍以及RAC(Register Assignment Chain)替换算法进行专门处理.在龙芯3A处理器平台上,对SPEC-CPU2000的测试,CINT程序平均性能提升11.6%,CFP程序平均性能提升14.4%.
彭飞顾乃杰高翔孙明明
关键词:自动向量化龙芯3A
龙芯3B的SIMD编译优化及分析被引量:9
2012年
根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访存方法,并详细介绍了适合龙芯3B的SIMD访存方法.对于不能自动向量化的其他SIMD运算,在GCC编译器中增加了Builtin函数的支持,用户可以根据标准函数接口调用SIMD运算函数,完成向量操作.通过对SPEC-CPU2000、DSPstone等大量benchmark的测试和分析,给出了龙芯3B SIMD运算的各项性能指数.对于性能表现不同的测试函数,均给出了详细分析数据和结论.测试表明,龙芯3B的SIMD运算在实际应用中有着良好的性能表现.
彭飞顾乃杰高翔孙明明
关键词:SIMD自动向量化
共1页<1>
聚类工具0