国家自然科学基金(60325205)
- 作品数:25 被引量:148H指数:5
- 相关作者:胡伟武李祖松许彤唐志敏刘志勇更多>>
- 相关机构:中国科学院中国科学院研究生院中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 龙芯2号处理器系统优化关键技术被引量:5
- 2006年
- 系统软件作为处理器和应用程序之间的接口,对于充分利用处理器的特性来维护处理器与应用程序的稳定性和提高应用程序的性能起着极其重要的作用·描述了在Linux内核中解决龙芯2号处理器的Cache别名问题的方法以及通过增加页的大小、软TLB和FAST TLB REFILL的方法减小TLB失效的性能损失,还有Uncache Accelerate对媒体播放软件的加速·实验结果表明,在系统软件中增加这些方法的支持,对系统的稳定性和性能都有较大的好处·
- 伍鸣张福新林伟许先超袁楠王剑
- 关键词:龙芯2号处理器
- 同时多微线程体系结构研究被引量:1
- 2007年
- 随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术.提出一种融合同时多线程技术和微线程技术的新型体系结构同时多微线程(simul-taneous multi-microthreading,SMMT),并给出同时多微线程体系结构的实现方案.SMMT有效结合同时多线程技术硬件代价小和微线程技术能够加速单进程应用的优点,通过软硬件协同的方式充分挖掘单进程程序的微线程级并行性.通过在设计的龙芯2号同时多微线程处理器上进行性能评测,结果表明,同时多微线程体系结构能够有效地加速单进程的程序,以很小的硬件代价显著地提高了处理器的性能.
- 李祖松许先超胡伟武唐志敏
- 关键词:同时多线程体系结构
- Cache自适应写分配策略被引量:4
- 2007年
- 处理器所能提供的有效带宽是目前制约处理器性能提高的关键因素.通过对Cache写失效行为的分析,提出了一种新的提高处理器带宽利用率的Cache写失效处理策略——Cache自适应写分配策略.该策略在访存失效队列中收集全修改Cache块,对全修改Cache块采用非写分配策略,并能够自适应地切换为写分配策略.与传统的Cache写失效处理策略相比,Cache自适应写分配策略硬件代价小,避免了不必要的数据传输,降低Cache污染,减少存储管理队列阻塞的频率.结果表明,采用Cache自适应写分配策略,STREAM基准测试程序带宽平均提高62.6%,SPECCPU2000程序的IPC值平均提高5.9%.
- 郇丹丹李祖松胡伟武刘志勇
- 关键词:CACHE带宽龙芯2号
- 龙芯1号处理器的故障注入方法与软错误敏感性分析被引量:38
- 2006年
- 在纳米级制造工艺下以及在航天等特殊应用场合中,可靠性将是处理器设计中的一个重要考虑因素.以龙芯1号处理器为研究对象,探讨了处理器可靠性设计中的故障注入方法,并提出了一种同时运行两个处理器RTL模型的故障注入与分析方法,可以实现连续快速的处理器仿真故障注入.在此基础上,进一步分析了龙芯1号处理器的软错误敏感性,通过快速注入大约30万个软错误,保证了分析结果具有较好的统计意义,可以有效指导后续的容错与可靠性设计.
- 黄海林唐志敏许彤
- 关键词:软错误
- 龙芯2号微处理器浮点除法功能部件的形式验证被引量:4
- 2006年
- 基于决策图的字级模型检验方法虽然能完全验证运算电路,但它从有缺陷的设计中发现系统规范的反例所需时间较长.而基于SAT的有界模型检验方法虽然能较快地发现反例,但它不支持包含数学公式的系统规范,因而难以用于验证运算电路.提出了基于SAT的字级模型检验方法,该方法将CNF扩展为能混合布尔公式和数学公式的E-CNF用以表示设计和系统规范,并对有界模型检验工具和SAT求解器进行字级的扩展,使它们能分别生成和处理E-CNF.龙芯2号微处理器浮点除法功能部件验证同时采用了基于PHDD和基于SAT的字级模型检验方法.数据表明,基于SAT的字级模型检验方法能快速地发现运算电路中的设计缺陷.两种方法互为补充,在能完全验证设计的同时显著缩短了设计周期.
- 陈云霁马麟沈海华胡伟武
- 关键词:SATCNF
- 基于VPM和随机激励的处理器核仿真建模
- 2010年
- 为提高处理器核仿真模型的效率,提出基于SimpleScalar架构对龙芯1号处理器进行虚拟处理器模型行为建模,IPC平均误差为2.3%,速度达到每秒1 000 000条指令。基于可控随机事件机制实现的总线功能模型可以为片上系统(SoC)设计提供激励主动生成方案和片上互连验证功能。实验结果证明,该方法对处理器IP仿真建模具有普适意义,能够被无缝融入SoC流程中。
- 许彤张仕健吕涛
- 关键词:总线功能模型
- 一种基于统计特性估算串扰概率的方法
- 2006年
- 该文所提出的基于统计特性估算总线串扰概率的方法与以往基于数据流的方法相比,具有更短的运行时间,且精度相当,可以更有效地为综合工具采取相应避免措施提供参考依据。
- 徐君范宝峡
- 关键词:串扰ARMA模型
- 针对龙芯2号结构特征的GCC优化被引量:1
- 2007年
- 根据龙芯2号处理器体系结构的特点,引入浮点乘加、条件move和预取等一系列特殊指令,并且对开源编译器GCC进行修改使其支持这些特殊指令,同时对生成对应指令的算法进行了调整和优化.实践中已经证明,特殊指令的引入和相应的优化比较好的提升了应用程序的性能,达到了预期的效果.
- 邹琼董峻峰
- 关键词:龙芯2号
- 基于约束的处理器接口随机测试模型被引量:1
- 2007年
- 提出了一种处理器接口测试模型,并给出了具体实现方案。该测试模型将仿真测试的方法应用于处理器接口测试,在激励生成中采用基于约束的随机测试生成方法。结果表明,基于约束的处理器接口随机测试模型的覆盖率达到83.68%,能够快速有效地完成处理器接口部件的功能验证。
- 郇丹丹李祖松刘志勇
- 关键词:接口仿真龙芯2号
- 一种快速的滑动标记缩并垃圾收集算法被引量:1
- 2008年
- Java语言完全面向对象,因此对象局部性是衡量Java虚拟机性能的重要指标.在Java虚拟机中,由垃圾收集算法负责检测并且回收不再使用的对象,它直接影响着Java程序的性能.保持对象分配序能够提供最佳的局部性.滑动标记缩并算法正是基于这一原则,但是传统上的设计使得算法的效率很低.本文提出一种快速的滑动标记缩并算法,它通过位图、活块池和块内偏移表来简化算法,大大的降低了开销.实验结果表明,快速的滑动标记缩并算法使得标准工业测试程序SPECJVM98的性能在Pentium4上有不同程度的提高,最高达到8.9%;同时程序的局部性也优于线性标记缩并算法,与深度遍历序相比,DTLB(Data Translation Lookaside Buffer)与2级Cache失效率改善最多分别为11%和13.6%.
- 邹琼章隆兵
- 关键词:垃圾收集位图