蔡嵩松
- 作品数:12 被引量:19H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 精简指令集计算机处理器装置及其数据处理方法
- 本发明公开了一种精简指令集计算机(RISC)处理器装置及其数据处理方法。该装置包括译码器,物理寄存器堆和运算部件,以及译码器,物理寄存器堆和运算部件之间连接的数据通路,所述物理寄存器堆中的每个物理寄存器扩展为72位,整个...
- 蔡嵩松李晓钰
- 文献传递
- 跨平台系统级虚拟机的访存优化被引量:2
- 2012年
- 跨平台系统级虚拟机软件模拟访存操作效率低,严重影响了虚拟机的性能.为提高跨平台虚拟机访存效率,提出了一种使用宿主系统TLB硬件、加速跨平台系统级虚拟机访存地址转换的软硬件协同优化方法.该方法相对于软件访存模拟方法,有效利用了宿主系统的硬件资源,提高了跨平台系统级虚拟机执行访存操作效率.实验结果表明该方法将虚拟机系统的整体性能提高了近15%.提出的方法已实际应用在龙芯系统级跨平台虚拟机中.
- 蔡嵩松刘奇沈海华章隆兵
- 关键词:页表TLB
- RISC处理器及其浮点寄存器的非对齐访存方法
- 本发明公开了一种RISC处理器及其浮点寄存器的非对齐访存方法。该处理器包括指令译码部件和执行单元,还包括扩展指令模块;所述扩展指令模块包括多个扩展指令,用于实现对浮点寄存器的非对齐访存操作;所述指令译码部件,包括扩展指令...
- 蔡嵩松苏孟豪
- 文献传递
- 基于硬件cache锁机制的Java虚拟机即时编译器优化
- Java虚拟机即时编译器以方法为单位进行编译,编译器将字节码方法编译成可执行代码,并经过数据cache存入内存中,当再次执行到该代码段时,处理器需要从包含该代码段的内存区域取指令执行,如果该内存区域在数据cache中已经...
- 敖琪蔡嵩松王剑
- 关键词:JAVA虚拟机即时编译器
- 基于龙芯处理器的二进制翻译器优化被引量:14
- 2009年
- 二进制翻译是实现系统迁移的主要方法,但基于通用平台的仅靠软件实现的二进制翻译性能不高。该文以龙芯2F处理器为实现平台,提出一种QEMU二进制翻译器并进行优化,其中包括编译环境的优化以及二进制翻译器本身的优化2个方面,对后者的优化主要涉及寄存器直接映射和多媒体指令的改进。实验结果表明,通过寄存器映射优化后,系统能够获得1.45的加速比,通过多媒体优化后,多媒体程序的执行能达到本地机器执行的80%的性能。
- 蔡嵩松刘奇王剑刘金刚
- 关键词:寄存器堆栈
- 基于硬件cache锁机制的Java虚拟机即时编译器优化被引量:3
- 2012年
- Java虚拟机即时编译器以方法为单位进行编译,编译器将字节码方法编译成可执行代码,并经过数据cache存入内存中,当再次执行到该代码段时,处理器需要从包含该代码段的内存区域取指令执行,如果该内存区域在数据cache中已经建立映射,就可以直接从数据cache中读取数据,读数据的性能就会有大幅度的提高.但是编译生成的大量可执行代码在cache中频繁替换,当生成代码被替换出cache后,代码再次执行时处理器必须访问速度较慢的主存储器,成为编译器的性能瓶颈.设计并实现了硬件cache锁机制,提出了一种软硬件协同设计的即时编译方法.通过该方法,生成代码执行时的cache失效次数降低了6.9%,SPECjvm2008中程序最高获得了17.9%的性能提升,平均性能提升4.2%.
- 敖琪蔡嵩松王剑
- 关键词:JAVA虚拟机即时编译器
- Java虚拟机中的动态锁cache优化
- 2013年
- Java虚拟机在运行过程中使用即时编译器编译Java程序的热点方法,然后直接执行热点方法的本地代码.锁cache机制允许Java虚拟机将编译方法的本地代码锁在cache中,以提高编译执行时的指令cache命中率.通过分析Java虚拟机中编译方法的调用规律,得到编译方法的活跃时间段、平均大小和内存分布情况.基于编译方法的调用规律,给出Java虚拟机中的动态锁cache优化方法.在Java热点方法的活跃期将其本地代码段锁在cache中,以减少cache失效.最后,在龙芯3A的HotSpot虚拟机上实现了动态锁cache优化方法.实验结果表明,Java虚拟机中的动态锁cache优化方法能够使SPECjvm2008运行时的cache失效次数平均降低8.5%,性能平均提升4%.
- 林传文顾乃杰蔡嵩松
- 关键词:JAVA虚拟机CACHE
- 基于龙芯处理器进程级虚拟机的优化
- 龙芯处理器是我国自主研发的高性能通用处理器,它兼容MIPS64指令集和一些专用指令,采用先进的结构设计技术,充分开发指令级并行性,已跻身世界先进通用处理器的行列。龙芯处理器基于MIPS架构,而在当今占据大型的服务器主导地...
- 蔡嵩松
- 关键词:龙芯处理器指令级并行性二进制翻译
- 文献传递
- 精简指令集计算机处理器装置及其数据处理方法
- 本发明公开了一种精简指令集计算机(RISC)处理器装置及其数据处理方法。该装置包括译码器,物理寄存器堆和运算部件,以及译码器,物理寄存器堆和运算部件之间连接的数据通路,所述物理寄存器堆中的每个物理寄存器扩展为72位,整个...
- 蔡嵩松李晓钰
- 文献传递
- 跨平台系统级虚拟机的访存优化
- 跨平台系统级虚拟机软件模拟访存操作效率低,严重影响了虚拟机的性能。为提高跨平台虚拟机访存效率,提出了一种使用宿主系统TLB硬件、加速跨平台系统级虚拟机访存地址转换的软硬件协同优化方法。该方法相对于软件访存模拟方法,有效利...
- 蔡嵩松刘奇沈海华章隆兵