苏俊杰 作品数:12 被引量:30 H指数:4 供职机构: 中国科学技术大学计算机科学与技术学院 更多>> 发文基金: 安徽省自然科学基金 高等学校学科创新引智计划 安徽省教育厅项目 更多>> 相关领域: 自动化与计算机技术 更多>>
适用于虚函数和函数指针的静态函数调用图构建方法 本发明公开了一种适用于虚函数和函数指针的静态函数调用图构建方法,其步骤包括:1获取源程序的中间代码;2获取中间代码中的关键信息,所述关键信息包括基本块顺序队列以及虚函数相关信息;3基于所述关键信息,对所述中间代码进行模拟... 顾乃杰 张帆 苏俊杰文献传递 一种多线程应用场景下的访存指令插桩优化方法 本发明公开了一种多线程应用场景下的访存指令插桩优化方法,是通过基于程序中间代码的静态分析过程从而剔除对涉及非共享内存的访存指令的冗余插桩,该方法具体包括:1、获取中间代码;2、遍历所有模块,函数,基本块及指令;3、获取指... 顾乃杰 刘倩玉 苏俊杰文献传递 基于LXC的Android系统虚拟化技术 被引量:1 2017年 虚拟化技术的研究正逐渐从高性能服务器端转向移动智能设备领域.现有的虚拟化方案多是采用多内核方案,系统负载高,效率低.针对车载系统等平台多屏显示以及资源受限等问题,本文提出一种基于容器技术的Android轻量级虚拟化方案.该方案通过利用Namespace资源隔离机制和Cgroup资源分配机制,使得ARM平台在资源使用较少的同时,能够同时启动多个Android虚拟机,并且各虚拟机上的屏幕显示相互独立.测试结果表明,该方案的内存占用率较双系统方案降低了7%,而平均CPU使用率较原生Android系统仅增加了1%. 谷德贺 顾乃杰 刘博文 刘博文 贺爱香关键词:虚拟化技术 资源分配 ARM平台 虚拟机 移动平台Android操作系统虚拟化技术的实现 被引量:10 2017年 虚拟化技术的研究正逐渐从服务器端转向移动智能设备领域。现有的虚拟化架构需要在物理硬件层和虚拟系统间进行大量的指令翻译,开销大,效率低。针对这一问题,提出了一种轻量级的移动操作系统虚拟化架构。通过在Linux内核命名空间机制的基础上扩展Driver命名空间框架,实现了多个虚拟Android系统的同时运行。此外,针对多个虚拟系统同时访问一套硬件设备发生冲突的问题,设计了通用的active-inactive模型来保证虚拟系统间对硬件设备的隔离复用。实验结果表明,虚拟后的Android系统在CPU使用率上并没有增加额外的开销,在内存使用量上减少了6.7%,此虚拟化架构具有很好的通用性与实用性。 刘博文 顾乃杰 谷德贺 苏俊杰关键词:ANDROID 一种多线程应用场景下的访存指令插桩优化方法 本发明公开了一种多线程应用场景下的访存指令插桩优化方法,是通过基于程序中间代码的静态分析过程从而剔除对涉及非共享内存的访存指令的冗余插桩,该方法具体包括:1、获取中间代码;2、遍历所有模块,函数,基本块及指令;3、获取指... 顾乃杰 刘倩玉 苏俊杰文献传递 Linux调度器免锁优化方法研究 被引量:3 2017年 Linux操作系统被广泛用于各领域,多核环境下Linux调度器依靠自旋锁保证其正确运行,这给调度器带来了严重的锁竞争.在分析Linux调度器的基础上,对其提出三个层次的免锁优化方法:基础优化、调度行为优化和基于上层应用特征的参数调优.基础优化尝试从代码层面直观地缩小程序的锁冲突域;调度行为优化针对进程创建过程中的唤醒操作提出了一种新进程延迟唤醒方法,有效地减少了进程创建过程中的锁竞争;基于上层应用特征的参数调优可以在对内核修改很小的情况下完成调度器性能提升. 张旭 顾乃杰 苏俊杰关键词:LINUX内核 调度器 自旋锁 一种高效通用的TCP尾部丢包恢复算法 被引量:1 2017年 随者互联网时代的到来,如何提升互联网应用的交互性能逐渐成为时下的研究热点;而在当今的互联网环境中,网络带宽已经不是瓶颈,网络时延成为影响应用交互性能的关键因素.作为互联网时代的主要应用,Web应用的网络时延受到TCP尾部丢包现象的严重影响.Tail Loss Probe算法是一种通过发送探针包来触发恢复的高效易部署的TCP尾部丢包恢复算法,但其需要修改现有的TCP加速机制,存在影响互联网稳定性的风险.针对Tail Loss Probe算法存在的不足,提出一种Double Tail Loss Probe算法,该算法对不同的尾部丢包模式进行细化处理且在适当时机下发送两个探针包以加速恢复并实现与现有TCP机制的友好兼容,从而保证互联网数据流通的稳定性.实验表明,在不同的丢包粒度和传播时延下,Double Tail Loss Probe算法都展现出更快的恢复速度;尤其在丢包粒度较大时,相比Tail Loss Probe,该算法取得了约20%的性能提升. 张旭 顾乃杰 谷德贺 刘博文 苏俊杰关键词:TCP 基于ARM SVE的FFT算法向量化研究 被引量:2 2022年 快速傅里叶变换(Fast Fourier Transform,FFT)是信号处理、图像处理等领域的重要研究工具.可伸缩向量扩展(Scalable Vector Extension,SVE)是ARM处理器推出的基于ARMv8-A体系架构的新一代SIMD指令集,支持位宽为128位-2048位的向量寄存器和向量长度无关(Vector Length Agnostic,VLA)编程模型,具有很好的数据并行性和软件可移植性,适用于高性能计算、机器学习等领域.目前基于ARM SVE的FFT算法的研究尚未充分挖掘其架构特性和计算资源,本文针对数据规模为2的幂次的一维复数FFT,结合SVE谓词驱动的循环控制、非线性访存、复数运算等特性对算法做出了改进.实验结果表明,与FFTW库基于NEON的向量化实现相比,本算法性能有明显提升,在向量长度为1024位时,平均性能提升5.83倍,最高性能提升9.22倍. 李凤娇 顾乃杰 齐东升 苏俊杰关键词:软件性能优化 基于多核ARM体系结构的基础函数优化方法 被引量:5 2018年 为充分利用嵌入式多核ARM微处理器体积小、功耗低、成本低、性能高的优点,以此提高程序响应速度,研究ARM体系结构及基于该体系结构基础函数的优化问题。基于ARM Cortex-A72平台,结合ARM v8体系结构特点,对Bionic库中字符串和内存处理函数进行分析。实验结果表明,采用整字处理、循环展开、特殊指令等技术进行程序级优化后,Bionic库中常用基础函数的性能在ARM Cortex-A72平台上均有不同程度的提升。 贺爱香 贺爱香 顾乃杰关键词:体系结构 一种Linux用户态实时多任务调度框架 被引量:4 2017年 Linux内核调度器的调度开销巨大,无法满足实时应用需求.为此设计并实现了基于多核Linux的用户态实时多任务调度框架ULight.ULight共包括三个核心模块:多任务调度模块、定时器模块以及用户态中断处理模块.多任务调度模块在Linux用户态提供基于优先级可抢占的实时多任务调度方案,旨在减少任务调度和切换开销;定时器模块则为多任务调度提供高精度的定时服务,以支持分时调度和任务休眠,并提供更多的抢占点;用户态中断处理模块通过在内核态和用户态之间构造中断处理的快速通道,使用户态任务可以直接处理硬件中断,保证中断处理的实时性和高效性.实验表明,ULight的任务切换效率明显优于Linux的线程切换效率;定时系统可以提供精度为20μs的稳定的定时服务;用户态中断处理模块能够在用户态完成对硬件中断的快速响应. 张旭 顾乃杰 苏俊杰关键词:多任务调度 高精度定时器