安虹
- 作品数:149 被引量:239H指数:9
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论电子电信天文地球更多>>
- 曙光3000客户端集成环境的研究与开发
- 陈华平安虹陈国良黄刘生郑启龙许胤龙计永昶丁卫群李春生陈志辉李宏陈勇徐云雷云飞朱玉张信明
- 该项目采用分布对象技术,将分散的、相互独立的工具软件集成为完整的使用环境,具有良好的可扩展性和移植性,采用Java语言实现并行工具、教学软件及图形用户界面,不依赖于客户端和并行机的硬件和操作系统平台。改变了传统的使用te...
- 关键词:
- 关键词:超级计算机客户端教学软件
- 程序阶段性分析和阶段检测技术
- 2015年
- 对称多处理器的飞速发展和近年来提出的动态异构处理器(DHMP)为性能优化提供了新的机遇。一个机遇是找出程序每个阶段的性能瓶颈,提出了静态程序阶段分析方法,即通过分析结构参数和计算相似度矩阵来找出程序每个阶段的资源瓶颈;另一个机遇是给出动态异构处理器重构的时间节点,提出了DPDA和HTPD两种动态阶段检测算法,检测出阶段的变化能够为动态可重构处理器提供重构的时间节点。DPDA算法效果很好且软硬件实现代价小,而HTPD算法是目前为止第一个使用统计学方法进行动态检测阶段的算法。实验表明,与BBV相比,DPDA和HTPD能避免BBV离线、动态算法需添加额外硬件、结果与编译器相关等限制,并且阶段划分的稳定性和正确率与BBV相当。DPDA和HTPD算法由于本身不依赖额外硬件,因此都能直接在主流处理器和动态异构处理器(DHMP)中使用。
- 张海博安虹贺松涛孙涛王涛彭毅程亦超
- 基于分布式模拟机制的片上网络硬件模拟系统被引量:1
- 2016年
- 针对基于现场可编程门阵列的DART模拟器可扩展性较差和模拟精度较低的问题,提出一种硬件友好的分布式模拟机制。该机制在模拟中采用隐式同步方法,以节点内计数器和节点间缓冲队列取代集中式控制器,将时序同步和计数任务交给每个节点自行处理,从而提高模拟速度。基于该机制,设计并实现片上网络硬件模拟系统。实验结果表明,该系统能达到与业界权威BookSim模拟器同级别的模拟精度,模拟速度可达BookSim模拟器的200倍,相比DART模拟器能获得21%的速度提升,并且具有较好的扩展性。
- 彭毅安虹金旭程亦超迟孟贤孙荪
- 关键词:片上网络分布式模拟现场可编程门阵列多核处理器
- 一种面向异构融合系统的任务调度方法及装置
- 本发明公开了一种面向异构融合系统的任务调度方法,包括:在接收到调度请求时,获取与所述调度请求中各个任务对应的有向无环图,其中,所述有向无环图中的各个节点与所述各个任务对应;针对所述有向无环图中的每个节点,通过与其存在依赖...
- 安虹林晗李明凡韩文廷林增陈俊仕
- 文献传递
- 基于超块的激进执行模型可预测性分析
- 2010年
- 分析基于超块的激进执行模型中超块级预测可行性,给出满足超块级预测的预测器设计方案。对不同应用深度预测可行性高低、期望预测深度及其影响因素等进行论证。实验结果表明,大部分应用具有较高的期望预测深度,适合激进执行,但不同的应用期望深度相差较大。
- 赵灿明安虹任永青从明
- 串行程序线程级推测执行能力评估方法和评估器
- 本申请公开了串行程序线程级推测执行能力评估方法和评估器,所述方法包括:通过记录串行程序一个执行阶段在执行过程中包括的正确推测的线程的数目,得到该执行阶段的线程推测深度值;确定所述线程推测深度值作为所述执行阶段后续重复执行...
- 安虹任永青孙涛邓春华毛梦捷刘扬
- 文献传递
- 组网雷达估测降水系统并行化方案的设计与实现被引量:5
- 2012年
- 国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
- 吴石磊安虹李小强周伟刘谷魏学超
- 关键词:并行性分析OPENMP
- 流处理器的相变存储器主存性能优化被引量:2
- 2011年
- 将相变存储器(PCRAM)作为流处理器Imagine的主存储器,对其性能进行优化。建立(PCRAM)性能分析模型,针对PCRAM可写次数有限的缺陷,采用避免冗余位写技术,使PCRAM的生命周期延长3.4倍。利用PCRAM的非易失性,避免不必要的缓存行写回。分析访存调度算法对PCRAM性能的影响,结果表明,row/open调度算法性能较优,适合PCRAM使用。
- 郝秀蕊安虹李小强汤旭龙
- 关键词:相变存储器非易失性流处理器
- 一种基于注意力机制的图像处理方法、电子设备及系统
- 本申请公开了一种基于注意力机制的图像处理方法、电子设备及系统,获得待分类图像,将待分类图像输入至预先训练完成的分类模型,分类模型至少能够基于拆分注意力机制对待分类图像的图像特征进行提取,并基于图像特征进行分类,获得分类模...
- 安虹石军易会特赵敏帆阚鸿宇乔良刘强韩文廷
- 文献传递
- 并行分布计算中的任务调度及其分类被引量:19
- 2001年
- 1 并行分布计算中的任务调度问题
并行分布计算中的任务调度问题就是根据一定的调度规则和调度策略,把组成并行程序的一组任务或构成工作负载的一组作业,按照一定执行时序分配到并行分布系统的多个计算结点上,以期取得较好的系统执行性能[1,2].目前许多基于并行分布处理的高性能计算中心的计算环境是由多种并行机或网络工作站机群系统构成的异构多应用系统,并且某些并行机的内部计算结点也可能是异构的(如Paragon系统中有些结点的内存为16M,有些结点的内存为32M;或者有些结点为单CPU,有些结点为双CPU),这时不同的应用层次对任务调度有不同的要求,下面就从作业调度、任务划分与一般任务调度概念的区别出发,讨论并行分布计算中的任务调度问题.
- 陈华平黄刘生安虹陈国良
- 关键词:并行分布计算任务调度CPU计算机