周晓辉
- 作品数:6 被引量:1H指数:1
- 供职机构:西安邮电大学计算机学院更多>>
- 发文基金:陕西省自然科学基金高效能服务器和存储技术国家重点实验室开放基金国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于超多核心平台的Knuth39并行化实现及性能分析
- 2015年
- 针对Knuth39随机数发生器运行速度慢的问题,提出了一种基于超多核心(MIC)平台的Knuth39并行化方法。首先,将Knuth39发生器的随机数序列以固定间隔划分成多个子序列;然后,每个线程从各子序列的起点开始生成随机数;最后,将各个线程生成的随机数序列组合成最终的序列。实验结果表明,并行化后Knuth39通过了Test U01的452项测试,与串行程序相同。同中央处理器(CPU)单线程相比,并行化后MIC平台下的最优加速比可达到15.69倍。所提方法有效地提高了Knuth39发生器的运行速度,并且保证了生成序列的随机性,更加适用于高性能计算领域。
- 张保东周津羽刘逍华诚周晓辉
- 关键词:随机数发生器并行化
- 基于众核平台的CLCG并行化设计与实现
- 2015年
- 针对组合式线性同余产生器,在众核平台上给出一种并行化设计。该设计依据组合式线性同余产生器串行算法原理,将组合式线性同余产生器周期内的随机数序列进行分块产生,每个线程独立产生一段周期内的随机数子序列,从而进行并行化处理。实验结果表明,该设计能够通过TestU01的452项测试,移植到Intel MIC平台后性能良好,产生10 000 000 000个随机数的时间相对CPU单线程的最优加速比为14.61。
- 杨杰宋博文张保东周晓辉
- 关键词:随机数产生器并行化
- 集成众核平台下CombLec88的并行化
- 2016年
- 针对随机数产生器CombLec88相对于传统的线性同余产生器LCG(linear congruential generator)运行速度较慢的情况,在研究CombLec88串行算法的基础上,利用"Simple skip ahead"算法并行化理论,提出一种基于Intel MIC(many integrated core)众核平台的CombLec88并行化方案。割分一个周期内的原始随机数序列,汇总各个线程产生的随机数,产生所需随机序列。实验结果表明,该方案能够通过TestU01的454项测试,与串行程序相同,移植到Intel MIC平台后性能良好,相对CPU单线程的最优加速比为16.004。
- 宋博文张保东周晓辉
- 关键词:随机数产生器并行化
- 基于MIC的GFSR(521,32)并行化设计与实现
- 2015年
- GFSR是一种反馈移位随机数发生器。在研究GFSR(521,32)串行算法的基础上,利用Strided skip ahead方法对其进行并行化。实验结果显示,GFSR(521,32)并行化后TestU01的测试结果与串行的相同。相对于CPU单线程,MIC平台下的最优加速比为7.58。
- 顾小璐周津羽华诚刘逍周晓辉
- 关键词:随机数发生器并行化MIC
- 基于MIC的MRG32k3a并行化设计与实现被引量:1
- 2016年
- 随机数产生器在工程模拟等领域获得广泛应用,MRG32k3a是一种性能优异的随机数产生器,但产生速率较慢。针对这种情况,在研究MRG32k3a串行算法的基础上,利用算法并行化理论,提出一种基于MIC(Many Integrated Core)平台的MRG32k3a并行化方法。实验结果表明,该方法能通过Test U01的全部测试,移植到MIC平台后加速比与线程数呈线性增长关系,相对CPU单线程的最佳加速比为17.73。
- 宋博文周津羽华诚刘逍周晓辉
- 关键词:随机数产生器MIC并行化
- 基于MIC的CLCG4并行化设计与实现
- 2015年
- CLCG4是线性同余随机数发生器中的一种,因其周期长且随机性好被广为应用,但其缺点是产生随机数速度较慢的问题。针对这一问题文中通过CLCG4串行算法,设计实现了其并行化的方法,并对结果进行对比测试,使其速度得到了明显的提升。实验结果显示,并行化后的CLCG4相对于原CLCG4发生器,在MIC平台下的最高加速比达到6.82。
- 李智杰周津羽华诚刘逍周晓辉
- 关键词:随机数发生器并行化MIC