翟季冬
- 作品数:68 被引量:39H指数:4
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国防基础科研计划更多>>
- 相关领域:自动化与计算机技术自然科学总论理学文化科学更多>>
- 性能故障诊断的方法及计算机设备
- 本发明实施例涉及计算机技术领域,尤其涉及一种性能故障诊断的方法及计算机设备。所述方法包括:获取目标程序对应的至少两个程序切片,于所述各个程序切片,获取所述各个程序切片对应的第一性能信息,于所述各个程序切片对应的所述第一性...
- 郑立言翟季冬陈文光
- 文献传递
- 性能分析编程框架、方法和装置
- 本发明实施例提供了一种性能分析编程框架、方法和装置,所述方法包括:根据从待测程序中提取出的应用数据,构建程序抽象图;根据用户定义的性能分析数据流图,基于程序抽象图进行性能分析,得到性能分析报告,性能分析数据流图是根据用户...
- 翟季冬金煜阳钟闰鑫王豪杰
- 文献传递
- 存储系统基准评测程序生成方法及装置
- 提供了存储系统基准评测程序生成方法和装置,属于高性能计算性能评测领域。存储系统基准评测程序生成方法包括:从规范化后的源程序获得中间代码;识别中间代码中的切片起点;基于识别得到的切片起点进行静态程序切片;以及基于得到的各个...
- 翟季冬刘明亮陈文光
- 文献传递
- 基于CUPTI接口的GPU程序负载特征分析
- GPU加速设备的高性能计算机已经成为目前高性能计算领域一个重要发展趋势.然而,在当前的GPU设备上开发高效的并行程序仍然是一件非常复杂的事情.针对这一问题,本文首先总结了影响GPU程序性能的几个关键性能指标.然后,采用N...
- 郑祯翟季冬李焱陈文光
- 关键词:高性能计算机图形处理器
- 桌面文本搜索系统性能分析与并行实现
- 本文分析了桌面文本搜索应用的指令级特征,发现该应用具有内存带宽利用率低、CPI值相对比较高、分支预测失效率高的特点,并设计了基于倒排索引技术和向量空间模型的并行桌面搜索系统,取得了较好的加速比。研究结果表明,桌面文本搜索...
- 翟季冬栗强刁倩陈文光张益民郑纬民
- 关键词:向量空间模型倒排索引
- 文献传递
- 一种大规模并行程序性能预测实现方法
- 本发明公开了一种基于有代表性重放的大规模并行程序性能预测实现方法,该方法属于并行程序性能预测的技术领域,包括步骤:收集并行程序的通信序列和顺序计算向量,分析各个进程计算的相似性并选取有代表性的进程,记录有代表性进程的通信...
- 郑纬民陈文光翟季冬
- 文献传递
- 高效训练百万亿参数预训练模型的系统挑战和对策被引量:5
- 2022年
- 随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练模型中遇到的几个关键系统挑战:如何选取高效并行策略,如何进行高效数据存储,如何选取合适的数据精度,以及如何实现动态负载均衡,并总结了针对上述挑战的一些解决方法。
- 马子轩翟季冬韩文弢陈文光郑纬民
- 关键词:人工智能超级计算机异构系统
- 围炉对谈:性能优化的个性与共性
- 2024年
- 2022年12月12日,第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid(会议网址:http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次,面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战,围绕高性能计算中间件关键技术,邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以“适配新型体系结构的性能优化技术”为主题,聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战,探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持,邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕“性能优化:个性vs共性”这一主题开展了深入的讨论与交流,翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表,以飨读者。限于篇幅,略有删节。
- 莫则尧王龙刘杰谭光明刘伟峰喻之斌翟季冬杨海龙徐小文黄烁刘洁
- 关键词:超级计算机体系结构中间件技术专家座谈
- 混合网络系统、通信方法和网络节点
- 提供了混合网络系统、通信方法和网络节点。混合网络系统包括点对点网络和广播网络的组合网络体系架构,点对点网络具有多个点对点信道,每个网络节点能够经由点对点信道将消息发送到对应的网络节点或者从对应的网络节点接收消息;广播网络...
- 郑纬民陈文光薛巍翟季冬陈康
- 文献传递
- 一种数据处理方法、装置及存储介质
- 本公开涉及一种数据处理方法、装置及存储介质,其中,该方法可以包括获取深度学习模型中的待处理数据组;确定与待处理数据组中各待处理数据相匹配的模拟方式,模拟方式用于基于不同于待处理数据的数据类型的其他数据类型,表示待处理数据...
- 翟季冬马子轩王豪杰冯冠宇张晨