侯朋朋
- 作品数:22 被引量:7H指数:2
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金中国科学院知识创新工程重要方向项目中国科学院战略性先导科技专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 针对Linux内核交互接口的检索方法及装置
- 本发明公开了一种针对Linux内核交互接口的检索方法及装置,所述生成方法包括:将Linux内核交互接口目录下包含内核系统信息的文件作为内核状态项,所述内核状态项的描述文本包括:帮助信息H<Sub>i</Sub>和路径信息...
- 潘庆霖侯朋朋于佳耕陈果
- 针对神经网络算子融合的端云协同推理方法及装置
- 本发明公开一种针对神经网络算子融合的端云协同推理方法及装置,所述方法包括将神经网络转换为有向无环图;将所述有向无环图切分为若干链式结构;对每一链式结构中的所述网络层进行融合操作,并使用得到的融合块替代被融合的网络层;依据...
- 姬晨晨于佳耕侯朋朋邰阳苗玉霞佟晓宇张丽敏全雨武延军
- 一种边缘异构场景中的端云协同推理方法和系统
- 本发明公开了一种边缘异构场景中的端云协同推理方法和系统。该方法包括离线和在线的两个阶段。在离线阶段,得到各个节点CPU以及内存占用率与神经网络每层推理时间的逻辑回归函数。在线阶段动态获取CPU与内存使用率,实时更新当前C...
- 姬晨晨于佳耕侯朋朋邰阳苗玉霞佟晓宇张丽敏全雨武延军
- 面向AIoT场景支持RISC-V处理器的操作系统
- 本发明公开了一种面向AIoT场景支持RISC‑V处理器的操作系统,其特征在于,包括支持RISC‑V处理器和轻量级基础C库musl的操作系统引导程序,支持RISC‑V处理器和轻量级基础C库musl的Linux操作系统内核,...
- 程丽敏于佳耕侯朋朋李玲武延军
- 一种面向流水线分布式端云协同推理的深度学习模型划分方法和装置
- 本发明公开了一种面向流水线分布式端云协同推理的深度学习模型划分方法和装置。该方法是一种面向视频帧流推理的机器学习模型分割方法,整个推理过程分为边缘设备推理、数据传输、云端设备推理三个部分,能以流水线的形式在边缘侧与云端分...
- 姬晨晨于佳耕侯朋朋邰阳苗玉霞佟晓宇张丽敏全雨武延军
- 一种分布式自动化软件测试方法及系统
- 本发明公开了一种分布式自动化软件测试方法及系统。本方法为:1)服务器端加载软件测试任务列表和各客户端的配置文件;检查各客户端的状态,建立一客户端状态表;选取具有相同功能的两待测算法A、B;2)各客户端根据算法A进行环境部...
- 侯朋朋于佳耕孙瑞光董博南邹玲杨骁
- 面向AIoT场景支持RISC-V处理器的操作系统
- 本发明公开了一种面向AIoT场景支持RISC‑V处理器的操作系统,其特征在于,包括支持RISC‑V处理器和轻量级基础C库musl的操作系统引导程序,支持RISC‑V处理器和轻量级基础C库musl的Linux操作系统内核,...
- 程丽敏于佳耕侯朋朋李玲武延军
- 基于Kubernetes的RISC-V异构集群云任务调度系统被引量:3
- 2022年
- 随着在云计算领域得到广泛的应用和关注,集群容器编排管理平台Kubernetes已广泛应用于容器化应用服务的自动部署和发布、应用弹性扩展和回滚更新、故障检测和自我修复等服务场景.第5代精简指令集计算机(fifth-generation reduced instruction-set computer, RISC-V)具有精简化、模块化、可扩展和开源4大技术特点和优势,已经得到学术界和工业界的广泛关注.本文立足于Kubernetes生态和RISC-V生态的协同研究点,为Kubernetes调度器提供异构指令集架构(instruction set architecture, ISA)的云服务任务调度支持.本文通过对生产环境中RISC-V指令集架构的各类计算任务需求进行了量化分析,发现现有的集群容器编排平台Kubernetes不具备调度RISC-V指令集架构的计算任务的能力,尤其是其调度算法无法利用RISC-V用户自定义的可扩展指令集架构特性提供高性能的可靠服务.为解决上述问题,本文提出了一种创建时调度的ISAMatch模型,综合考虑指令集亲和性、同种指令集架构节点数量和节点资源利用率等多个方面,实现任务的最佳分配.本文以现有的集群调度器为基础,完善其针对多种指令集架构任务的调度需求,相对比默认调度器正确率62%(调度RISC-V基础指令集任务)、41%(调度RISC-V扩展指令集任务)、67%(调度RISC-V扩展指令集任务且有“RISC-V”节点匹配标签),在不考虑资源限制的条件下, ISAMatch模型可以达到100%的任务调度正确率.
- 蒋筱斌熊轶翔张珩侯朋朋武延军赵琛
- 面向GPU平台的复杂网络core分解方法研究被引量:2
- 2020年
- 在复杂网络理论中,core分解是一种最基本的度量网络节点“重要性”并分析核心子图的方法.Core分解广泛应用于社交网络的用户行为分析、复杂网络的可视化、大型软件的代码静态分析等应用.随着复杂网络的图数据规模和复杂性的增大,现有研究工作基于多核CPU环境设计core分解并行算法,由于CPU核数和内存带宽的局限性,已经无法满足大数据量的高性能计算需求,严重影响了复杂网络的分析应用.通用GPU提供了1万以上线程数的高并行计算能力和高于100GB/s访存带宽,已被广泛应用于大规模图数据的高效并行分析,如广度优先遍历和最短路径算法等.为了实现更为高效的core分解,提出面向GPU平台下的复杂网络core分解的两种并行策略.第1种RLCore策略基于图遍历思想,利用GPU高并发计算能力对网络图结构自底向上遍历,逐步迭代设置各节点所属的core层;第2种ESCore策略基于局部收敛思想,对各节点从邻居节点当前值进行汇聚计算更新直至收敛.ESCore相比RLCore能够大大降低遍历过程中GPU线程更新同一节点的同步操作开销,而其算法的迭代次数受收敛率的影响.在真实网络图数据上的实验结果表明,所提出的两个策略在效率和扩展性方面能够大幅优于现有其他方法,相比单线程上的算法高达33.6倍性能提升,且遍历边的吞吐性能(TEPS)达到406万条/s,单轮迭代的ESCore的执行效率高于RLCore.
- 张珩崔强侯朋朋武延军赵琛
- 关键词:复杂网络GPU
- 一种面向AI芯片平台的分布式自动化软件测试方法及平台
- 本发明公开了一种面向AI芯片平台的分布式自动化软件测试方法及平台。该平台可以通过服务器将AI软件测试任务自动化的分发给不同的AI芯片平台客户端计算机去运行,测试完成后将测试结果统一到服务器管理,然后根据需求自动发布环境更...
- 于佳耕侯朋朋卢欣晔汲如意苏航
- 文献传递