您的位置: 专家智库 > >

吴利

作品数:15 被引量:12H指数:2
供职机构:青海大学更多>>
发文基金:国家自然科学基金青海省自然科学基金青海省科技厅应用基础研究项目更多>>
相关领域:自动化与计算机技术文化科学理学农业科学更多>>

文献类型

  • 8篇期刊文章
  • 5篇专利

领域

  • 11篇自动化与计算...
  • 1篇文化科学
  • 1篇理学

主题

  • 4篇矩阵
  • 3篇站点
  • 3篇GPU
  • 2篇异构
  • 2篇气象
  • 2篇卷积
  • 2篇架构
  • 2篇多站点
  • 2篇风速
  • 2篇风速预测
  • 2篇存储介质
  • 1篇单指令多数据
  • 1篇电子设备
  • 1篇序列数据
  • 1篇掩码
  • 1篇异构平台
  • 1篇阴影检测算法
  • 1篇硬件
  • 1篇硬件参数
  • 1篇硬件架构

机构

  • 13篇青海大学
  • 1篇清华大学
  • 1篇青海省气象台

作者

  • 13篇吴利
  • 11篇王晓英
  • 8篇黄建强
  • 4篇曹腾飞
  • 1篇王瑞
  • 1篇管琴
  • 1篇郭文静
  • 1篇孟永伟

传媒

  • 2篇电子技术应用
  • 2篇计算机应用
  • 1篇计算机工程
  • 1篇实验室研究与...
  • 1篇郑州大学学报...
  • 1篇计算机技术与...

年份

  • 3篇2024
  • 6篇2023
  • 2篇2022
  • 1篇2016
  • 1篇2014
15 条 记 录,以下是 1-10
排序方式:
一种多站点风速预测方法
本发明公开了一种多站点风速预测方法,方法包括:对各个气象监测站采集的气象数据进行数据预处理;将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;将所述时空数...
李博录吴利王晓英
基于CPU与GPU的异构模板计算优化研究被引量:2
2023年
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。
李博黄东强贾金芳吴利王晓英黄建强
关键词:消息传递接口单指令多数据统一计算设备架构
基于CPU+GPU异构并行的广义共轭余差算法性能优化被引量:2
2022年
为了提高GRAPES数值天气预报模式的计算效率,改善动力框架部分的性能,针对广义共轭余差算法(GCR)求解赫姆霍兹方程在GRAPES模式中耗时较大的问题,提出了一种基于CPU+GPU异构并行的预处理广义共轭余差算法。采用不完全LU分解对系数矩阵进行预处理来减少迭代次数,在此基础上实现了OpenMP的细粒度并行和MPI粗粒度并行,OpenMP并行主要是采用循环展开的方式对程序中无数据依赖的循环体使用编译制导来提高程序的性能;MPI并行主要是将数据划分给各个进程,采用非阻塞通信和优化进程通信数据量的方式来提高并行程序的可拓展性。实现了MPI+CUDA异构并行,MPI负责节点间进程通信以及迭代控制,CUDA负责处理计算密集型任务,将GCR中耗时较大的矩阵计算部分移植到GPU上处理,采用访存优化和数据传输优化来减少CPU和GPU间的数据传输开销。实验结果表明:与串行程序相比,OpenMP并行加速比为2.24,MPI并行加速比为3.32,MPI+CUDA异构并行加速比为4.69,实现了异构平台上的广义共轭余差算法性能优化,提高了程序的计算效率。
黄东强黄建强贾金芳吴利刘令斌王晓英
关键词:GRAPESGPU
基于GPU的稀疏深度神经网络性能优化
2023年
随着神经网络层数不断加深,稀疏深度神经网络在计算与存储空间上更具优势,但稀疏深度神经网络的性能仍然有待优化。为此提出基于GPU的稀疏深度神经网络性能优化方法,对于计算顺序进行调整,增强数据重用性,并结合GPU的独特结构与CUDA编程方法,通过预取等方法进一步提升性能。基于GraphChallenge官方提供的数据集,相较于cuSPARSE相关库函数,最高获得了2.5倍的性能加速。
石于诚黄建强边浩东吴利贾金芳王晓英
关键词:稀疏化异构平台
基于图动态注意力网络的多站点风速预测被引量:1
2023年
时空序列预测任务在交通、气象、智慧城市等领域有着广泛应用。站点风速预测作为气象预测中的主要任务之一,需要结合降水、气温等外部因素,学习不同数据的时空特征。气象站点的不规则分布和风本身的固有间歇性成为实现高精度风速预测的挑战。为考虑多站点空间分布对风速的影响以获得准确可靠的预测结果,提出一种基于图的动态转换注意力网络(Graph-DSAN)风速预测模型。首先,利用不同站点之间的距离重新构建它们的连接;其次,使用局部采样的过程建模不同采样大小的邻接矩阵,实现图卷积过程中邻居节点信息的聚合与传递;接着,将时空位置编码(STPE)处理后的图卷积结果加入动态注意力编码器(DAE)和转换注意力解码器(SAD)以实现动态注意力计算,从而提取时空相关性;最后,利用自回归的方式形成多步预测。在纽约州15个站点的风速预测实验中,将所设计模型与ConvLSTM、图多注意力网络(GMAN)、时空图卷积网络(STGCN)、动态转换注意力网络(DSAN)和时空动态网络(STDN)进行比较,Graph-DSAN的12 h预测均方根误差(RMSE)分别降低了28.2%、6.9%、27.7%、14.4%和8.9%,验证了Graph-DSAN风速预测的准确性。
李博录吴利王晓英黄建强曹腾飞
关键词:风速预测
深度学习在天气预报领域的应用分析及研究进展综述被引量:2
2023年
随着传感器网络和全球定位系统等技术的进步,兼有时间与空间特性的气象数据体量呈爆炸式增长,针对时空序列预测(STSF)的深度学习模型研究得到了迅猛发展。然而,长期以来用于天气预报的传统机器学习方法在提取数据的时间相关性与空间依赖性方面的效果往往并不理想。与此同时,深度学习方法通过人工神经网络自动提取特征,可以有效提高天气预报的准确度,并且在编码长期空间信息的建模方面有相当优秀的效果。同时,由观测数据驱动的深度学习模型与基于物理理论的数值天气预报(NWP)模型结合的方式可以构建拥有更高预测精度与更长预报时间的混合模型。基于这些,将深度学习在天气预报领域的应用分析及研究进展进行了综述。首先,将天气预报领域的深度学习问题与经典深度学习问题从数据格式、问题模型与评价指标这3个方面进行了对比研究;然后,回顾了深度学习在天气预报领域的发展历程与应用现状,并总结分析了深度学习技术与NWP结合的最新进展;最后,展望了未来的发展方向和研究重点,为天气预报领域的深度学习研究提供参考。
董润婷吴利王晓英曹腾飞黄建强管琴吴洁瑕
关键词:数值天气预报
基于矩阵嵌套的CESM负载均衡优化方案检索策略
2022年
通用地球系统模式(Community Earth System Model,CESM)是一种定量描述气候系统模式变化的数值模式,庞大的科学计算体量已使其成为高性能计算领域的重要研究对象之一。CESM各个气象子模块及组件之间的负载不均衡问题使其计算性能一直不理想,且由于其可用的进程布局方案本身的多样性会导致的巨大检索量,因此通过人工调参用枚举寻找最优布局本身并不现实。为解决这个问题,提出并实践了一种基于矩阵嵌套思想的负载平衡优化方案检索策略帮助完成进程布局优化过程,并介入基于模式并行要求的筛查保证检索结果具有可行性,最终通过实验证明通过这种检索策略搜索获得的最优布局与默认布局相比平均计算性能提升达到47.3%,并在5个节点上实现了1.419的加速比。
董润婷吴利黄建强王晓英
关键词:负载均衡
GPU稀疏矩阵向量乘的快速求解方法及装置
本发明涉及计算机信息技术领域,尤其涉及一种GPU稀疏矩阵向量乘的快速求解方法及装置。方法包括:提取待求解的稀疏矩阵数据的数据特征,并获取对应的GPU平台的硬件参数特征;根据数据特征和硬件参数特征基于预先构建的自动调优模型...
黄建强姜佳凡张国晶边浩东曹腾飞贾金芳吴利
一种降水预测方法、系统、存储介质及电子设备
本发明涉及信息技术和气象技术领域,公开了一种降水预测方法、系统、存储介质及电子设备。方法包括:通过3D卷积编码将获取的卫星红外数据和ERA5再分析数据进行时空对齐和数据序列化;基于深度学习模型的全局局部联合时空注意力机制...
李金雯吴利王晓英薛巍
基于SpMV计算的网页管理方法、系统、介质及设备
本发明属于计算机处理领域,尤其涉及基于SpMV计算的网页管理方法、系统、介质及设备。本发明的主要目的是提高并行SpMV在幂律分布较大的不规则矩阵上的计算效率。本文基于ELL格式设计了一种BEC存储格式。根据平均每行非零元...
黄建强黄东强王晓英贾金芳吴利张国晶唐嘉豪刘令斌
共2页<12>
聚类工具0