基于业务观测、历史灾情及互联网媒体等多源数据整编形成强对流天气人工智能应用训练基础数据集(Severe Convective Weather DataSet for AI application,SCWDS)。SCWDS包括2012—2019年中国大陆区域的雷暴、雷暴大风、短时强降水、冰雹及龙卷5种强对流天气,共184865个个例(站次),9256405个样本,每个样本包含强对流天气过程标注及对应时空窗口范围内的地面观测数据、探空数据、闪电定位数据、雷达基数据、卫星多通道数据和再分析产品等。雷暴、短时强降水、冰雹主要出现在6—8月,雷暴大风主要出现在4—5月,龙卷主要出现在6—8月和4月。短时强降水发生时间呈03:00—04:00(北京时,下同)和15:00—16:00时段双峰分布,雷暴、雷暴大风、冰雹、龙卷主要发生在13:00—19:00时段。雷暴主要出现在华南、江南及青藏高原、云贵高原,雷暴大风主要出现在华北北部及江南沿海,短时强降水主要出现在西南、华南、江南及黄淮江淮地区,冰雹主要出现在青藏高原、云贵高原及华北北部。SCWDS作为机器学习模型训练的基础数据,为强对流天气智能识别和预报应用提供数据支撑。
ECMWF和GRAPES(Global/Regional Assimilation and Prediction System)预报产品是国内目前主要的应用服务产品。为了了解ECMWF和GRAPES预报产品的性能,使用户在实际应用中,根据需求可选择性地应用上述预报产品,本文利用中国气象局2421个国家级自动站和8155个地面天气站(骨干站)逐时观测资料对2017年7月和11月、2018年1月和4月的ECMWF确定性预报模式(C1D)和我国研发的区域数值预报模式GRAPES_MESO、全球数值预报模式GRAPES_GFS的气温、地表温度、湿度、风速预报资料在中国区域的适用性进行了评估。结果表明:与各观测要素实况相比,3个模式均存在系统误差。地表温度预报易低估、风速预报易高估;3个模式预报能力普遍存在明显的区域差异、季节差异和昼夜变化。青藏地区3个模式预报能力明显低于其他地区。3个模式气温、风速的预报能力春季最差,湿度预报能力夏季最优,地表温度白天的预报能力秋冬季低于春夏季。GRAPES_MESO模式气温、风速的预报能力没有明显的昼夜变化;在分析的所有气象要素中,3个模式均为湿度的预报准确率最低,GRAPES_MESO模式的地表温度预报准确率最高,GRAPES_GFS模式和C1D模式风速预报准确率最高。
基于中国气象局气象业务观测站、青藏高原大气科学试验站及中国科学院野外试验站多源辐射观测数据,经过质量控制和拼接整合,形成1993年以来青藏高原多源气象辐射基本要素逐小时曝辐量整合数据集(Integrated of Multi-source Radiation Data over Qinghai-Tibet Plateau,IRDQTP)。各辐射要素实有率均超过99.4%,光合有效辐射正确率低于76%,其他辐射要素正确率超过96.7%。相同或相近观测站址的大气科学或野外试验站(试验站)与气象业务观测站(业务站)向下短波辐射R>0.88,阿里相同站址两种来源数据对比Mbias(RMSE)为-0.006(0.141)MJ·m^(-2)·h^(-1),99.8%的偏差分布在±1.0 MJ·m^(-2)·h^(-1),那曲相近站址两种来源数据对比Mbias(RMSE)为-0.028(0.615)MJ·m^(-2)·h^(-1),84.6%的偏差分布在±1.0 MJ·m^(-2)·h^(-1)。试验站和业务站数据差异呈现明显的季节变化和日变化规律,秋冬季节较小,夏季较大,日出时段(日落时段)随着向下短波辐射强度快速升高(快速降低),差异逐渐变大,当向下短波辐射变化率达到最大时,差异也达到最大。向下短波辐射和净全辐射分布具有明显的日变化特征,春秋季节向下短波辐射、净全辐射均在12:00(地方时,下同)达到最大,夏季和冬季在13:00达到最大。受气候条件和地形因素影响,向下短波辐射和净全辐射分布具有明显的空间变化特征,向下短波辐射自西向东呈现逐渐减少的分布形态,净全辐射自西向东呈现“低-高-低”的分布形态。