深度学习在数字智能天气预报中的应用

论文

引用本文 [复制中英文]

代刊, 杨绚, 周康辉, 等, 2025. 深度学习在数字智能天气预报中的应用[J]. 气象, 51(11): 1477-1494. DOI: 10.7519/j.issn.1000-0526.2025.110701.

DAI Kan, YANG Xuan, ZHOU Kanghui, et al, 2025. Application of Deep Learning in Digital Intelligent Weather Forecasting[J]. Meteorological Monthly, 51(11): 1477-1494. DOI: 10.7519/j.issn.1000-0526.2025.110701.

[复制英文]

资助项目

国家自然科学基金联合基金项目(U2342217)、中国气象局重点创新团队智能预报技术团队项目(CMA2022ZD04)共同资助

第一作者

代刊, 主要从事智能预报技术、统计后处理技术研究.E-mail: daikan@cma.gov.cn。

文章历史

2025年10月8日收稿
2025年11月12日收修定稿

Contents Abstract Full text Figures/Tables PDF

深度学习在数字智能天气预报中的应用

代刊 , 杨绚 , 周康辉 , 徐珺 , 宫宇 , 钱奇峰 , 盛杰 , 张小雯

国家气象中心, 北京 100081

2025年10月8日收稿；2025年11月12日收修定稿

资助项目：国家自然科学基金联合基金项目(U2342217)、中国气象局重点创新团队智能预报技术团队项目(CMA2022ZD04)共同资助

第一作者：代刊, 主要从事智能预报技术、统计后处理技术研究.E-mail: daikan@cma.gov.cn

摘要：近年来, 数字智能天气预报业务快速发展, 其传统技术方法在非线性误差订正、时空降尺度、多源数据融合等方面存在局限。深度学习技术凭借非线性拟合和模式识别能力逐步被引入数字智能预报流程。本文阐述了深度学习技术在数值模式偏差订正、高分辨率降尺度、多源异构数据融合、灾害性天气预报(以台风为例)和数据驱动天气预报五个方面的代表性技术成果。研究表明: 深度学习模型可显著提高预报精度, 包括学习预报与观测之间复杂的非线性关系以校正系统偏差, 利用生成对抗网络细化降水结构以提升强降水预报技巧, 融合雷达、卫星和模式数据以延长强对流临近预报时效, 以及构建数据驱动模型实现以秒级速度产生与数值模式相当精度的预报。例如, “风雷”模型示范了生成式方法在强对流短时临近预报中的优势(对≥50 dBz回波命中率提高约30%), “风清”模型实现了15 d全球预报业务准入和应用。深度学习的引入正推动智能预报产品在时空分辨率、不确定度定量化等方面取得进展。与此同时, 文章也指出当前深度学习应用在样本体量、可解释性、极端事件预报、跨尺度一致性和计算成本等方面仍面临挑战, 在未来研究中需要予以关注和改进。展望未来, 应加强大样本/再预报资料建设, 融合物理先验约束以提高模型可解释性与稳定性, 针对极端天气引入尾部加权训练等技术以增强预报可靠度, 设计跨尺度协同的模型框架以确保不同时间和空间尺度预报的一致性, 并优化模型训练和推理的效率以满足业务时效要求。深度学习与数值模式的有机结合、优势互补, 将成为推动数字智能预报进一步发展的重要方向。

关键词：深度学习数字智能预报偏差订正降尺度多源数据融合台风预报数据驱动预报

Application of Deep Learning in Digital Intelligent Weather Forecasting

DAI Kan, YANG Xuan, ZHOU Kanghui, XU Jun, GONG Yu, QIAN Qifeng, SHENG Jie, ZHANG Xiaowen

National Meteorological Centre, Beijing 100081

Abstract: Digital intelligent weather forecasting has grown rapidly in global meteorological operations in recent years, yet conventional methods face inherent limitations in nonlinear error correction, spatial and temporal downscaling, and multi-source data integration. Deep learning, with its exceptional nonlinear approximation and pattern recognition capabilities, has emerged as a transformative tool in digital intelligent forecasting workflows. This paper presents representative advances and achievements of deep learning in five key areas: numerical weather prediction (NWP) bias correction, high-resolution downscaling, heterogeneous multi-source data fusion, hazardous weather prediction (exemplified by typhoons), and data-driven weather forecasting. The results show that deep learning models can substantially enhance forecast accuracy by learning complex forecast-observation relationships end-to-end to correct systematic biases, employing generative adversarial networks to refine precipitation structures and improve heavy rainfall prediction skill, integrating radar, satellite, and model data to extend severe convective weather nowcasting lead times, and developing data-driven models that generate forecasts in seconds with accuracy comparable to numerical models. Notably, the Fenglei model demonstrates the superiority of generative approaches in convective nowcasting (achieving about 30% improvement in hit rate for radar reflectivity ≥50 dBz), while the Fengqing model has been operationally implemented for 15 d global forecasting. Deep learning integration has been advancing intelligent forecast products in spatial and temporal resolution and uncertainty quantification. However, its current applications have persistent challenges including limited training samples, model interpretability, extreme event prediction, cross-scale consistency, and computational efficiency, all of which require further investigation in future's researches. The research priorities in the future should be put on the following aspects: expand large-sample and reforecast datasets; incorporate physical constraints to enhance model interpretability and robustness; implement tail-weighted loss functions to improve the reliability of extreme weather forecasts; design cross-scale coherent frameworks to ensure consistency across scales; and optimize training and inference efficiency for operational requirements. The synergistic integration of deep learning and numerical modeling, with their complementary strengths, represents a pivotal pathway for advancing intelligent numerical weather prediction.

Key words: deep learning digital intelligent forecasting bias correction downscaling multi-source data integration typhoon forecasting data-driven forecasting

引言

近年来，卫星、雷达与地面站网等气象观测手段不断完善，同时多中心、多尺度与集合数值模式业务化快速迭代，使预报业务可获得覆盖多时空尺度的海量气象数据信息。与之对应，社会公众、防灾减灾、能源交通、重大活动等应用场景，对分钟到月尺度, 从局地到区域乃至全球的一体化数字化预报提出了更高的时空分辨率, 一致性与不确定性表征等要求。传统预报业务链条中，数值模式原始结果与用户可直接使用的数字预报产品之间存在着“最后一公里”的质量与形态差距。数字智能预报(以统计后处理为核心)正是面向该差距的重要一环，即通过对多源模式与观测信息进行偏差订正、时间插值、空间降尺度、多源信息集成、不确定性定量化及灾害性天气信息提取等综合处理，形成统一、完整、高精度的数字化预报产品，从而在预报制作与应用需求之间建立稳定的桥梁(Craven et al, 2020；Roberts et al, 2023；Vannitsem et al, 2021)。

国际上，已有多个国家气象部门形成系统化的数字智能预报业务框架。例如，美国NBM(National Blend of Models)以多模式融合与统计订正为主线(Hamill et al, 2017；Hamill and Scheuerer, 2018；Craven et al, 2020)；英国IMPROVER(Integrated Model Post-Processing and VERification)构建了模块化的概率后处理流程(Roberts et al, 2023；Gneiting et al, 2005)；澳大利亚ADFD (Australian Digital Forecast Database)和奥地利SAPHIR (Seamless Probabilistic Analysis and Prediction in High Resolution)(Bridge, 2015; Dabernig et al, 2017；2020)则分别侧重于客观共识预报和高分辨率概率产品的生成。这些体系共同推动了预报产品向高精度、概率化和无缝隙方向发展。我国自2014年起系统推进无缝隙精细化网格预报技术研发与业务建设，形成了覆盖多尺度与多要素的智能化指导产品体系，为后续以统计后处理为核心的数字智能预报体系奠定了基础(金荣花等，2019)。总体看，业务主流统计后处理技术包括传统模式输出统计订正(MOS)(Glahn and Lowry, 1972)、集合订正(Gneiting et al, 2005)、Kalman滤波时变订正(Homleid, 1995)与分布映射/频率匹配等方法(Cannon et al, 2015；Hamill and Scheuerer, 2018)。这些方法在大样本跨域泛化、强非线性误差订正、千米级空间降尺度与多源异构资料协同等方面仍面临能力与效率的局限(Vannitsem et al, 2021；Schulz and Lerch, 2022；杨绚等，2022)。

在此背景下，深度学习技术被逐步引入统计后处理与智能网格预报流程。其优势主要体现在：一是能够学习预报与观测之间的非线性映射，例如采用分布回归或分位回归方式直接学习，从而改进概率刻画与极端尾部校准(Rasp and Lerch, 2018；Hess and Boers, 2022)；二是利用卷积与生成式模型实现从粗分辨率到细分辨率的空间超分辨率/降尺度，增强地形与下垫面强约束区域的空间细节还原(Vandal et al, 2017；Stengel et al, 2020；Leinonen et al, 2021；Price and Rasp, 2022)；三是融合多源雷达/卫星/站网资料与模式引导，提升灾害性天气的识别与短时临近概率预报能力(Sønderby et al, 2020；Espeholt et al, 2022；Geng et al, 2021；Liu et al, 2024；周康辉等，2021)；四是引入数据直接驱动预报框架，如近年来以图网络与三维卷积为代表的数据驱动中长期预报模型显示出与传统数值天气预报(NWP)竞争的基线能力，为模式、后处理、融合的新型协同流程提供了新的基础条件(Pathak et al, 2022；Bi et al, 2023；Chen et al, 2023a；Lam et al, 2023；Lang et al, 2024)。国内已有研究系统综述梳理了深度学习在智能网格预报中的应用进展、关键问题与评估基准(杨绚等，2022；代刊等，2018)，为业务化引入提供了参考。

2024年我国国家气象中心发布的“智能数字天气预报系统V2.0”在原有基础上进行了升级，全球产品空间分辨率由10 km提升至5 km、中国区域产品分辨率由5 km提升至1 km，时间分辨率方面实现3小时内逐10分钟更新、36小时内逐1小时更新，构建了0~15 d新一代无缝隙智能数字预报指导产品体系(金荣花等，2025)。这一系统既是传统统计后处理的延伸，又为深度学习技术提供了更大的发挥空间。本文将以数字智能预报业务的实际需求为导向，重点讨论深度学习技术在五个方面的代表性实践与问题：(1)数值模式预报偏差的订正，(2)从中或粗分辨率到1 km级的空间降尺度，(3)多源异构气象数据的联合表征与融合，(4)灾害性天气监测、预报、预警中的信息智能提取，(5)数据驱动的天气预报模型带来的新途径。文末将围绕样本体量与再预报构建、可解释性与物理一致性约束、极端事件与分布尾部的稳健性、跨时空尺度的一致性与计算成本等核心挑战提出讨论。

1 数值模式预报的偏差订正应用

数值天气预报的预报误差具有明显的系统性与随机性，其根源可归结为三类：一是初始场的不确定性，受限于观测误差、资料稀疏与分析同化方法，导致对真实大气状态的刻画偏离；二是模式本身的表述误差，包括有限网格分辨率引起的离散化误差与次网格物理过程(对流、湍流、边界层、云微物理等)参数化的不完备与不稳定；三是外边界与下垫面强迫(海温、土壤湿度、植被与地形等) 的系统偏差与时变漂移。这些因素叠加，使模式直接输出在多时效、跨区域上呈现稳定的、随机的偏差形态，不经统计后处理将直接削弱绝对量的可用性与极端事件的可检出性(Vannitsem et al, 2021；Schulz and Lerch, 2022；朱跃建等，2025)。因此，面向业务的客观偏差订正不仅是“最后一公里”的技术环节，更是保证无缝一体化数字预报稳定性的必要条件(Craven et al, 2020；Roberts et al, 2023)。

深度学习为偏差订正提供了有别于传统线性统计和经验方法的新路径。首先，深度学习可学习预报与观测之间的非线性映射，突破线性回归、集合订正等方法对分布形态与连接函数的假设(Rasp and Lerch, 2018；Han et al，2021)。其次，卷积神经网络、Transformer和图神经网络等网络结构能够显式利用空间邻近性和跨变量耦合信息，输出空间连贯、物理一致的订正场，避免逐点订正导致的碎片化与失相干(Ronneberger et al, 2015；Bouallègue et al, 2024；Wu et al, 2024)。第三，深度学习天然适配多源高维输入，可同时摄取格点预报、地形静态因子、再分析场以及卫星/雷达导出量等，在高维特征空间中自动提取最能解释偏差的表征；配合迁移或在线学习，可随模式升级或气候态缓变自适应更新偏差模型(Schulz and Lerch, 2022；Yang et al，2023)。最后，训练完成后的深度学习模型推理成本低、吞吐量高，可在大范围、短更新周期下稳定运行，满足业务时效要求(Pathak et al, 2022；Bi et al, 2023)。这些优势表明，深度学习是将非线性、时空一致、多源融合、高效推理统一到一个偏差订正框架的有力手段。

近年的代表性研究在多种神经网络范式中验证了上述观点，这些研究往往基于特定业务目标选择合适的网络结构。以卷积神经网络(CNN)为例，其核心优势在于通过卷积核有效捕捉数据的空间局部相关性，这使其特别适用于订正具有空间连续性的气象场。Han et al(2021)采用U-Net结构对ECMWF多要素场进行“图像到图像”式订正，系统降低了温度、湿度和10 m风的均方根误差(RMSE)和平均绝对误差(MAE)，并显著改进传统方法难以处理的风向偏差，显示CNN能从邻域与多变量耦合中学习非线性误差模式。针对极端降水订正这一目标，Hess and Boers(2022)通过对损失函数的尾部加权，使24 h暴雨量级分布与观测更一致，极端事件的预报技巧得到实质提升，体现出“面向业务目标的损失定制”对尾部分布校准的关键作用。在Transformer方面，其自注意力机制擅长建模长距离依赖关系，因此被用于处理大范围、全局性的集合预报校正问题。Bouallègue et al(2024)提出层次化集合Transformer(PoET)，对集合成员逐一纠偏，同时保持成员间的空间相关性，使全球2 m气温的连续分级概率评分(CRPS)显著提升，为概率校正提供了新途径。在图神经网络(GNN)方面，其优势在于能灵活处理不规则的站点数据和复杂的地理邻接关系，这使其在地形影响显著的区域表现突出。Wu et al(2024)通过因子GNN与分层空间GNN自适应建模局地多要素相关和动态空间依赖，在真实数据集中相对最佳基线风速RMSE平均降低约4.8%，证明在不规则邻接和地形复杂区域背景下，图结构对于学习误差偏差模式的有效性。综合而言，深度学习模型凭借目标导向的网络结构设计与损失函数定制，兼顾总体误差收敛与尾部校准，正在将确定性偏差订正与概率可靠性逐步统一(Rasp and Lerch, 2018；Hess and Boers, 2022；Bouallègue et al, 2024)。

在国家级智能数字预报业务实践中，Yang et al(2023)构建了基于U-Net的10 m阵风偏差订正模型，并提出包含漏报率(MR)约束的MAE_MR损失函数，缓解因强风样本稀缺、误差分布偏态所导致的欠校正或负校正难点。与ECMWF-HRES原始预报相比，引入MR约束的U-Net模型在24~168 h各预报时效上的风速MAE平均降低了22.8%；在≥6级大风情形下预报准确率提升了6.4%，即使在5~6级风速区间仍保持显著增益，明显优于采用传统损失函数(如MAE、均方误差MSE、加权平均绝对误差WMAE)的同构神经网络和随机森林、卡尔曼滤波等方法(杨绚等，2022；孙全德等，2019；Homleid, 1995)。验证结果显示(图 1)，融合MR指标约束后，模型的空报率和漏报率组合最优：引入具有明确业务意义的诊断量MR，能够“拉升”强风段的订正强度，同时维持整体误差的系统收敛。这项研究表明，将物理量诊断指标融入损失函数，是面向极端事件和关键阈值的有效路径；配合多源因子融合和时空结构约束的网络设计，可兼顾方法的普适性与业务实用性。

图 1 ECMWF-HRES模式预报(蓝色)与采用不同损失函数的订正预报(橙色、绿色)结果比较：24~168 h 时效的10 m 阵风预报(符号) 空报率与漏报率 Fig. 1 Comparison of false alarm ratio and miss ratio of 10 m gust forecasts with 24-168 h lead time from the original ECMWF-HRES forecast (blue), the U-Net corrected forecast with MAE loss (orange) and the U-Net corrected forecast with MAE_MR loss (green)

综上所述，深度学习偏差订正的关键在于以业务目标为牵引。通过网络结构选择(如CNN/Transformer/GNN)、损失函数定制(尾部加权、阈值/比率类指标)、约束融合(守恒和物理一致性)以及自适应策略(迁移/在线学习)，在多时效、跨区域、跨要素上实现误差收敛、尾部校准、空间一致、概率可靠统一，从而在单一框架下同时服务于确定性预报和概率预报业务需求(Rasp and Lerch, 2018；Hess and Boers, 2022；Bouallègue et al, 2024；Vannitsem et al, 2021)。

2 从粗分辨率到高分辨率的降尺度应用

从粗分辨率到高分辨率网格降尺度的核心目标是在保持物理一致性与统计稳定性的前提下，将数值模式预报在10¹ km量级上的场形态转换为10⁰ km量级甚至更小量级的细致结构，并尽可能提升极端事件和局地地形效应的刻画能力(Cannon et al, 2015；Vandal et al, 2017；Stengel et al, 2020)。传统的双线性插值或基于分布映射的统计订正方法可在均值偏差上取得一定改进，但在重建空间细节、再现降水的间歇性和极端尾部特征方面存在先天不足，且难以在大区域上保持协同一致的空间相关性(Cannon et al, 2015；Bao-Medina et al, 2020；Legasa et al, 2023)。近年来，深度学习将计算机视觉中的超分辨率和生成技术引入气象降尺度，在校正与细化这两类目标上均显示出显著优势，成为连接粗分辨率动力信息与高分辨率地面约束的关键纽带(Vandal et al, 2017；Leinonen et al, 2021；Price and Rasp, 2022)。

深度学习降尺度通常以卷积神经网络为骨干，通过端到端的映射学习高、低分辨率场之间的非线性关系；若同时需要生成细节又保持整体分布特性，则可引入生成对抗网络(GAN)、感知损失和极端偏差权重等策略，在不牺牲整体误差的前提下显著提高图像纹理细节和极端值的可分辨性(Leinonen et al, 2021；Stengel et al, 2020；Price and Rasp, 2022)。相比以MSE/MAE优化为主的回归型降尺度，生成式模型在还原降水空间结构、时空不连续性和高频谱能量方面更接近观测，尤其适合处理降水这类高度非高斯分布的变量；但GAN也更容易出现伪影、分布错配和训练不稳定等问题，需要施加适当的物理约束并建立健全的评估体系(Leinonen et al, 2021；Harris et al, 2022；Wang F et al, 2023)。针对空间降尺度领域，近年的深度学习应用研究工作可概括为三类：(1)以深度统计降尺度技术(DeepSD)为代表的CNN超分辨，强调从粗网格到细网格的直接映射，在再现降水极端值和空间结构方面相较线性/广义线性模型具有优势(Vandal et al, 2017；Bao-Medina et al, 2020)；(2)对抗式超分辨，将GAN用于气候/天气场的细化和精细结构重建，显著提升预报高频功率谱、空间连通性和降水间歇性等特征的描述能力(Leinonen et al, 2021；Stengel et al, 2020；Harris et al, 2022)；(3)偏差校正-细化一体化的生成式降尺度，例如Corrector-GAN方法可对全球集合预报进行偏差订正并生成较为可信的高分辨率降水集合预报，其极端阈值的Brier Score和可靠度已接近区域对流尺度模式的效果(Price and Rasp, 2022；Leinonen et al, 2021)。又如Hess et al(2023)和Wang F et al(2023)在小时级降水场的超分辨率研究中引入定制损失、多任务分类和物理协变量后均取得普遍增益。独立的评估研究进一步指出，在完美预报框架下，CNN与后验随机森林等方法在跨区域可迁移性和降水分布保持方面各有优劣，提示业务上应采取方法组合结合多区域再训练的策略(Bao-Medina et al, 2020；Legasa et al, 2023)。

在国家级数字智能预报业务中，已开展了基于条件生成对抗网络(Conditional GAN)的1 km高分辨率降水短时临近预报技术研发。该方法借鉴了Price and Rasp(2022)提出的Corrector-GAN架构：首先利用生成网络对数值模式的低分辨率降水预报进行偏差校正和下采样细节重建，然后通过判别网络评估生成降水的真实性，从而在对抗训练中逐步提高降水细节的准确度。具体实现上，以模式低分辨率降水预报为基础输入，融合多源大尺度气象要素(如500 hPa高度场、湿度、风场等)作为条件约束，以保证细尺度降水生成的物理一致性(Leinonen et al, 2021；Harris et al, 2022)。在损失函数方面，引入了对极端降水偏差惩罚的自定义损失和感知损失等，平衡生成图像的像素误差与整体结构合理性(Harris et al, 2022；Wang F et al, 2023)。训练过程中采用逐级递进策略：先训练偏差校正子网络，使其学会将模式预报校正为平均更接近观测的场；再逐步提高分辨率，训练细节生成子网络填充1 km格点降水的空间细节。这种分步策略有效提升了模型训练的稳定性，避免了一次性直接超分辨率带来的发散问题(Leinonen et al, 2021)。个例检验表明(图 2)，在2024年梅雨季的一次强降水过程中，Corrector-GAN降尺度模型成功再现了许多局地降水极值中心和窄带状的降水结构，相比原始模式预报有更高的命中率和更小的位置误差，更准确地再现了强降水的落区与局地极值。该降尺度产品已在国家气象中心定量降水预报业务中示范应用，证明了深度学习降尺度方法在业务预报中的可行性和价值：一方面大幅提高了短时临近降水预报的空间精度和细节刻画能力，能够及时捕捉局地暴雨，提升对流天气预警的提前量；另一方面，其高效计算特性满足业务时效要求，可与现有数值模式预报无缝衔接，作为后处理模块融入业务流程(Leinonen et al, 2021；Price and Rasp, 2022)。

图 2 ECMWF模式、Corrector-GAN降尺度产品的预报与实况对比：2024 年7 月1 日强降水过程的3 h 累计降水量注：右上角数字为≥50 mm降水的TS评分。 Fig. 2 Comparison of ECMWF model forecast and Corrector-GAN downscaled forecast with observation: 3 h accumulated precipitation during the heavy rainfall event on 1 July 2024

3 多源异构气象数据的融合应用

大气系统的复杂性决定了单一数据源往往难以全面刻画天气过程，必须融合多源异构气象数据以提升数字智能预报水平。一方面，传统数值预报模式主要在初始化时通过同化观测资料生成初始场，此后预报积分过程中不同来源的信息(如卫星、雷达、地面站、飞机探测等数据)并未得到充分利用。多源异构数据融合旨在预报阶段将观测、雷达、卫星、模式输出等不同来源的数据有机结合，弥补单一来源信息的不足，提高预报的准确性和稳健性。另一方面，当前气象数据正以前所未有的速度增长，呈现出海量、多样和高价值等大数据特征，这使得多源异构数据融合的必要性和优势日益凸显(Overpeck et al, 2011；沈学顺等，2020; 2025)。通过有效的多源异构数据融合，可以自动融合不同来源、不同性质、不同时空分辨率的资料，提炼出最优的信息组合(周康辉，2022)，为精细化、精准化预报提供有力支撑。

引入深度学习为多源异构气象数据融合提供了全新途径和强大工具。传统的数据融合方法一般分为基于阶段(stage-based)、基于特征层(feature-level)和基于语义(semantic-level)的融合方法。气象领域由于各类数据具有明确的物理含义，通常采用基于语义的高层融合策略。相比以往依赖经验规则或简单拼接的数据融合手段，深度学习能够自动挖掘多源数据之间的复杂关联，大幅提高融合效率和效果(Tran and Song, 2019；Geng et al, 2021；Liu et al, 2024)。首先，深度学习网络可以表征预报因子与天气结果之间高度非线性的映射关系，克服传统线性方法的局限，从而更好地整合如雷达强回波、红外云顶亮温等异构特征，提高对极端天气信号的提取能力(Sønderby et al, 2020；Espeholt et al, 2022)。其次，深度神经网络通过多层卷积、循环单元等结构，能够从海量多维数据中自动提取时空关联特征，实现不同资料的融合表征。例如卷积神经网络可以提炼雷达和卫星图像中的空间结构，循环神经网络捕捉时间演变特征，组合形成对天气过程完整的刻画(Shi et al, 2015；Wang et al, 2017；2018)。第三，深度学习模型对多模态输入具有良好的适应性，能够将格点场、栅格图像、不规则站点观测等不同形式的数据融入统一的模型框架中，并通过自适应权重分配和特征学习，充分发挥各数据源的互补优势(Geng et al, 2021；Liu et al, 2024；周康辉等，2021)。总之，借助深度学习强大的特征提取与模式识别能力，气象业务可以高效融合雷达、卫星、地面观测以及数值模式等多源信息，实现比传统方法更优的融合预报效果(Sønderby et al, 2020；Geng et al, 2021；Espeholt et al, 2022；Liu et al, 2024)。

在临近预报和短时预报领域，多源数据融合的需求尤为迫切，各国开展了大量基于深度学习的探索研究。其中，Google的MetNet系列工作突出展示了多源融合资料提升降水预报技巧的潜力。MetNet模型通过精心设计的深度神经网络，将静止卫星云图、地面雷达回波、地面观测站以及地形等多种数据作为输入，生成精细的逐分钟降水预报产品(Sønderby et al, 2020；Espeholt et al, 2022)。相较传统的光流外推临近预报和快速循环同化的数值模式，MetNet系列显著延长了有效预报时效(最高可达8~24 h)，并将预报的时间和空间分辨率分别提高到2 min、1 km。研究表明，多源观测数据的引入对提高12 h以内的短时降水预报有全局性的正面贡献，突破了过去依赖单一雷达外推方法预报时效较短(仅1~2 h)的局限。除了降水预报，强对流天气领域也取得进展。例如，Geng et al(2021)构建了融合多源时空数据的深度学习框架，用于云地闪电的6 h预测，显著提高了闪电落区预报的时效和准确率。Liu et al(2024)利用雷达回波、闪电定位、高分辨率模式等多种信息，实现了京津冀地区雷暴大风的短时预报，有效提升了强对流大风的警戒能力。这些研究成果表明，通过深度学习模型融合观测和模式等异构数据，可以显著增强对强天气的预测性能，为业务无缝预报提供有力支撑(周康辉等，2025)。

面向业务应用，国家气象中心近年积极探索深度学习融合多源数据以改进不同时间尺度的强对流天气预报，并取得了一系列成果。

面向0~1 h尺度的临近预报，采取“多源观测-深度表征-概率预报”的技术路线开展了LightningNet模型研发(Zhou et al, 2020)。模型以多普勒雷达组合反射率、静止卫星多通道红外亮温、地基闪电密度等多源观测为核心输入，采用卷积编码和融合注意力机制自动提取空间结构和时间演变特征，学习对流云体与闪电活动之间的非线性映射关系，直接产出1 h闪电发生概率。业务评估显示，卫星云图的引入显著增强了对对流初生与快速发展阶段的捕捉；相较于仅依赖雷达等单一观测源，融合方案在闪电预报的命中率和空间定位一致性方面更优，能更早识别潜在的强对流触发区(Zhou et al, 2020；Geng et al, 2021)。这一结果表明，在临近尺度上，多源异构观测本身就包含对未来1 h天气演变的可利用信息，深度学习可作为高效的信息压缩、解码器，将分散的多源线索转化为时空一致的概率预报产品，为后续短时到短期尺度的无缝衔接提供可靠起点(Shi et al, 2015；Wang et al, 2017)。

在0~6 h的短时预报尺度上，观测先验的精细触发信号与模式场提供的动力、热力背景相结合尤为关键。LightningNet-NWP语义分割框架(周康辉，2022；周康辉等，2021)将多源观测(闪电密度、雷达拼图、静止卫星多通道)与CMA-MESO模式预报等共9类因子进行协同编码。通过将观测先验的精细触发/组织信息与模式场的中小尺度动力环境相结合，模型显著提升了0~6 h内闪电落区和强对流落区预报的时空一致性和稳定性(周康辉等，2021)。个例分析表明(图 3)，融合多源观测与模式的预报能够比仅依赖中尺度模式的预报能更好地匹配实况雷暴大风落区。批量检验结果也表明，融合方案在提高POD、降低FAR方面具有统计显著优势；对于空间分散且瞬变的强对流现象(如短时强降水、雷暴大风、冰雹)，多源协同能够较好地缓解单一信息源样本稀疏和噪声放大的问题，体现出短时尺度融合的业务价值(Liu et al, 2024；Geng et al, 2021)。

图 3 (a₁~f₁)CMA-MESO模式预报与(a₂~f₂)融合模式与多源观测数据的预报比较：2021年7月30日11时起报的6 h 预报时效雷暴大风的发生概率(填色) 及相应时刻国家站观测实况(风羽) Fig. 3 Comparison of (a₁-f₁) CMA-MESO model forecast and (a₂-f₂) fusion model forecast with multi-source observation data: the occurrence probability (colored) of severe convective winds with 6 h lead time initiated at 11:00 BT 30 July 2021 and the observed winds (barb) at the national meteorological stations at the corresponding time

对于6~72 h的短期预报尺度，观测的直接先验信息渐趋减弱，多模式、多尺度数值预报信息成为主导。为此，国家气象中心提出了多尺度数值模式深度融合模型(周康辉，2022)，以ECMWF-HRES(天气尺度)与CMA-MESO 3 km(中尺度)为主要信息源，采用双编码器、单解码器的结构针对不同尺度特征进行定制化表征，并结合迁移学习缓解不同季节/区域样本可得性不足的问题。模型在输出端采用强对流类别概率等目标变量形式，直接服务预警阈值和业务决策需求。批量检验显示(表 1)，融合模型相较任何单一模式预报在POD、FAR、ETS、TS等指标上均显著优于基线，跨尺度因子的精筛与结构化融合是性能增益的关键。

表 1 ECMWF-HRES、CMA-MESO与多尺度数值模式深度融合模型的效果比较：2023年8月闪电预报的批量验证指标 Table 1 Comparison of the performance of the lightning forecasts by ECMWF-HRES and CMA-MESO and the multi-model cross-scale integrated lightning forecasts in August 2023 (batch verification metrics)

4 灾害性天气监测与预报应用(以台风为例)

台风的监测与预报一直是天气预报中的难点，其核心在于台风生成、路径和强度演变过程中多尺度耦合的高度非线性特征。尤其是24 h量级的快速增强(RI)往往由台风内部对称性、海气热量交换和环境垂直风切变等多因子共同触发，导致传统统计方法和经验方法难以稳定捕捉前兆信号，数值模式在特定个例下也存在技巧波动。在此背景下，深度学习通过从海量卫星云图、环境场和历史个例中自动提取判别性特征，能够弥补主观定强一致性不足和线性校正能力有限等短板，为台风监测与预报提供新的技术路径与业务衔接方式(Pradhan et al, 2018；Higa et al, 2021；Jiang et al, 2022；Wang L et al, 2023；钱奇峰等，2021)。

相较传统预报方法，深度学习在台风领域的适用性主要体现在以下方面。(1)卷积神经网络(CNN)可自动学习卫星云图的形态学与纹理特征，避免对Dvorak技术等经验特征的过度依赖，在涡旋定位和客观定强中已被证明有效(Pradhan et al, 2018；Higa et al, 2021；钱奇峰等，2021)；(2)循环神经网络(RNN/LSTM/GRU)和三维卷积结构能够建模台风强度和位置的时空依赖，适合处理台风生命史序列与环境场的协同演变，有望提升短时段路径和强度变化趋势的可预报性(Wang L et al, 2023；Jiang et al, 2022)；(3)生成式模型和注意力机制有助于在样本不均衡情形下强化对极端和尾部过程的表征，并通过融合多源资料提高对关键物理线索的敏感性，从而改进RI等突发性过程的自动判别(Jiang et al, 2022；Zhou et al, 2022)。基于上述优势，深度学习逐步形成了从监测、定强，到趋势判别、路径/强度预报的闭环，在业务应用中与数值模式输出及统计后处理实现互补与协同(钱奇峰等，2021；吕心艳等，2022)。

围绕台风路径和强度这两个核心预报指标，近年的实例研究显示出稳健成效，并在方法上提供了有益启示。路径预报方面，Wang L et al(2023)使用1979—2021年西北太平洋历史台风路径数据训练RNN/LSTM/GRU，仅以历史位置序列为输入即可实现6~72 h的台风连续路径预报，其中6 h、12 h平均位置误差分别降至约17 km、44 km。强度预报方面，Pradhan et al(2018)首先使用CNN对飓风强度进行客观分类，证明了单纯基于红外云图的“端到端”方法的有效性；进一步地，Higa et al(2021)将领域知识先验引入VGG-16网络，实现了台风强度等级序列划分验证下的准确率显著提升。面向多源多维环境场，Jiang et al(2022)将三维环境因子与台风内部结构联合输入，利用二维/三维卷积和空间注意力模块构建时空回归网络，系统性提高了台风强度的预报技巧。这些研究结果表明，结构化地引入时空依赖和领域知识，是持续提升模型泛化性能和稳健性的关键(Jiang et al, 2022；Wang L et al, 2023)。

对于台风生成识别和快速增强判别这两个难点，深度学习也同样显示了其应用价值和未来前景。生成识别方面，机器学习通过拟合大尺度动力环境(如海表温度、湿度、低层涡度和垂直风切变等)与云系组织度之间的非线性映射，可提升24~48 h内扰动发展成台风的命中率和稳定性，相较于传统的阈值指标类方法更具鲁棒性(Chen et al, 2020)。RI判别方面，Zhou et al(2022)融合ResNet与时序结构，结合台风生命史指示因子缓解样本不均衡和资料缺测的干扰，显著提高了未来24 h台风是否发生RI的判别能力；此类模型往往输出连续的概率曲线，既便于与业务阈值衔接，也利于人工干预和综合研判(Zhou et al, 2022)。总体而言，台风生成和RI判别是传统业务中的薄弱环节，而“图像-序列-环境”多模态深度学习为这两个环节提供了可操作方案和实用的预警提前量(钱奇峰等，2021；吕心艳等，2022)。

在国家级数字智能业务应用场景下，相关技术的标准化、流程化很重要。国家气象中心已在台风业务链条中引入深度学习模块，形成了涡旋识别、客观定强、快速增强趋势判别的一体化流程，并与动力模式、集合订正及主观研判融合应用。首先，基于目标检测的深度学习模型(SSD)对静止卫星红外云图进行多尺度特征提取和候选框生成，能够在复杂背景下稳定识别台风涡旋目标(吕心艳等，2022)。随后，基于ResNet骨干的台风智能定强技术以迁移学习耦合图像分类与相似样本检索双通道输出(图 4)，独立年份样本测试结果理想(MAE约为3.8 m·s^-1，RMSE约为5.0 m·s^-1)，满足业务中客观定强的精度需求并具备跨阶段的适用性(钱奇峰等，2021)。在强度突变预警层面，融合LSTM的快速增强趋势判别模型以台风生命史的云图序列和历史强度为输入，输出未来24 h是否发生RI的概率曲线(图 5)，能够在台风实况强度突增前给出显著的概率抬升信号(Zhou et al, 2022)。通过将上述模块植入统一的数字智能预报框架，并与集合订正、客观一致性约束联合运行，业务上实现了对台风生命周期关键节点的自动监测和辅助预报，显著减轻了预报员的主观研判压力并提升了复杂个例的预报稳定性(钱奇峰等，2021；吕心艳等，2022)。

图 4 基于目标检测的深度学习模型(SSD)自动识别台风涡旋示例 Fig. 4 Typhoon vortex auto-detection based on SSD object detection method

图 5 融合LSTM的快速增强趋势判别模型结果与实况的对比(a)2411 号台风“摩羯”，(b)2418 号台风“山陀儿” 注：红色横线为判别阈值线，横线之上的

判别为将发生RI。 Fig. 5 Rapid intensification (RI) probability predicted by the model based on LSTM compared to the observed RI (a) Typhoon Yagi, (b) Typhoon Krathon

5 数据驱动的天气预报模型带来的新途径

以偏微分方程为核心的传统数值天气预报模式仍是当前全球和区域预报业务的基础，但其高计算成本和网格/时间分辨率之间的权衡，使其在分钟-千米尺度对流系统的触发与演变刻画方面存在先天不足。随着再分析资料、雷达/卫星观测和地面站网的长期积累，深度学习模型可以在大样本上直接学习预报与观测之间的映射，形成与NWP并行且能够快速推理的数据驱动新途径。近年研究表明，此类模型在推理效率、时效延伸、多源融合和极端事件表征等方面已具备与传统模式竞争的潜力，为天气预报提供了一条“第二路线”，有望重塑传统的“模式-后处理-融合”业务链条(Ravuri et al, 2021；Sønderby et al, 2020；Espeholt et al, 2022；Pathak et al, 2022；Bi et al, 2023；Lam et al, 2023；Lang et al, 2024)。

5.1 数据驱动的强对流临近预报模型

临近预报需对未来0~3 h的降水回波生成、发展和消散给出高时空分辨率刻画，传统光流外推易出现形状保持而物理过程缺失的问题。深度学习首先沿时空递归路线取得突破：ConvLSTM模型在LSTM门控结构中以卷积运算替代全连接，使隐状态更新能够同时表征空间结构和时间依赖，开启了基于雷达回波序列的“端到端”降水外推(Shi et al, 2015)。随后，PredRNN及其改进版PredRNN++通过时空记忆单元和梯度高速通道缓解长序列训练中的梯度消散问题，显著提升了长期依赖建模能力(Wang et al, 2017；2018)。面向非匀速、非刚体运动的回波变化，TrajGRU引入隐层特征的“轨迹对齐”，而MotionRNN通过显式估计并分解瞬时运动与长程趋势，提升了回波形变与位移的一致性(Yao et al, 2023；Wu et al, 2021)。另一条路线是一次性多步生成：以U-Net为代表的多尺度卷积网络取消逐时递归推演，直接输出未来多步的雷达回波场；配合对抗式训练及感知/锐化损失，在一定程度上缓解了均值回归、图像模糊现象(Ronneberger et al, 2015；Ravuri et al, 2021；Tran and Song, 2019)。

一个重要的进展来自生成式建模。DeepMind的DGMR模型以GAN为核心，通过学习雷达序列的概率分布来生成降水集合预报，显著提升了0~2 h不同强度降水的主观和客观预报技巧，在大样本检验中优于光流外推和同期确定性深度学习模型(Ravuri et al, 2021)。DGMR的成功表明，要同时获得清晰细节和不确定度刻画，概率生成比确定性回归更具潜力(Ravuri et al, 2021；Marrocu and Massidda, 2020)。需要注意的是，一些对比研究也指出深度模型在提升TS的同时，极端峰值仍可能偏弱, 生成图像有非自然平滑的倾向，显示需要进一步引入物理约束并对稀有事件进行重加权训练(Marrocu and Massidda, 2020；Hess and Boers, 2022)。

在我国数字智能业务应用方面，国家气象中心联合清华大学在NowcastNet框架基础上研制了国产AI临近预报模型“风雷”(Zhang et al, 2023；盛杰等，2025)。与通用GAN两阶段结构不同，“风雷”模型以变分自编码器(VAE)稳健的编码-解码替换部分生成模块，并将中尺度NWP提供的环境场作为条件输入，与对流尺度的外推生成过程进行条件耦合，弥补了纯数据驱动方法对大尺度环境刻画不足的问题。在输入端，“风雷”模型引入1 km分辨率的数字高程模型(DEM)和海陆分布等静态因子，以优化复杂地形区域降水回波的触发和组织过程(Zhang et al, 2023)。基于全国多年份雷达组合反射率序列的训练，“风雷”可在约3分钟内给出覆盖全国的0~3小时、逐6分钟、千米级分辨率雷达拼图降水预报。评估表明，“风雷”模型在各预报时效的TS评分全面优于业务光流外推产品，预报的强降水回波面积与实况的匹配度更高，对强对流回波(≥50 dBz)的命中率显著提升(图 6)。这说明以国内数据驱动临近预报模型并通过融合物理先验(如地形信息)和生成式网络，能够更贴近真实地再现回波的生成消散过程和结构细节。总体来看，强对流临近预报的有效范式正在从“几何外推”迈向“数据驱动的物理生成”，但在损失函数设计、物理一致性约束和极端尾部刻画等方面仍需持续强化(Ravuri et al, 2021；Hess and Boers, 2022)。

图 6 “风雷”模型与SWAN3.0光流外推对≥50 dBz对流回波的预报技巧TS评分比较：2023 年全国范围逐6 分钟外推降水预报 Fig. 6 Threat score (TS) comparison for convective echo forecasts between the Fenglei model and SWAN3.0 optical flow extrapolation: verification of nationwide 6 min precipitation forecast extrapolation in 2023

5.2 数据驱动的短中期全球预报模型

在0~15 d的短期、中期尺度上，数据驱动模型逐步形成了两大主线：频谱/注意力类Transformer模型和图神经网络(GNN)模型。

FourCastNet将自适应傅里叶神经算子与Vision Transformer结合，在低计算成本下实现了与传统数值模式相当的全球24 h预报，并展现出百成员集合秒级推理的能力(Pathak et al, 2022)。Pangu-Weather采用3D Swin-Transformer并行建模三维时空，配合多时效子模型串联和差异化Patch嵌入策略，在多个要素上实现对ECMWF-IFS的全面超越，并显著缓解了长积分预报活跃度衰减问题(Bi et al, 2023)。复旦大学团队提出的“FuXi”模型以级联方式分别优化0~5、5~10和10~15 d子模型，以降低误差累积；在多要素上15 d预报技巧接近或优于传统集合均值(Chen et al, 2023c)。上海人工智能实验室的“FengWu”模型通过多任务损失和“回放”训练策略抑制长时效漂移，将全球中期预报的可用时效推进至约10.75 d(Chen et al, 2023a；2023b)。

在GNN方向，以GraphCast为代表的模型将规则网格映射为图节点，通过边连接建模空间相互作用，并采用自回归的多步推演方式，兼顾大尺度环流和局地细节，同时将10 d全球预报的推理时间压缩至分钟量级(Lam et al, 2023)。ECMWF推出的人工智能预报系统AIFS进一步采用“GNN编码-Swin-Transformer-GNN解码”架构实现跨尺度信息的高效聚合，在保持物理一致性的同时显著提升了细网格场的结构活跃度(Lang et al, 2024)。值得关注的是，GraphDOP探索了观测直驱方式：以极轨卫星垂直探测资料为骨干，联合多源地基/星载观测并实施严格的质量控制，不依赖再分析场即可直接学习并初始化5 d全球预报，展示了数据同化、模式积分之外的第三种道路(Alexe et al, 2024)。

我国在业务化探索方面，国家气象中心联合清华大学研发了“风清”全球数据驱动天气预报模型，将大气物理约束深度融入深度学习架构中。“风清”通过多尺度隐空间投影(Transitor模块)将多尺度相互作用表述为低维隐状态转移，并在损失函数中施加能量守恒等物理一致性约束，以缓解AI模型长时效预报中的能量耗散和过度平滑等问题(Chen et al, 2023c；Lang et al, 2024)。同时，“风清”提出了可扩展的多时效联合优化策略，在不显著增加显存占用的情况下延伸可预报时长。基于ERA5长期再分析资料的训练和GPU集群的并行计算，“风清”可在约3分钟内生成15 d、逐6 h、25 km分辨率，共69个要素的全球格点预报产品，并已通过业务化准入测试。个例显示，在2024年长江中下游暴雨过程中，“风清”模型较早即可稳定指向江南地区的降水雨带并保持至短期预报，而ECMWF-IFS模式需至较短预见期才逐步调整雨带位置至实况(图 7)。

图 7 (a, c, e)“风清”模型、(b, d, f)ECMWF-IFS模式不同时效的24 h累计降水量预报(填色) 与观测实况(散点) ：2024 年6 月29 日长江中下游暴雨过程(a，b)36 h，(c，d)84 h，(e，f)144 h Fig. 7 Comparison of the (a, b) 36 h, (c, d) 84 h and (e, f) 144 h forecasts for 24 h accumulated precipitation by (a, c, e) FengQing model and (b, d, f) ECMWF-IFS model during a torrential rain event in the middle and lower reaches of the Yangtze River on 29 June 2024

6 结论与讨论

深度学习技术正推动国内外数字智能天气预报技术体系快速发展。其应用已覆盖从临近到中期的各个预报尺度，并在偏差订正(Rasp and Lerch, 2018；Han et al，2021)、降尺度(Vandal et al, 2017；Leinonen et al, 2021；Price and Rasp, 2022)、多源融合(Sønderby et al, 2020；Espeholt et al, 2022)、灾害性天气预报(吕心艳等，2022；钱奇峰等，2021；Zhou et al, 2022)和数据驱动预报(Pathak et al, 2022；Bi et al, 2023；Lam et al, 2023；Chen et al, 2023a；2023b；2023c；Lang et al, 2024)等关键环节取得了突破性成果。例如，利用神经网络校正模式偏差、通过生成模型细化降水结构、融合多源数据延长临近预报时效、构建智能模块提升台风预报能力，以及发展出与数值模式性能相当的数据驱动全球预报模型等。上述代表性案例表明，深度学习作为新一代人工智能技术，正为建设无缝隙、高分辨率、智能化的数字预报业务提供一套强有力的工具箱，预示着“模式-后处理-融合”协同的新方式(Craven et al, 2020；Roberts et al, 2023；Vannitsem et al, 2021)。

然而，当前深度学习在数字智能预报的应用仍面临一系列挑战和瓶颈。(1)样本数据和再预报资料的获取与利用。深度模型通常需要海量高质量训练数据，但在某些区域或极端天气背景下的观测和再分析资料相对稀少，限制了模型泛化能力。亟需通过构建长期再预报数据集、数据同化模拟观测等方式扩充训练样本，并探索少样本或迁移学习等手段以提升模型对稀有事件的学习能力(Overpeck et al, 2011；Hamill and Scheuerer, 2018；Vannitsem et al, 2021)。(2)模型的物理一致性与可解释性。深度学习模型作为一种数据驱动方法，其内部机理复杂，难以像物理方程一样提供清晰的因果解释。但值得注意的是，传统的统计后处理方法(如MOS)也并非基于物理机理。与其追求纯粹的物理可解释性，更务实的路径是提升模型的鲁棒性和业务应用中的可信度。因此引入物理约束(如守恒律)不仅是为了使输出符合物理规律(Hess and Boers, 2022；Lang et al, 2024；Schulz and Lerch, 2022)，更是一种有效的正则化手段，可以约束解空间，能够在训练样本(特别是极端事件样本)不足时显著提升模型的稳定性和泛化能力。同样，可解释性工具(如注意力可视化)的主要价值，不仅在于解释，更在于“诊断”——可以帮助算法开发者快速定位模型失效的原因，也可以为预报员在面对AI给出极端或反直觉的预报结果时提供一种判断依据，从而在人机交互中建立信任并辅助决策。(3)极端天气和分布尾部的预报仍是难点。由于极端事件在历史数据中占比较小，模型容易倾向于均值状态，导致对极端强度的预报偏弱。解决这一问题需要采用针对尾部事件的重加权训练/损失、数据增强与合成样本等技术，提高模型对极端样本的敏感性(Hess and Boers, 2022；Marrocu and Massidda, 2020)。(4)跨尺度预报的一致性。不同尺度的深度学习模型可能各自优化于本地目标，存在预报不连续、不协调的情况。未来可构建多尺度联合训练或多任务学习框架，确保不同时间尺度预报间的衔接和平滑过渡(Pathak et al, 2022；Chen et al, 2023c；Lang et al, 2024)。(5)计算成本与效率。这依然是深度学习模型业务应用中需要权衡的因素。虽然其推理阶段速度很快，但在训练阶段通常需要大量计算资源，尤其是高分辨率三维模型。可通过模型裁剪、量化、知识蒸馏等技术压缩模型规模，加速推理；并利用GPU/TPU和并行计算提升训练效率，探索连续学习更新机制，使模型随新数据自适应而无需频繁地完全重训(Pathak et al, 2022；Bi et al, 2023；Lam et al, 2023)。

展望未来，深度学习赋能的数字智能预报应朝着更融合、更智能、更可靠的方向演进。(1)深度融合模式和观测：发挥数值模式提供大尺度动力平衡场的优势，结合深度学习对局地细节和多源信息的敏感性，发展“物理模型+数据驱动”的融合预报体系，如模式引导下的生成对抗网络和图神经融合(Price and Rasp, 2022；Lam et al, 2023)。(2)加强理论指导与物理约束：构建融入分层保守量的约束模块，确保质量、能量守恒等硬性条件；加强可解释性研究(Lang et al, 2024；Schulz and Lerch, 2022)。(3)聚焦关键天气和极端事件：针对暴雨、热浪、台风等建立专门的深度学习子模块，并与传统方法集成，提升预警提前量(Zhou et al, 2022；Liu et al, 2024)。(4)完善智能人机交互预报：开发可交互的AI辅助决策系统，支持预报员理解和调整AI输出，兼顾可控性与可靠性(Craven et al, 2020；Roberts et al, 2023)。(5)建立开放评估基准：推动统一评估平台与开放数据集，推进公平对比与持续改进(Vannitsem et al, 2021；Schulz and Lerch, 2022)。

综上所述，深度学习技术在数字智能预报中的应用前景广阔。随着观测资料和计算资源的持续增长，以及更成熟的算法和技术实现，深度学习有望进一步突破当前瓶颈，在提高预报精准度、丰富不确定性信息和提升自动化水平等方面发挥更大作用。未来的智能预报体系将是物理机理和数据驱动高度融合的新型模式，深度学习将与数值模式、人工智慧和专家经验共同构成气象预报领域的技术基础，提供更高质量、更高时效的无缝智慧预报服务。

参考文献

代刊, 朱跃建, 毕宝贵, 2018. 集合模式定量降水预报的统计后处理技术研究综述[J]. 气象学报, 76(4): 493-510. Dai K, Zhu Y J, Bi B G, 2018. The review of statistical post-process technologies for quantitative precipitation forecast of ensemble prediction system[J]. Acta Meteor Sin, 76(4): 493-510 (in Chinese).

金荣花, 曹勇, 赵瑞霞, 等, 2025. 中央气象台智能数字天气预报业务的技术进展[J]. 气象, 51(11): 1321-1334. Jin R H, Cao Y, Zhao R X, et al, 2025. Technological advances in the intelligent digital weather forecasting operational system of National Meteorological Centre[J]. Meteor Mon, 51(11): 1321-1334 (in Chinese). DOI:10.7519/j.issn.1000-0526.2025.063003

金荣花, 代刊, 赵瑞霞, 等, 2019. 我国无缝隙精细化网格天气预报技术进展与挑战[J]. 气象, 45(4): 445-457. Jin R H, Dai K, Zhao R X, et al, 2019. Progress and challenge of seamless fine gridded weather forecasting technology in China[J]. Meteor Mon, 45(4): 445-457 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.04.001

吕心艳, 钱奇峰, 王登科, 等, 2022. 基于深度图像目标检测的智能台风涡旋识别技术[J]. 热带气象学报, 38(4): 492-501. Lyu X Y, Qian Q F, Wang D K, et al, 2022. Intelligent technique of typhoon vortex detection based on object detection with deep learning of satellite image[J]. J Trop Meteor, 38(4): 492-501 (in Chinese).

钱奇峰, 王川, 徐雅静, 等, 2021. 一种基于深度学习的台风强度估测技术[J]. 气象, 47(5): 601-608. Qian Q F, Wang C, Xu Y J, et al, 2021. A deep learning technique of typhoon intensity estimation[J]. Meteor Mon, 47(5): 601-608 (in Chinese). DOI:10.7519/j.issn.1000-0526.2021.05.008

沈学顺, 苏勇, 李兴良, 等, 2025. 中国业务数值天气预报自主发展中的理论和方法创新[J]. 气象, 51(11): 1293-1320. Shen X S, Su Y, Li X L, et al, 2025. Innovation of theory and methodology in the independent development of operational numerical weather prediction in China[J]. Meteor Mon, 51(11): 1293-1320 (in Chinese). DOI:10.7519/j.issn.1000-0526.2025.093001

沈学顺, 王建捷, 李泽椿, 等, 2020. 中国数值天气预报的自主创新发展[J]. 气象学报, 78(3): 451-476. Shen X S, Wang J J, Li Z C, et al, 2020. China's independent and innovative development of numerical weather prediction[J]. Acta Meteor Sin, 78(3): 451-476 (in Chinese).

盛杰, 金荣花, 张小雯, 等, 2025. 临近气象预报大模型"风雷"V1版本检验及个例评估[J]. 气象, 51(4): 389-399. Sheng J, Jin R H, Zhang X W, et al, 2025. Verification and case evaluation of the "Fenglei" V1 meteorological nowcasting model[J]. Meteor Mon, 51(4): 389-399 (in Chinese). DOI:10.7519/j.issn.1000-0526.2025.032801

孙全德, 焦瑞莉, 夏江江, 等, 2019. 基于机器学习的数值天气预报风速订正研究[J]. 气象, 45(3): 426-436. Sun Q D, Jiao R L, Xia J J, et al, 2019. Adjusting wind speed prediction of numerical weather forecast model based on machine learning methods[J]. Meteor Mon, 45(3): 426-436 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.03.012

杨绚, 代刊, 朱跃建, 2022. 深度学习技术在智能网格天气预报中的应用进展与挑战[J]. 气象学报, 80(5): 649-667. Yang X, Dai K, Zhu Y J, 2022. Progress and challenges of deep learning techniques in intelligent grid weather forecasting[J]. Acta Meteor Sin, 80(5): 649-667 (in Chinese).

周康辉, 2022-04-22. 一种多尺度数值天气预报模式融合的天气预报方法及装置: 中国, 202111436282.6[P].

Zhou K H, 2022-04-22. Weather forecasting method and device based on multi-scale numerical weather forecasting mode fusion: CN, 202111436282.6[P](in Chinese).

周康辉, 郑永光, 杨波, 等, 2025. 强对流天气客观临近预报技术进展和展望[J]. 气象学报, 83(3): 798-812. Zhou K H, Zheng Y G, Yang B, et al, 2025. Objective nowcasting of severe convective weather: technological progress and outlook[J]. Acta Meteor Sin, 83(3): 798-812 (in Chinese).

周康辉, 郑永光, 王婷波, 2021. 利用深度学习融合NWP和多源观测数据的闪电落区短时预报方法[J]. 气象学报, 79(1): 1-14. Zhou K H, Zheng Y G, Wang T B, 2021. Very short-range lightning forecasting with NWP and observation data: a deep learning approach[J]. Acta Meteor Sin, 79(1): 1-14 (in Chinese).

朱跃建, 代刊, 唐健, 2025. 减少预报不确定性, 提高预报能力——集合预报的发展和应用[J]. 气象, 51(11): 1335-1352. Zhu Y J, Dai K, Tang J, 2025. Reducing forecast uncertainty and improving forecasting capability—a review of the development and application of ensemble prediction[J]. Meteor Mon, 51(11): 1335-1352 (in Chinese). DOI:10.7519/j.issn.1000-0526.2025.091801

Alexe M, Boucher E, Lean P, et al, 2024. GraphDOP: towards skilful data-driven medium-range weather forecasts learnt and initialised directly from observations[J]. arXiv preprint arXiv: 2412.15687.

Bao-Medina J, Manzanas R, Gutiérrez J M, 2020. Configuration and intercomparison of deep learning neural models for statistical downscaling[J]. Geosci Model Dev, 13(4): 2109-2124. DOI:10.5194/gmd-13-2109-2020

Bi K F, Xie L X, Zhang H H, et al, 2023. Accurate medium-range global weather forecasting with 3D neural networks[J]. Nature, 619(7970): 533-538. DOI:10.1038/s41586-023-06185-3

Bouallègue Z B, Weyn J A, Clare M C A, et al, 2024. Improving medium-range ensemble weather forecasts with hierarchical ensemble transformers[J]. Artif Intell Earth Syst, 3(1): e230027.

Bridge C, 2015. Why are temperature forecasts from the Australian Digital Forecast Database poorer on summer afternoons?[J]. Aust Meteor Oceanographic J, 65(2): 176-194. DOI:10.22499/2.6502.001

Cannon A J, Sobie S R, Murdock T Q, 2015. Bias correction of GCM precipitation by quantile mapping: how well do methods preserve changes in quantiles and extremes?[J]. J Clim, 28(17): 6938-6959. DOI:10.1175/JCLI-D-14-00754.1

Chen K, Bai L, Ling F H, et al, 2023b. Towards an end-to-end artificial intelligence driven global weather forecasting system[J]. arXiv preprint arXiv: 2312.12462.

Chen K, Han T, Gong J C, et al, 2023a. FengWu: Pushing the skillful global medium-range weather forecast beyond 10 days lead[J]. arXiv preprint arXiv: 2304.02948.

Chen L, Zhong X H, Zhang F, et al, 2023c. FuXi: a cascade machine learning forecasting system for 15-day global weather forecast[J]. npj Climate Atmos Sci, 6: 190. DOI:10.1038/s41612-023-00512-1

Chen R, Zhang W M, Wang X, 2020. Machine learning in tropical cyclone forecast modeling: a review[J]. Atmosphere, 11(7): 676. DOI:10.3390/atmos11070676

Craven J P, Rudack D E, Shafer P E, 2020. National blend of models: a statistically post-processed multi-model ensemble[J]. J Operat Meteor, 8(1): 1-14.

Dabernig M, Mayr G J, Messner J W, et al, 2017. Spatial ensemble post-processing with standardized anomalies[J]. Quart J Roy Meteor Soc, 143(703): 909-916. DOI:10.1002/qj.2975

Dabernig M, Schicker I, Kann A, et al, 2020. Statistical post-processing with standardized anomalies based on a 1 km gridded analysis[J]. Meteor Z, 29(4): 265-275. DOI:10.1127/metz/2020/1022

Espeholt L, Agrawal S, Sønderby C, et al, 2022. Deep learning for twelve hour precipitation forecasts[J]. Nat Commun, 13(1): 5145. DOI:10.1038/s41467-022-32483-x

Geng Y A, Li Q Y, Lin T Y, et al, 2021. A deep learning framework for lightning forecasting with multi-source spatiotemporal data[J]. Quart J Roy Meteor Soc, 147(741): 4048-4062. DOI:10.1002/qj.4167

Glahn H R, Lowry D A, 1972. The use of Model Output Statistics (MOS) in objective weather forecasting[J]. J Appl Meteor, 11(8): 1203-1211. DOI:10.1175/1520-0450(1972)011<1203:TUOMOS>2.0.CO;2

Gneiting T, Raftery A E, Westveld Ⅲ A H, et al, 2005. Calibrated probabilistic forecasting using ensemble model output statistics and minimum CRPS estimation[J]. Mon Wea Rev, 133(5): 1098-1118. DOI:10.1175/MWR2904.1

Hamill T M, Engle E, Myrick D, et al, 2017. The U.S.National Blend of Models for statistical postprocessing of probability of precipitation and deterministic precipitation amount[J]. Mon Wea Rev, 145(9): 3441-3463. DOI:10.1175/MWR-D-16-0331.1

Hamill T M, Scheuerer M, 2018. Probabilistic precipitation forecast postprocessing using quantile mapping and rank-weighted best-member dressing[J]. Mon Wea Rev, 146(12): 4079-4098. DOI:10.1175/MWR-D-18-0147.1

Han L, Chen M X, Chen K K, et al, 2021. A deep learning method for bias correction of ECMWF 24-240 h forecasts[J]. Adv Atmos Sci, 38(9): 1444-1459. DOI:10.1007/s00376-021-0215-y

Harris L, McRae A T T, Chantry M, et al, 2022. A generative deep learning approach to stochastic downscaling of precipitation forecasts[J]. J Adv Model Earth Syst, 14(10): 2022-003120.

Hess P, Boers N, 2022. Deep learning for improving numerical weather prediction of heavy rainfall[J]. J Adv Model Earth Syst, 14(3): e2021MS002765. DOI:10.1029/2021MS002765

Hess P, Lange S, Schötz C, et al, 2023. Deep learning for bias-correcting CMIP6-class earth system models[J]. Earth's Future, 11(10): e2023EF004002. DOI:10.1029/2023EF004002

Higa M, Tanahara S, Adachi Y, et al, 2021. Domain knowledge integration into deep learning for typhoon intensity classification[J]. Sci Rep, 11(1): 12972. DOI:10.1038/s41598-021-92286-w

Homleid M, 1995. Diurnal corrections of short-term surface temperature forecasts using the Kalman filter[J]. Wea Forecasting, 10(4): 689-707. DOI:10.1175/1520-0434(1995)010<0689:DCOSTS>2.0.CO;2

Jiang S L, Fan H J, Wang C Z, 2022. Improvement of typhoon intensity forecasting by using a novel spatio-temporal deep learning model[J]. Remote Sens, 14(20): 5205. DOI:10.3390/rs14205205

Lam R, Sanchez-Gonzalez A, Willson M, et al, 2023. Learning skillful medium-range global weather forecasting[J]. Science, 382(6677): 1416-1421. DOI:10.1126/science.adi2336

Lang S, Alexe M, Chantry M, et al, 2024. AIFS——ECMWF's data-driven forecasting system[J]. arXiv preprint arXiv: 2406.01465.

Legasa M N, Thao S, Vrac M, et al, 2023. Assessing three perfect prognosis methods for statistical downscaling of climate change precipitation scenarios[J]. Geophys Res Lett, 50(9): e2022GL102525. DOI:10.1029/2022GL102525

Leinonen J, Nerini D, Berne A, 2021. Stochastic super-resolution for downscaling time-evolving atmospheric fields with a generative adversarial network[J]. IEEE Trans Geosci Remote Sens, 59(9): 7211-7223. DOI:10.1109/TGRS.2020.3032790

Liu Y Q, Yang L, Chen M X, et al, 2024. A deep learning approach for forecasting thunderstorm gusts in the Beijing-Tianjin-Hebei Region[J]. Adv Atmos Sci, 41(7): 1342-1363. DOI:10.1007/s00376-023-3255-7

Marrocu M, Massidda L, 2020. Performance comparison between deep learning and optical flow-based techniques for nowcast precipitation from radar images[J]. Forecasting, 2(2): 194-210. DOI:10.3390/forecast2020011

Overpeck J T, Meehl G A, Bony S, et al, 2011. Climate data challenges in the 21st century[J]. Science, 331(6018): 700-702. DOI:10.1126/science.1197869

Pathak J, Subramanian S, Harrington P, et al, 2022. FourCastNet: a global data-driven high-resolution weather model using adaptive Fourier neural operators[J]. arXiv preprint arXiv: 2202.11214.

Pradhan R, Aygun R S, Maskey M, et al, 2018. Tropical cyclone intensity estimation using a deep convolutional neural network[J]. IEEE Trans Image Process, 27(2): 692-702. DOI:10.1109/TIP.2017.2766358

Price I, Rasp S, 2022. Increasing the accuracy and resolution of precipitation forecasts using deep generative models[C]//Proceedings of the 25th International Conference on Artificial Intelligence and Statistics. PMLR: 10555-10571.

Rasp S, Lerch S, 2018. Neural networks for postprocessing ensemble weather forecasts[J]. Mon Wea Rev, 146(11): 3885-3900. DOI:10.1175/MWR-D-18-0187.1

Ravuri S, Lenc K, Willson M, et al, 2021. Skilful precipitation nowcasting using deep generative models of radar[J]. Nature, 597(7878): 672-677. DOI:10.1038/s41586-021-03854-z

Roberts N, Ayliffe B, Evans G, et al, 2023. IMPROVER: the new probabilistic postprocessing system at the Met Office[J]. Bull Amer Meteor Soc, 104(3): E680-E697. DOI:10.1175/BAMS-D-21-0273.1

Ronneberger O, Fischer P, Brox T, 2015. U-Net: convolutional networks for biomedical image segmentation[C]//Proceedings of 18th International Conference on Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015. Munich: Springer: 234-241.

Schulz B, Lerch S, 2022. Machine learning methods for postprocessing ensemble forecasts of wind gusts: a systematic comparison[J]. Mon Wea Rev, 150(1): 235-257. DOI:10.1175/MWR-D-21-0150.1

Shi X J, Chen Z R, Wang H, et al, 2015. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[C]//Proceedings of the 29th International Conference on Neural Information Processing Systems - Volume 1. Montreal: MIT Press: 802-810.

Sønderby C K, Espeholt L, Heek J, et al, 2020. MetNet: a neural weather model for precipitation forecasting[J]. arXiv preprint arXiv: 2003.12140.

Stengel K, Glaws A, Hettinger D, et al, 2020. Adversarial super-resolution of climatological wind and solar data[J]. Proc Natl Acad Sci, 117(29): 16805-16815. DOI:10.1073/pnas.1918964117

Tran Q K, Song S K, 2019. Computer vision in precipitation nowcasting: Applying image quality assessment metrics for training deep neural networks[J]. Atmosphere, 10(5): 244. DOI:10.3390/atmos10050244

Vandal T, Kodra E, Ganguly S, et al, 2017. DeepSD: generating high resolution climate change projections through single image super-resolution[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Halifax: Association for Computing Machinery: 1663-1672.

Vannitsem S, Bremnes J B, Demaeyer J, et al, 2021. Statistical postprocessing for weather forecasts: review, challenges, and avenues in a big data world[J]. Bull Amer Meteor Soc, 102(3): E681-E699. DOI:10.1175/BAMS-D-19-0308.1

Wang F, Tian D, Carroll M, 2023. Customized deep learning for precipitation bias correction and downscaling[J]. Geosc Model Dev, 16(2): 535-556. DOI:10.5194/gmd-16-535-2023

Wang L, Wan B C, Zhou S H, et al, 2023. Forecasting tropical cyclone tracks in the northwestern Pacific based on a deep-learning model[J]. Geosci Model Dev, 16(8): 2167-2179. DOI:10.5194/gmd-16-2167-2023

Wang Y B, Gao Z F, Long M S, 2018. PredRNN++: towards a resolution of the deep-in-time dilemma in spatiotemporal predictive learning[C]//Proceedings of the 35th International Conference on Machine Learning. PMLR: 5123-5132.

Wang Y B, Long M S, Wang J M, et al, 2017. PredRNN: recurrent neural networks for predictive learning using spatiotemporal LSTMs[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach: Curran Associates Inc: 879-888.

Wu B Q, Chen W Q, Wang W W, et al, 2024. WeatherGNN: exploit-ing meteo- and spatial-dependencies for local numerical weather prediction bias-correction[C]//Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence. IJCAI: 2433-2441.

Wu H X, Yao Z Y, Wang J M, 2021. MotionRNN: a flexible model for video prediction with spacetime-varying motions[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Nashville: IEEE: 15430-15439.

Yang X, Dai K, Zhu Y J, 2023. Calibration of gridded wind speed forecasts based on deep learning[J]. J Meteor Res, 37(6): 757-774. DOI:10.1007/s13351-023-3001-1

Yao Z Y, Wang Y B, Wu H X, et al, 2023. ModeRNN: Harnessing spatiotemporal mode collapse in unsupervised predictive learning[J]. IEEE Trans Pattern Anal Mach Intell, 45(11): 13281-13296.

Zhang Y C, Long M S, Chen K Y, et al, 2023. Skilful nowcasting of extreme precipitation with NowcastNet[J]. Nature, 619(7970): 526-532. DOI:10.1038/s41586-023-06184-4

Zhou G B, Xu J, Qian Q F, et al, 2022. Discriminating technique of typhoon rapid intensification trend based on artificial intelligence[J]. Atmosphere, 13(3): 448. DOI:10.3390/atmos13030448

Zhou K H, Zheng Y G, Dong W S, et al, 2020. A deep learning network for cloud-to-ground lightning nowcasting with multisource data[J]. J Atmos Ocean Technol, 37(5): 927-942. DOI:10.1175/JTECH-D-19-0146.1