快速检索
  气象   2025, Vol. 51 Issue (12): 1645-1655.  DOI: 10.7519/j.issn.1000-0526.2025.071101

技术交流

引用本文 [复制中英文]

李明, 谌芸, 曹恒煜, 等, 2025. 基于序列融合编码器的冬季降水相态深度学习预报模型研究[J]. 气象, 51(12): 1645-1655. DOI: 10.7519/j.issn.1000-0526.2025.071101.
[复制中文]
LI Ming, CHEN Yun, CAO Hengyu, et al, 2025. Deep Learning Prediction Model for Winter Precipitation Phase Based on Sequential Fusion Encoder[J]. Meteorological Monthly, 51(12): 1645-1655. DOI: 10.7519/j.issn.1000-0526.2025.071101.
[复制英文]

资助项目

国家重点研发计划(2023YFC3007502)、中国气象局2025年湖北复盘专项(FPZJ2025-082)、武汉气象科技联合项目(2024020901030453、2024020901030454)共同资助

第一作者

李明, 主要从事天气预报及城市气象服务工作.E-mail: whleem@outlook.com

通讯作者

谌芸, 主要从事中尺度天气研究.E-mail: chenyun@cma.gov.cn.

文章历史

2024年9月25日收稿
2025年7月11日收修定稿
基于序列融合编码器的冬季降水相态深度学习预报模型研究
李明 1,2, 谌芸 2, 曹恒煜 1, 尹常红 3, 姚望玲 1, 王义琴 3    
1. 武汉市气象台, 武汉 430040
2. 国家气象中心, 北京 100081
3. 武汉国家基本气象观测站, 武汉 430040
摘要:本文构建了一种基于序列融合编码器的深度学习模型, 用于冬季降水相态预报。该模型整合卷积神经网络、卷积门控循环单元和Transformer的优势, 可自动学习和提取气象数据中的复杂特征, 处理非线性关系及大规模数据集。采用2010—2024年武汉站逐小时降水观测和ERA5再分析数据, 选取9层(1000~500 hPa)气温、位势高度等60个通道格点数据作为预报因子, 通过分钟数据增强(雨30 min、雨夹雪1 min、雪5 min间隔重采样)解决样本不平衡问题, 最终获得19 932个样本。试验结果显示, 模型对固态降水(雪、雨夹雪)预报性能优异, 训练集F1分数达0.92~0.93, 验证集为0.67~0.68, 但在降水相态快速转换时的识别能力有待增强。通过2024年2月两次复杂天气过程检验, 模型可作为数值预报补充, 为冬季降水相态智能预报提供高效方案, 提升台站预报能力。
关键词序列融合编码器    冬季降水相态预报    深度学习    数据增强    
Deep Learning Prediction Model for Winter Precipitation Phase Based on Sequential Fusion Encoder
LI Ming1,2, CHEN Yun2, CAO Hengyu1, YIN Changhong3, YAO Wangling1, WANG Yiqin3    
1. Wuhan Meteorological Observatory, Wuhan 430040;
2. National Meteorological Centre, Beijing 100081;
3. Wuhan National Basic Meteorological Station, Wuhan 430040
Abstract: This paper constructs a deep learning model based on the sequential fusion encoder (SFE) for forecasting winter precipitation phase. The model integrates the advantages of convolutional neural network (CNN), convolutional gated recurrent unit (ConvGRU), and Transformer. It can conduct automatic learning and extraction of complex features from meteorological data, handle non-linear relationships, and process large-scale datasets. We utilize hourly precipitation observation data from Wuhan Station in 2010-2024 and ERA5 reanalysis data, select 60-channel grid data (including temperature and geopotential height) from 9 atmospheric layers (1000-500 hPa) as predictors. To address sample imbalance, minute-level data augmentation is employed, involving resampling at intervals of 30 min for rain, 1 min for sleet, and 5 min for snow. Finally, a sample size of 19 932 is obtained. Test results show that this model performs excellently in forecasting solid precipitation (snow and sleet), with F1-scores of 0.92-0.93 in the training set and 0.67-0.68 in the validation set. However, its ability to identify rapid transitions between precipitation phases needs to be improved. Verified by two complex weather processes in February 2024, the model is found to be able to serve as a supplement to numerical prediction and provide an efficient solution for intelligent forecasting of winter precipitation phase, aiding in enhancing the forecasting capabilities of meteorological stations.
Key words: sequential fusion encoder    winter precipitation phase prediction    deep learning    data augmentation    
引言

降水相态的准确预报对于防灾减灾、农业生产规划、水资源管理及城市基础设施建设等具有至关重要的意义。特别是在冬季,降水相态的突然转变往往会给社会经济带来不可预见的影响,如2024年春节前后在湖北省发生的两次雨雪冰冻天气,其间频繁出现雨、雪、冻雨、冰粒等形式的降水相态转换(俞小鼎等,2024),低温雨雪冰冻天气导致道路结冰从而出现大范围交通瘫痪。因此,发展高效、精准的冬季降水相态预测技术,已成为气象科学和应用领域亟待解决的关键课题之一(赵俊虎等,2025)。

降水相态预报的传统方法主要依赖数值天气预报和统计学方法,根据实况和预报产品中地面至中、高层的气温、气压等要素的垂直分布判别降水相态的变化(仇会民等,2023)。Ahrens(2003)提出了“Top-Down Approach”降水相态分析法,其基本思路为:当大气环境已经具备了产生降水的基本条件时,通过从大气顶部开始,逐步追踪水汽凝结物的运动轨迹直至地面,可以有效地解析降水相态的演变过程。褚芸欣等(2023)进一步研究认为,气温低于-10℃的湿层、高于0℃的暖层及近地面冷层等关键层的高度和厚度是降水相态的决定因素。这些方法在实际应用中取得了一定的效果,但在面对复杂多变的天气系统时,其预报精度和时效性往往难以满足实际需求(徐红等,2023孙卉等,2024)。

近年来,随着人工智能技术的快速发展,机器学习在气象业务领域的应用日益广泛,如卷积神经网络(CNN)常用于处理卫星与雷达图像,以实现短期降水量及降水类型的预报(Shi et al,2015);循环神经网络(RNN)因具备内部记忆功能,能精准捕捉输入数据中的时间依赖关系,多用于时间序列等序列数据处理(LeCun et al,2015);Transformer模型也常用于时间序列数据处理,可有效提升长期天气预报的准确性(黄天文等,2024Vaswani et al,2017)。

单一模型在处理高维度时空数据时存在效率偏低的缺点。因此,构建能充分发挥各类模型的特点,精确提取多种气象要素时空特征的深度学习组合模型方法,已成为当前的研究热点之一(杨子幸,2023)。为有效捕捉降水相态数据中的时间依赖性与空间相关性,本文融合CNN、RNN及注意力机制等多种深度学习方法(Talatahari and Azizi, 2021Ravuri et al, 2021),尝试对降水相态数据进行更全面、深入的特征提取,以期探索一种更为精细的降水相态预报方法。

1 模型设计

本文基于深度学习技术,针对区域范围内长时段的气象观测数据,采用深度学习模型组合解析降水相态与气温、湿度、气压等气象要素之间复杂的非线性映射关系,从海量气象数据中学习并提取复杂特征,构建一种冬季降水相态预报模型(以下简称模型)。

1.1 结构设计

采用CNN提取输入数据目标格点及邻域的特征信息,以分析雨、雪、雨夹雪等不同降水相态下各气象要素在空间分布上可能存在的差异。通过卷积操作,CNN可以在一定程度上平滑各输入数据可能存在的噪声,减少异常值对分析结果的影响,从而更好地提取出有效特征。

在CNN的基础上,采用卷积门控循环单元(ConvGRU)增加时间序列分析能力(图 1)。GRU是RNN的变体,ConvGRU是将卷积操作与GRU机制相结合,通过更新门和重置门控制信息流动,在每个时间步上更新隐藏状态,提取输入数据在时间维度上的变化规律,如目标强度的连续变化、区域的移动等(林靖皓等,2020),为降水相态分析提供时间维度的信息支持。与传统RNN相比,ConvGRU在处理长期依赖关系时表现更优,可有效避免梯度消失或梯度爆炸问题。

图 1 卷积门控循环单元架构示意 Fig. 1 Schematic diagram of convolutional gated recurrent unit (ConvGRU) architecture

在上述基础上,模型还引入了Transformer模块(图 2)。Transformer中的多头注意力机制允许模型从不同的角度关注输入序列,计算每个位置与其他位置之间的关联程度,如影响系统的整体结构、降水空间分布等全局特征,对全局信息进行建模从而捕捉到局部降水的全局特征依赖关系(贺琳等,2021),为降水相态的分析提供更全面的视角。且Transformer具有良好的并行计算能力,可以在较短的时间内处理大量的数据,提高分析效率。

图 2 Transformer编码器架构示意 Fig. 2 Schematic diagram of the Transformer encoder architecture

以CNN、ConvGRU和Transformer三种模型的组合构成的序列融合编码器(SFE),通过与CNN提取的局部特征、ConvGRU学习的时间序列信息以及Transformer捕捉的全局信息相互融合,从气象要素的空间分布、随时间变化及相互作用等不同角度对数据进行处理分析,为降水相态分析提供更丰富、更全面的特征表示(申晋祥和鲍美英,2021)。

1.2 流程设计

模型结构及数据流向设计如图 3所示。

图 3 模型结构及数据流向设计 Fig. 3 Design of model architecture and data flow direction

(1) 输入数据准备

输入数据预期形状为(batch_size, seq_length, Input_Channel, Data_Height, Data_Width)。

(2) CNN处理

CNN通过二维卷积层、批量归一化层和最大池化层提取各输入二维气象要素场数据空间的深层特征:深度可分离卷积模块用以减少计算量和模型参数、降低计算复杂度,每个模块包含1个深度卷积和1个逐点卷积;多级卷积和池化层(kernel_size=3, padding=1,stride=2<MaxPool>)逐步升维提取特征;1×1卷积调整最终输出通道数以适配后续的ConvGRU输入要求。根据输入数据和硬件情况,设置batch_size=24,seq_length=1。

(3) ConvGRU处理

利用序列数据的时间维度组件对CNN提取的特征进行序列建模。ConvGRU堆叠多个ConvGRUCell构成循环单元,每个ConvGRUCell包含门控机制(更新门、重置门)来控制信息流,使用卷积操作代替全连接。主要参数设计为:隐藏状态维度与输入维度相同;小卷积核(kernel_size=3)以避免显著增加计算负担;2层堆叠(num_layers=2)避免导致梯度消失;采用Sigmoid激活函数将值压缩到[0, 1],控制前一时刻的状态对当前时刻状态的影响程度,以捕捉时间依赖关系。

(4) Transformer编码器

ConvGRU输出经过重塑和转置形状为(batch_ size,Height*Width,d_model=512),以输入Transformer编码器。Transformer编码器层的作用是进一步处理序列数据,将输入数据沿空间维度展平,通过适配层调整至d_model的大小,捕捉各输入因子之间的全局依赖关系。数据由6层堆叠的Transformer_Layers变换器编码层处理,每层包含多头注意力机制和前馈网络,其中前馈神经网络采用ReLU激活函数以增强模型的表达能力。每个Transformer编码器层在其多头注意力机制中使用Num_Heads(8)个头,并且具有FeedForward_Dim的前馈维度。Transformer编码器层使模型能够关注并理解序列中各预报因子之间的复杂关系。

(5) 重新塑造用于反卷积并输出

Transformer编码器之后,输出数据被重新塑形回2D张量,转置卷积(反卷积)层采用ReLU函数在特征图上采样回原始或期望的分辨率。最终输出具有Output_Channels个通道的图形或单点的分类计算结果。

模型使用多分类交叉熵损失函数。多分类交叉熵是深度学习中最常用的损失函数之一,尤其适用于处理具有多个类别的分类任务(Liu et al,2020)。根据数据和计算结果对上述过程中的各参数动态调整,并以Dropout_Rate的概率随机进行正则化以防止训练过程中的过拟合,同时利用反向传播算法,自动调整其参数以最小化预报误差,从而在预报冬季降水相态时展现出更高的精度和鲁棒性(戈苗苗等,2021)。

2 数据处理 2.1 数据来源

武汉国家基本气象观测站(以下简称武汉站)为武汉市代表站,2010年在武汉市东西湖区新址正式启用。根据观测统计,武汉站降雪历年初日平均为12月20日,终日为2月21日,年均降雪日数为9 d。本文选择2010—2023年1月、2月、12月及2024年1月、2月武汉站的逐月报表记录文件(以下简称A文件)和中国气象局地面气象站逐小时观测数据进行统计分析,两种数据互为补充订正,确保数据的准确和完整。

选择ERA5数据集提供的高分辨率气温、湿度、风速等气象要素,地理网格分辨率为0.25°×0.25°;地面结合使用ERA5-Land数据。ERA5-Land是ECMWF将模型数据与观测结果组合形成的全球陆地数据集,完整性和一致性更好,空间分辨率更高(0.1°×0.1°)。各数据的时间分辨率均为1 h;通过双线性插值方法对高分辨率数据进行下采样(Cho et al, 2014),实现空间分辨率适配(0.25°× 0.25°)。

2.2 数据预处理

对各数据进行标准化处理,使之适用于深度学习模型的输入要求。预处理主要包括三个步骤:(1)归一化,采用Min-Max归一化方法,将各气象要素映射至[0, 1]区间,消除不同量纲和数量级的影响,确保模型训练的稳定性和预报的准确性;(2)重编码,天气现象的编码需要转换为适合深度学习的格式,根据不同的降水相态,参考ECMWF(以下简称EC)相态实况制定相应的天气现象编码分类(表 1),以便模型能够正确识别和处理;(3)插值,为了填补数据缺失和实现空间数据的一致性,采用Cubic插值方法。这是一种三次样条插值,能够提供平滑且自然的曲线(赵鹤宇等,2022),特别适用于时间序列数据和需要保持数据连续性的情况(Pathak et al, 2018)。插值后的数据均转换为29.5°~31.5°N、113.5°~115.5°E范围内经、纬度均为0.01°间隔的格点数据,以匹配模型的输入要求。

表 1 不同降水相态对应的天气现象编码分类 Table 1 Weather codes corresponding to precipitation phase
2.3 检验方法

(1) 模型评价

采用准确率、召回率以及F1分数等评估指标来衡量模型性能。以模型预报结果与实际标签的比较,引入评估分类模型性能的基础概念:根据真正例(TP)、真负例(TN)、假正例(FP)、假负例(FN)计算得到模型评价指标(袁凯等,2022)(表 2)。

表 2 模型评价指标 Table 2 Model evaluation metrics

(2) 预报检验

因本文主要研究目的是提高固态降水相态变化预报识别能力,以更好地适应气象服务的实际工作需求,同时考虑到预报为小范围、逐小时/分钟预报的时空分辨率,表 2中模型评价指标并不能完全满足预报检验的需要,因此参考中国气象局短期天气预报评定标准,制定了模型相态预报评分标准(表 3)。

表 3 预报准确率评分标准 Table 3 Forecast verification scoring criteria compared to observations

按照表 3计算得到的得分之和除以预报样本数,即为预报得分,取值范围为[0, 1]。可分别计算分类、总体的预报得分,得分越接近1,说明预报准确率越高。与表 1相比,此评分标准中略降低了对类别2、3的判别要求,即预报为雨夹雪/雪,实况出现雪或雨夹雪,均判定为正确(得1分),这主要是由原始数据质量(A文件天气现象中部分时段有重叠)和气象服务实际工作需求所致。

3 预报因子选择

统计武汉市2010—2023年1月、2月、12月及2024年1月、2月的地面观测记录,按照武汉站冬季降雨、雨夹雪、雪三种类型进行统计分析。

3.1 气象要素特征分析

采用2010—2023年武汉站高空、地面观测资料,参考以往研究结果(陈双等,2019王珊珊等,2023),对各类降水相态在发生前、后及过程中的00:00、12:00(世界时,下同)地面到高空各层气温、湿度等观测数据进行统计分析,计算得到的武汉站冬季不同降水相态类型气象要素平均值见表 4

表 4 2010—2023年武汉站冬季不同降水相态气象要素各层特征值 Table 4 Statistical characteristics of meteorological elements at each level for winter precipitation phase at Wuhan Station during 2010-2023

表 4可知,雨日大气各层气温相对较高,雪日各层气温均为最低,除雨日外,其余相态中低层(850~ 700 hPa)均出现不同程度的逆温。雨夹雪和雪日500 hPa气温≤-16℃;雨日最高,为-14.3℃。雨日和雨夹雪日大气中低层相对湿度多在70%以上;但湿层(相对湿度≥80%)高度较低,且不深厚,伸展高度大多在3000 m左右;雪日大气相对湿度最小,除地面外,整层相对湿度均在70%以下,可能跟固态云水粒子表面饱和水汽压有关。

近地层到低层(850 hPa以下)位势高度明显不同于中高层分布,雨日的位势高度相对较低,雨夹雪和雪日则较高。地面2 m的气压也有上述特征。本站气压与地面天气系统密切相关,一般来说,武汉地区固态降水发生时,常与地面冷空气活动有关,因此地面和大气低层气温较低,气压较高。

3.2 预报因子确定

对于冬季降水相态的预报研究,漆梁波和张瑛(2012)总结了一套适合中国东部的冬季降水相态识别判据,主要以1000~700 hPa各固定层位势高度和气温之间的差别作为判断条件,设定雨雪区分阈值。王珊珊等(2022)使用地面以上至400 hPa附近各层的位势高度、气温、湿度等数据,利用机器学习算法对长江中游冬季降水相态预报方法进行研究,也取得了较好的效果。而陈媛等(2024)通过对西南地区一次典型雨雪冰冻复合极端灾害天气事件的环流特征及降水相态差异分析发现,雨雪区和冰冻区的温度层结和垂直速度存在差异,降雪区以弱的向上正浮力为主要特征,降雨(冻雨)区上空的浮力在向下的扰动气压梯度力和向上浮力相互平衡作用下,大气中低层垂直运动变化较小。

本文选取ERA5数据集中的60个通道格点数据作为预报因子输入,包括1000、950、925、900、850、800、700、600、500 hPa 9个层次的气温、位势高度、比湿、风向、风速、垂直速度等高空气象因子,及海平面气压,2 m气温、相对湿度、露点温度、风向和风速等地面因子(杨旗等,2024)。这些预报因子覆盖了大气垂直剖面的多个层次,能体现降水相态分析预报方法所涉及的关键气象条件特征。

4 模型建立 4.1 样本选取和数据增强

选取2010—2023年每年的1月、2月、12月和2024年1月、2月武汉站逐小时降水天气现象观测资料,在共31 767个样本中,雨、雨夹雪、雪样本数分别为2434、82、346个,各样本数量显示数据集存在着明显的数据失衡。

定义武汉站月报表A文件中W0段天气现象记录时间段为一个降水阶段,统计武汉站此期间雨、雨夹雪、雪的出现次数分别为1310、120、143次,各降水阶段平均持续时长分别为78.3、27.9、137.1 min,采用以下方法实现数据增强。

(1) 根据24 h雨量R24>0.0 mm或A文件中有降水时间段记录,选择394个降水日00:00—23:00的逐小时数据(简称小时数据)形成初始样本序列。

(2) 按A文件中天气现象记录起止时间,以雨30 min、雨夹雪1 min、雪5 min(简称分钟数据)的时间间隔进行重新采样(重点对雨夹雪、雪两种相态进行数据增强)。记录时段小于时间间隔的,将该降水记到最近的一个采样时间点,补充到降水相态时间序列。如分钟数据与小时数据有冲突,以分钟数据为准;天气现象时段有重叠的,取表 1中较高类别记录。

(3) 采用三次样条方法对ERA5再分析资料各要素进行插值,得到上述样本对应时次地面、高空要素预报因子的格点场。

需要说明的是,由于观测规范调整,2012年2月以后A文件W0段中无当日12:00至次日00:00天气现象记录,因此2012年以后的样本没有得到相应时段的数据增强。

经以上步骤最终得到样本数为19 932个,其中无雨、雨、雨夹雪、雪的样本数分别为6123、6421、3183、4205个,占比分别为30.7%、32.2%、16.0%、21.1%。各样本数比例分布如图 4所示。由图 4可见,数据增强处理明显增加了雨、雨夹雪和雪类别的样本数,各类别样本数占比趋于平衡,且数据重复率在0.5%以下。

图 4 数据增强前后样本数量比例分布 Fig. 4 Distribution of sample percentages before and after data augmentation
4.2 训练与验证

以武汉站地理坐标为中心,在XY轴方向选取±32个格点组成64个×64个空间格点数据。考虑到输入数据时间分辨率为1 min~1 h,此空间范围应能足够表现天气影响时间范围内目标点周边地面和高空气象要素空间分布特征。

因19 932个样本的时间不完全连续,故设时间步长Time_Step=1,以80%:20%比例生成训练集和验证集,输入模型进行训练和验证得到的准确率为0.86,其他指标情况列于表 5

表 5 模型训练和验证结果 Table 5 Model training and validation results

表 5可知,模型平均准确率达到了0.85,表明模型在预报降水形态时具有较好的可靠性。细化到具体相态,对于类别2(雨夹雪)和类别3(雪),模型的准确率与召回率均达到0.90以上,对应的F1位于0.92~0.93。这一结果显示模型在识别这两种类型时的预报准确性高而且几乎无遗漏的特点。表 5显示模型在验证集上各指标均明显低于训练集10%~20%,表明模型的泛化能力还需提高。

使用主成分分析(PCA)等方法对二维要素场进行降维处理后,采用随机森林(RF)等机器学习模型进行分析和预测也是常用的单点要素预报方法(PCA-RF方法)(何恩业等,2023)。结果显示(表略),PCA-RF方法在训练集上各指标较模型得分略高4%~7%,但在验证集上不仅显著低于训练集,而且明显低于模型的验证集得分。

相对于以小时数据为基础,采用SMOTE(synthetic minority oversampling technique)等解决数据不平衡问题(Rajakumar and Devi, 2024)的方法,模型对相同时段逐小时数据训练及验证的结果显示,无雨准确率为0.91,有雨准确率略有上升为0.80,但雨夹雪、雪的准确率分别显著下降到0.53、0.47。这说明本文采用的以分钟数据进行数据增强的方法,时间间隔短,过采样得到的样本具有更好的真实性,有效增强了模型对少数类别样本的识别能力;采用本文方法生成的格点时间序列数据,避免了简单插值形成大量重复数据的情况,提高了模型的整体泛化能力并降低过拟合的风险,能够更好地满足降水相态预报分析的需要。

同时也可看到,对于标记为类别0(无雨),模型的准确率和召回率分别为0.78与0.75,类别1(雨)的准确率和召回率均为0.79。这表明在处理这两类相态时,模型虽能做出相对正确的判定,但存在一定程度的不确定性。考虑到表 1中降雨类别中包含了天气观测记录中的毛毛雨、冻雨等多种天气现象,相较于EC降水实况分类多达12类,本文所使用的样本质量和数量尚不足以支撑更为精细的降雨分类标准,从而导致模型难以更进一步深入分析数据内在复杂性。

5 典型个例检验及分析 5.1 天气形势

2024年2月1—6日,受高空低槽、中低层切变线和地面冷空气南下影响,武汉市出现了明显降雪、降温天气过程;3日00:00,850 hPa以下北风逐渐减弱,850 hPa以上的湿层逐渐变得深厚。至3日12:00,武汉市上空850~700 hPa附近存在明显的逆温层,整层气温均在0℃以下。850~700 hPa西南急流发展(图 5a)建立了水汽通道,800 hPa急流中心风速达20 m·s-1;武汉市处于急流出口的左侧;冷空气继续南下,地面偏北风(图 5b)使低层冷垫逐渐增厚,导致出现大范围降雪。

图 5 2024年2月(a,b)3日00:00和(c,d)21日00:00(a, c)850 hPa位势高度(等值线,单位: gpm)、800 hPa风场(风羽)、850 hPa比湿(填色) 及(b,d) 海平面气压(等值线,单位:hPa)、10 m风场(风羽)、2 m气温(填色) 注:红圈为武汉站。 Fig. 5 (a, c) Geopotential height at 850 hPa (contour, unit: gpm), wind field at 800 hPa (barb) and specific humidity at 850 hPa (colored) and (b, d) sea-level pressure (contour, unit: hPa), 10 m wind field (barb) and 2 m temperature (colored) at (a, b) 00:00 UTC 3 and (c, d) 00:00 UTC 21 February 2024

2024年2月19日00:00至25日00:00,受地面强冷空气、高空波动、中低层切变线和西南急流影响,武汉市又出现了一次强寒潮大风、强对流和持续性低温雨雪冰冻天气过程。21日00:00,随着850 hPa上0℃线南压至江汉平原—鄂东一带,925 hPa气温降至-6℃,但700 hPa一直在3℃左右,融化层始终存在,随着0℃线继续向南推进,融化层厚度出现变化,期间也出现了含冰粒的雨夹雪。21日开始中低层急流南压(图 5c),武汉市位于急流左侧和850 hPa切变线附近。由于北方不断有冷空气补充南下(图 5d),武汉市一直处于冷舌范围,21日晚冷空气强度相对较强,21—22日也是此轮大到暴雪过程的最强时段。强冷空气南下和发展旺盛的中低层暖湿气流共同导致两次过程中均出现雨雪相态频繁转换情况,其中以3日和21日两天降水相态最为复杂。

5.2 预报检验

采用中国气象局下发的逐日地面、高空实况数据,结合EC每日12:00细网格产品中未来24 h逐小时的气象要素场数据,用前述插值方法生成输入数据,对2024年2月3日、21日00:00—12:00降水资料分别进行检验,以武汉站对应的观测数据作为对比。

天气现象观测记录显示,3日00:00—12:00,在00:00—02:19期间出现持续降雪,后续在02:00、03:00、04:00、05:00、07:00、08:00、11:00分别出现了7段降雪过程,但持续时间均较短,仅为1~9 min;雨夹雪分别在01:00、04:00、08:00出现了3段,持续时间为3~9 min;其间夹杂出现5段降雨过程,每段时长为1~41 min。21日09:51—10:11出现持续降雪,另外在00:00、02:00、03:00、06:00出现短时降雪,持续时间1~6 min;雨夹雪在00:00、03:00、09:00—10:00出现了3段,其中09:00—10:00的记录与降雪事件记录部分重叠;00:00—01:00、10:00出现间断降雨,02:22—03:00出现毛毛雨。两日降水相态实况与预报对比见图 6

图 6 武汉站2024年2月(a)3日、(b)21日00:00—12:00降水相态实况与预报对比 Fig. 6 Comparison of observed and forecast precipitation phase from 00:00 UTC to 12:00 UTC on (a) 3 and (b) 21 February 2024 at Wuhan Station

模型在两个预报时段的精确率分别为0.73、0.76,预报评分为0.75、0.77。与此相对应,3日EC预报结论为武汉站的降水相态均为雪,未能准确反映出复杂相态转换过程;且预报降水中心强度和落区均出现了偏差。21日EC较为准确预报了00:00适宜降雨(冻雨)的温度廓线以及转雨的时间,但对后续的雨夹雪、雪的预报有错误。在两个检验时段中本模型对连续降水的相态预报结论与实况基本匹配,表明模型在预报降雪时具有较好的准确性。

对于较长时间的稳定性降雪过程来说,如武汉站4日00:00—12:00均以降雪为主,其间仅有09:48—10:03、09:52—09:59短暂出现雨夹雪、雨,本模型和2024年2月4日00:00起报的EC逐3 h降水相态预报产品的结论均为降雪,未能准确区分其中短时相态的变化。

检验阶段模型总体得分不高,相较训练验证得分有明显下降。主要是模型高度依赖数值产品对天气形势和气象要素场预报,数值模式对天气系统描述的精准程度直接影响模型预报准确率。对比实况来看,EC对3日700 hPa、500 hPa的高空低槽、中低层切变线等影响系统预报的定位往西、北方向偏差(图略),导致强降水中心落区预报较实况偏西北。对于20—21日的降水(图略),EC预报500 hPa高度场低槽偏强;预报700 hPa急流中心风速达20 m·s-1,实际风速为16 m·s-1;预报武汉站附近850 hPa气温较实况偏低。

此外,模型对短时的相态快速转变时段识别能力不足。从天气现象记录中可以看到,3日、21日均有多次持续时长不到10 min的短时降雪、雨夹雪阶段,这些记录在小时数据中无法体现,样本时间精度不足可能是以往以小时数据为对象的研究难以有效提高准确率的主要原因。比较而言,本模型对短时降水过程有一定的识别能力,只是在起止时间上有一定的偏差,说明模型对短时降雪和相态转换时间点的预报存在局限性,泛化能力有待进一步提高。综上所述,本模型方法适用于采用分钟观测数据,对数值产品降水相态预报进行补充和订正。

6 结论及讨论

本文构建了一种基于SFE的深度学习模型,其利用CNN空间感知能力、ConvGRU时间序列处理能力、Transformer注意力机制和并行计算优势,能够从气象要素的空间分布、随时间变化及要素间的相互作用等不同角度进行分析。同时由于模型使用二维卷积层,有效提取气象要素的空间分布、时间变化及全局关联特征,显著提升了对雪和雨夹雪等固态降水的预报精度。验证集中F1分数分别达0.68和0.67,优于传统单一模型及PCA-RF方法。

降雪对于武汉地区来说为小概率事件。针对样本偏少、数据不平衡的情况,在2010—2024年冬季武汉市逐小时降水天气现象观测资料和ERA5的基础上,采用武汉站人工观测的天气现象记录,分别以30、1、5 min的时间间隔对雨、雨夹雪、雪的降水资料进行过采样。经过模型训练和验证结果表明,这种数据增强处理有效克服了数据不平衡问题,明显提升了模型预报性能。对于冬季降水相态预报,使用分钟数据虽然提高了计算量和预报难度,对观测数据也提出了更高的要求,但分钟数据时间间隔短,气象要素时空分布特征影响更为显著,用于武汉站降水相态的数值预报和机器学习中较小时数据应更为有效。

通过对2024年2月3日、21日00:00—12:00武汉两次天气过程的检验分析,模型也表现出了一定的局限性:模型对降水相态快速转换(如持续时长 < 10 min的短时相态转换)的识别能力不足,起止时间预报存在偏差;且高度依赖数值模式的气象要素场输入,数值模式的偏差会直接影响预报准确性。

本文通过整合多源数据与深度学习技术构建深度学习组合模型,可作为数值预报的补充,提升定点短时预报精度,为各级气象台站开展冬季雨雪相态变化预报提供了一种切实可行的思路和方法。未来需结合更高分辨率的分钟观测(如激光云雷达等新型观测资料)和相应高时空分辨率的数值预报产品,优化三维卷积架构,进一步提高模型泛化能力和对快速相态转换的捕捉能力。

参考文献
陈双, 谌芸, 何立富, 等, 2019. 我国中东部平原地区临界气温条件下降水相态判别分析[J]. 气象, 45(8): 1037-1051. Chen S, Chen Y, He L F, et al, 2019. Discrimination analysis of snow and rain occurring under critical temperature conditions in central and eastern China[J]. Meteor Mon, 45(8): 1037-1051 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.08.001
陈媛, 周玉淑, 杨帅, 等, 2024. 西南地区一次典型冰冻雨雪复合极端灾害天气事件的环流特征及降水相态差异分析[J]. 大气科学, 48(2): 417-430. Chen Y, Zhou Y S, Yang S, et al, 2024. Analysis of circulation characteristics and precipitation phase difference during an extreme freezing rain and snow weather event in Southwest China[J]. Chin J Atmos Sci, 48(2): 417-430 (in Chinese).
褚芸欣, 吴妮晏, 赵清越, 2023. "Top-Down-Approach"降水相态分析法在双流机场一次降雪过程中的应用[J]. 高原山地气象研究, 43(4): 146-150. Chu Y X, Wu N Y, Zhao Q Y, 2023. Application of "Top-Down-Approach" precipitation phase analysis method on a snowfall process at Shuangliu Airport[J]. Plateau Mountain Meteor Res, 43(4): 146-150 (in Chinese).
戈苗苗, 陆振宇, 梁邵阳, 等, 2021. 基于改进双阶段注意力机制的降水智能预报[J]. 南京信息工程大学学报(自然科学版), 13(6): 744-752. Ge M M, Lu Z Y, Liang S Y, et al, 2021. Intelligent precipitation forecast based on improved dual-stage attention mechanism[J]. J Nanjing Univ Inform Sci Technol (Nat Sci Ed), 13(6): 744-752 (in Chinese).
何恩业, 李琼, 张聿柏, 等, 2023. 基于PCA-BP特征工程的近海单点海温预报技术及应用[J]. 海洋预报, 40(3): 35-44. He E Y, Li Q, Zhang Y B, et al, 2023. Technology and application of offshore SST prediction based on PCA-BP feature engineering[J]. Marin Forec, 40(3): 35-44 (in Chinese).
贺琳, 张雨, 巴韩飞, 2021. 基于注意力机制和深度学习模型的外来海洋生物命名实体识别[J]. 大连海洋大学学报, 36(3): 503-509. He L, Zhang Y, Ba H F, 2021. Named entity recognition of exotic marine organisms based on attention mechanism and deep learning network[J]. J Dalian Ocean Univ, 36(3): 503-509 (in Chinese).
黄天文, 焦飞, 伍志方, 2024. 一种基于迁移学习和长短期记忆神经网络的降水预报方法[J]. 暴雨灾害, 43(1): 45-53. Huang T W, Jiao F, Wu Z F, 2024. A precipitation forecast method based on transfer learning and long short term memory[J]. Torr Rain Dis, 43(1): 45-53 (in Chinese).
林靖皓, 秦亮曦, 苏永秀, 等, 2020. 基于自注意力机制的双向门控循环单元和卷积神经网络的芒果产量预测[J]. 计算机应用, 40(S1): 51-55. Lin J H, Qin L X, Su Y X, et al, 2020. Prediction of mango yield based on self-attention CNN and bidirectional GRU[J]. J Comput Appl, 40(S1): 51-55 (in Chinese).
漆梁波, 张瑛, 2012. 中国东部地区冬季降水相态的识别判据研究[J]. 气象, 38(1): 96-102. Qi L B, Zhang Y, 2012. Research on winter precipitation types' discrimination criterion in eastern China[J]. Meteor Mon, 38(1): 96-102 (in Chinese).
仇会民, 万瑜, 张仕明, 等, 2023. 新疆巴州北部冬半年降水相态气象因子特征和判识指标分析[J]. 干旱区地理, 46(4): 563-573. Qiu H M, Wan Y, Zhang S M, et al, 2023. Meteorological factor characteristic and index of precipitation types during winter half year northern Bayingol Prefecture of Xinjiang[J]. Arid Land Geogr, 46(4): 563-573 (in Chinese).
申晋祥, 鲍美英, 2021. 基于注意力机制的深度学习推荐算法[J]. 计算机系统应用, 30(6): 220-225. Shen J X, Bao M Y, 2021. Deep learning recommendation algorithm based on attention mechanism[J]. Comput Syst Appl, 30(6): 220-225 (in Chinese).
孙卉, 吴语燕, 宣普, 等, 2024. 池州地区冬季固态降水相态判别指标研究[J]. 气象与环境科学, 47(2): 9-15. Sun H, Wu Y Y, Xuan P, et al, 2024. Study on phase discrimination index of winter solid precipitation in Chizhou, Anhui Province[J]. Meteor Environ Sci, 47(2): 9-15 (in Chinese).
王珊珊, 雷彦森, 方鸿斌, 等, 2022. 基于CatBoost算法的长江中游冬季降水相态预报方法研究[J]. 气象, 48(9): 1153-1161. Wang S S, Lei Y S, Fang H B, et al, 2022. Method of winter precipitation type prediction in the middle reaches of the Yangtze River based on CatBoost algorithm[J]. Meteor Mon, 48(9): 1153-1161 (in Chinese). DOI:10.7519/j.issn.1000-0526.2022.041301
王珊珊, 钟敏, 陈璇, 等, 2023. 2022年湖北省两次雨雪过程对比及预报偏差分析[J]. 气象, 49(7): 819-829. Wang S S, Zhong M, Chen X, et al, 2023. Comparison and forecast deviation analysis of two snow and rain events in Hubei Province in 2022[J]. Meteor Mon, 49(7): 819-829 (in Chinese). DOI:10.7519/j.issn.1000-0526.2023.062001
徐红, 房一禾, 陈军庆, 等, 2023. 辽宁地区雨雪转换天气的判别和分析[J]. 气象科学, 43(2): 262-269. Xu H, Fang Y H, Chen J Q, et al, 2023. Research on discrimination criterion and analysis of rain-snow weather in Liaoning[J]. J Meteor Sci, 43(2): 262-269 (in Chinese).
杨旗, 张海鹏, 吴建蓉, 等, 2024. 对冬季云贵—华南准静止锋上一次多相态降水过程的模拟研究[J]. 干旱气象, 42(1): 75-83, 106. Yang Q, Zhang H P, Wu J R, et al, 2024. Simulation of a multi-phase precipitation process over Yungui-Huanan quasi-station-ary front in winter[J]. J Arid Meteor, 42(1): 75-83, 106 (in Chinese).
杨子幸, 2023. 基于混合CNN-BiLSTM-AM模型的短期风电功率预测研究[D]. 北京: 北京交通大学. Yang Z X, 2023. Research on short-term wind power prediction based on hybrid CNN-BiLSTM-AM model[D]. Beijing: Beijing Jiaotong University(in Chinese).
俞小鼎, 费海燕, 王秀明, 2024. 2024年2月17—23日中国大范围强寒潮雨雪冰冻强对流过程涉及的若干问题[J]. 气象, 50(9): 1033-1042. Yu X D, Fei H Y, Wang X M, 2024. Some issues concerning the large area rainstorm, snowstorm, sleet, freezing rain and severe convection event over China from 17 to 23 February 2024[J]. Meteor Mon, 50(9): 1033-1042 (in Chinese). DOI:10.7519/j.issn.1000-0526.2024.080902
袁凯, 李武阶, 李明, 等, 2022. 四种机器深度学习算法对武汉地区雷达回波临近预报的检验和评估[J]. 气象, 48(4): 428-441. Yuan K, Li W J, Li M, et al, 2022. Examination and evaluation of four machine deep learning algorithms for radar echo nowcasting in Wuhan Region[J]. Meteor Mon, 48(4): 428-441 (in Chinese). DOI:10.7519/j.issn.1000-0526.2021.102001
赵鹤宇, 樊立艳, 常锦才, 2022. 基于三次样条基函数的模糊数据插值[J]. 华北理工大学学报(自然科学版), 44(4): 68-79. Zhao H Y, Fan L Y, Chang J C, 2022. Fuzzy data interpolation based cubic spline basis function[J]. J North China Univ Sci Techn (Natural Science Edition), 44(4): 68-79 (in Chinese).
赵俊虎, 赵语欣, 贾小龙, 等, 2025. 2024年2月华东和华中大范围低温雨雪冰冻灾害的成因和可预报性分析[J]. 气象, 51(1): 17-29. Zhao J H, Zhao Y X, Jia X L, et al, 2025. Causes and predictability of the high-impact large-scale cryogenic freezing rain and snow weather in East China and Central China in February 2024[J]. Meteor Mon, 51(1): 17-29 (in Chinese).
Ahrens C D, 2003. Meteorology Today: An Introduction to Weather, Climate, and the Environment[M]. Australia: Brooks/Cole..
Cho K, van Merriёnboer B, Gulcehre C, et al, 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha: Association for Computational Linguistics: 1724-1734.
LeCun Y, Bengio Y, Hinton G, 2015. Deep learning[J]. Nature, 521(7553): 436-444. DOI:10.1038/nature14539
Liu J L, Sun Y F, Han C C, et al, 2020. Deep representation learning on long-tailed data: a learnable embedding augmentation perspective[C]//Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE: 2967-2976.
Pathak J, Hunt B, Girvan M, et al, 2018. Model-free prediction of large spatiotemporally chaotic systems from data: a reservoir computing approach[J]. Phys Rev Lett, 120(2): 024102. DOI:10.1103/PhysRevLett.120.024102
Rajakumar R, Devi S S, 2024. An efficient modelling of oversampling with optimal deep learning enabled anomaly detection in streaming data[J]. China Commun, 21(5): 249-260. DOI:10.23919/JCC.ja.2022-0592
Ravuri S, Lenc K, Willson M, el al, 2021. Skillful precipitation nowcasting using deep generative models of radar[J]. Nature, 597(7878): 672-677. DOI:10.1038/s41586-021-03854-z
Shi X J, Chen Z R, Wang H, et al, 2015. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[C]//Proceedings of the 29th International Conference on Neural Information Processing Systems. Montreal: MIT Press: 802-810.
Talatahari S, Azizi M, 2021. Chaos Game Optimization: a novel metaheuristic algorithm[J]. Artif Intell Rev, 54(2): 917-1004. DOI:10.1007/s10462-020-09867-w
Vaswani A, Shazeer N, Parmar N, et al, 2017. Attention is all you need[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach: Curran Associates Inc. : 6000-6010.