快速检索
  气象   2024, Vol. 50 Issue (12): 1531-1541.  DOI: 10.7519/j.issn.1000-0526.2024.041101

论文

引用本文 [复制中英文]

渠鸿宇, 董林, 马新野, 等, 2024. 基于XGBoost的西北太平洋台风快速增强预报模型[J]. 气象, 50(12): 1531-1541. DOI: 10.7519/j.issn.1000-0526.2024.041101.
[复制中文]
QU Hongyu, DONG Lin, MA Xinye, et al, 2024. Forecast Model of Northwest Pacific Typhoon Rapid Intensification Based on XGBoost[J]. Meteorological Monthly, 50(12): 1531-1541. DOI: 10.7519/j.issn.1000-0526.2024.041101.
[复制英文]

资助项目

国家重点研发计划(2023YFC3107902)、中国气象局创新发展专项研发项目(CXFZ2024J006)共同资助

第一作者

渠鸿宇,主要从事台风与海洋气象预报及研究. E-mail: quhy@cma.gov.cn

通讯作者

董林,主要从事台风预报及研究. E-mail: donglin@cma.gov.cn.

文章历史

2024年2月5日收稿
2024年8月14日收修定稿
基于XGBoost的西北太平洋台风快速增强预报模型
渠鸿宇 1, 董林 1, 马新野 2, 向纯怡 1, 黄奕武 1    
1. 国家气象中心,北京 100081
2. 中科星图维天信科技股份有限公司,北京 101399
摘要:台风强度预报,特别是台风快速增强(rapid intensification, RI)预报仍是目前台风预报中非常棘手的问题。基于XGBoost模型,利用2015—2020年NCEP GFS分析和预报数据以及IBTrACS数据分别构建了西北太平洋台风未来24 h的RI预报模型(FM)和预报订正模型(FCM)。通过对FM进行预报因子贡献分析发现,对模型预报影响最大的5个因子依次为台风丰满度、200 hPa平均温度、过去6 h的强度变化、潜势强度和200 hPa平均散度。利用2021—2022年数据对模型进行独立检验,结果表明:FM在利用分析数据测试时,具有较高的准确度,漏报率(FNR)、空报率(FPR)和TS分别为0.25、0.24和0.32。但由于预报因子预报误差的影响,使得FM在实时预报中的性能下降(FNR、FPR和TS分别为0.32、0.26和0.27),而使用预报数据构建的FCM则可以通过学习预报误差进行有效订正,从而有效减小预报误差的影响。FCM在实时预报检验中的FNR、FPR和TS分别为0.28、0.25和0.30,相较FM,FNR和FPR分别降低了0.04和0.01,TS提升了0.03。FCM方便易用,可为台风强度和台风RI的实时预报提供参考。
关键词台风    快速增强(RI)    XGBoost    台风强度    
Forecast Model of Northwest Pacific Typhoon Rapid Intensification Based on XGBoost
QU Hongyu1, DONG Lin1, MA Xinye2, XIANG Chunyi1, HUANG Yiwu1    
1. National Meteorological Centre, Beijing 100081;
2. Zhongke Xingtuwei Tianxin Technology Co. Ltd., Beijng 101399
Abstract: The forecast of typhoon intensity, especially the rapid intensification (RI) forecast, is still a very challenging difficulty in current typhoon forecasting. Based on the XGBoost model, this article uses the NCEP GFS analysis and forecast data in 2015-2020, and IBTrACS data to construct RI forecast model (FM) and forecast correction model (FCM) for typhoons in the Northwest Pacific 24 h in advance. Through predictor contribution analysis of the FM, we have found that the five factors that have the greatest impact on model forecasts are typhoon abundance, average temperature at 200 hPa, intensity changes over the past 6 h, potential intensity, and average divergence at 200 hPa. The model is independently tested with the data in 2021-2022, and the results show that the FM has higher accuracy when tested by analytical data, with false negative rate (FNR), false positive rate (FPR) and threat score (TS) being 0.25, 0.24 and 0.32, respectively. However, due to the influence of forecast errors caused by forecast factors, the performance of FM in real-time forecasting decreases (FNR, FPR and TS are 0.32, 0.26 and 0.27, respectively). The FCM constructed based on forecast data can effectively correct the forecast errors by learning them, thereby reducing the impact of forecast errors. The FNR, FPR and TS of the FCM in real-time forecasting tests are 0.28, 0.25 and 0.30, respectively; compared with the FM, the FNR and FPR are reduced by 0.04 and 0.01, but the TS rises by 0.03. Thus, the FCM is convenient and easy to use, and can provide reference for real-time forecasting of typhoon intensity and typhoon RI.
Key words: typhoon    rapid intensification (RI)    XGBoost    typhoon intensity    
引言

我国位于亚洲东南部,紧邻西北太平洋,拥有狭长的海岸线,是全球受台风(全文台风泛指所有海域的热带气旋)影响最严重的国家之一,平均每年有7个台风登陆我国(端义宏等, 2012)。这些台风带来的狂风、暴雨、风暴潮以及其他次生灾害,严重威胁着我国沿海省份的生命和财产安全。因此,台风的防灾减灾工作尤为重要,而准确的台风路径和强度预报是关键。

近年来,我国台风路径预报取得长足进步,已达到世界前列水平(许映龙等, 2010端义宏等,2020)。2021年中央气象台对西北太平洋及南海台风24 h预报时效的主观路径预报误差仅为76 km。相对于台风路径预报,台风强度预报技巧的提升较为缓慢,但也取得一定进步。2021年中央气象台24 h时效主观强度预报平均误差为3.6 m·s-1,较2016—2020年提高了10.7%,但台风的快速增强(rapid intensification,RI)预报仍然是台风预报中的一大难题(杨梦琪等,2023黄燕燕等,2024)。特别是在近海出现RI的台风更容易造成巨大损失,这让准确的台风RI预报显得更加重要(向纯怡等, 2022)。

台风的强度变化受多种因素影响,包括大尺度环境场、台风内核结构、海气相互作用等(Kaplan and DeMaria, 2003; Kaplan et al, 2015)。传统的数值模式受低分辨率、初始误差和不完善的物理参数化方案限制,在描述台风发展的动力和热力过程方面存在一定的局限性,导致数值模式预报台风强度快速变化的能力不够理想(Mercer and Grimes, 2017; Rozoff et al, 2015)。因此,构建基于统计动力方法的台风RI预报模型成为一种有效的解决方案。Kaplan and DeMaria(2003)提出了首个RI预报概率模型,该模型利用5个RI台风与非RI台风有显著差异的预报因子,通过简单的阈值方法,预报北大西洋台风未来24 h发生RI的概率。随后,该模型在2010年进行了升级,除使用更多的预报因子外,还采用了线性判别分析方法,并实现了对东北太平洋台风RI的预报(Kaplan et al, 2010)。然而,由于台风RI是一个复杂的非线性过程,通过线性模型预报台风RI准确度有限(Mercer and Grimes, 2017)。为了解决这一问题,Rozoff et al(2015)使用贝叶斯推断和逻辑回归方法构建了北大西洋和东太平洋的RI预报模型,有效提高了预报准确度。之后,Mercer and Grimes(2017)利用机器学习的优势,使用支持向量机、全连接神经网络和随机森林构建了北大西洋的台风RI预报模型,进一步提升了预报准确度。Zhou et al(2022)基于历史卫星数据,利用ResNet模型和LSTM模型,构建了西太平洋台风RI预报模型,该模型利用历史24 h的卫星实况数据对未来12 h是否发生RI(台风在未来12 h内是否增强7 m·s-1以上)进行外推预报,具有不错的准确度。然而,这种数据驱动的模型对数据量的要求很高;在仅依赖历史信息进行外推预报的情况下,随着预报时效的延长,预报误差往往会显著增大;此外,深度学习模型在解释性方面存在不足,应用时只能得到预测结果,而无法深入理解其背后的原因和机制。

本文针对西北太平洋的台风RI预报模型进一步深入研究。通过利用台风最佳路径数据和数值模式预报数据,不仅考虑了台风的历史信息,还纳入了大气和海洋在未来24 h内的状态变化。在此基础上,结合最新的台风强度机理研究成果,运用动力统计方法,显式地生成多个与台风强度变化或台风RI密切相关的预报因子。通过机器学习方法,构建西北太平洋台风RI预报模型,从而为西北太平洋台风RI的预报提供参考。

1 数据和方法 1.1 RI事件的定义

本文沿用Kaplan方法(Kaplan and DeMaria, 2003; 谢礼江等, 2013),将24 h强度变化的第95%分位数(15 m·s-1)作为判断台风RI的阈值。若自某一个时刻起的未来24 h台风近中心最大平均风速增强了15 m·s-1以上,则定义该时刻为一个RI事件(RIE),否则为非RI事件(NRIE)。台风在增强过程中可能会发生多次RIE,比如次日00时、06时、12时、18时(世界时,下同)较今天的00时、06时、12时、18时均发生了15 m·s-1以上的增强,则今天连续发生了4次RIE,只要发生1次RIE,就称该台风发生了RI。

1.2 数据

本文使用的数据包括2015—2022年WMO的台风最佳路径数据集IBTrACS(Knapp et al, 2010),以及NCEP GFS的分析和预报数据(National Centers for Environmental Prediction et al, 2015),上述数据共同生成台风RI预报模型的预报因子和因变量(或预报量,此处指未来24 h是否发生RIE)。

1.3 预报因子

GFS的空间分辨率为0.25°×0.25°,本文使用GFS 00时、06时、12时、20时起报的00时分析数据以及06时、12时、18时、24时预报数据生成基于模式数据的预报因子。由于预报因子不仅表征当前状态,还表征了未来的变化,将其称之为动态预报因子(表 1)。这些因子均为影响台风RI变化的重要因素,其中大多数已应用在上述东北太平洋和北大西洋台风RI预报模型中。在计算这些预报因子之前首先需要确定GFS不同预报时次的台风中心位置,这里采用最大环流法(Nguyen et al, 2014)。根据斯托克斯定理,单位面积的环流最大值即单位面积上相对涡度最大值,因此取距台风中心100 km范围内的平均相对涡度最大值作为台风中心。确定了台风中心就可以得出表 1中的预报因子,下文对这些预报因子做详细介绍。

表 1 各预报因子的定义 Table 1 Definition of each forecast factor

台风的结构是影响台风强度变化的重要因素。Guo and Tan(2017)提出了台风丰满度(TCF)概念,并指出台风丰满结构(TCF>0.8)是强台风的必然条件,且TCF的增加与台风增强关系密切。TCF计算如式(1)所示:

$ \mathrm{TCF}=1-\frac{R_{\mathrm{mw}}}{R_{17}} $ (1)

式中:Rmw表示最大风圈半径,R17表示17 m·s-1风圈半径。通过GFS 10 m风场的分析和预报数据计算得到的TCF虽然与真值有偏差,但仍能得到与Guo and Tan(2017)相同的台风强度越强TCF越高的结论(图略),因此可将TCF作为台风RI预报模型的预报因子之一。

海面温度(SST)是海洋热状况的表征,较高的SST可通过释放更多的感热和潜热通量促进台风增强(Emanuel, 1986; Holland, 1997)。最大潜势强度(MPI)用于表征台风强度发展的上限,这里使用基于SST的经验公式[式(2)]计算获得(Levitus, 1983):

$ \mathrm{MPI}=\left(A+B \mathrm{e}^{c\left(T-T_0\right)}\right) \times 0.5144 $ (2)

式中:A=38.21 kt, B=170.72 kt, C=0.1909 ℃-1, T0=30.0℃,最后一项乘以0.5144将速度单位kt转换为m·s-1。潜势强度(POT)为MPI减去台风当前强度,代表当前台风强度可发展的空间。

水平风垂直切变(VWS)在台风生成和加强过程中扮演着重要角色,是影响台风发展的重要动力学因子之一。一般认为在较弱环境VWS下台风更容易发生RI(Gray, 1968; Merrill, 1988; 高拴柱和吕心艳, 2024)。然而,谢礼江等(2013)的研究表明,即使在较大的环境VWS情况下,仍有9.7%的台风能够发生RI。为了探究这一现象的原因,Shi and Chen(2021)利用合成分析方法对中等及强环境VWS下RI发生的机制进行了深入研究。研究结果显示,中等和强环境VWS下发生RI台风的高层会出现明显的逆风切出流,这种高空出流阻塞了原本的高层环流,从而为台风增强创造了有利的局地弱VWS环境。因此,本文将局地VWS(LVWS,距台风中心200 km内的平均VWS)和环境风VWS(EVWS,距台风中心400~800 km的平均VWS)均作为预报因子加入模型。

台风的高空由于惯性稳定性远低于中低层,容易与大尺度场发生相互作用。相对角动量涡旋辐合(REFC)常用于表征高空大尺度场和台风的相互作用,REFC的计算如式(3)所示:

$ \mathrm{REFC}=-\frac{1}{r^2} \frac{\partial}{\partial r}\left(r^2 \overline{U^{\prime} V^{\prime}}\right) $ (3)

式中:U是径向风,V是切向风,r是半径,上横线表示方位角平均值,撇号表示与方位角平均值的差。Kaplan and DeMaria(2003)指出当REFC值较高时,台风不太可能发生RI。另外,高空出流也是影响台风发展的重要动力条件,本文将距台风中心800 km内的200 hPa平均散度(D200)作为高空出流指标加入模型。

此外,还加入了距台风中心200~800 km的200 hPa平均温度(T200)和距台风中心200~800 km的850~500 hPa平均相对湿度(RHLO),有研究指出当前者较低、后者较高时有利于台风增强(Knaff et al,2005)。

IBTrACS记录了西北太平洋台风逐6 h的台风近中心最大平均风速和经纬度等信息,使用该数据生成表征台风当前状态的预报因子(称为静态预报因子):(1)台风当前最大平均风速(VMAX),(2)台风过去6 h的最大平均风速变化(DVMAX),(3)台风过去6 h的移动速度(SPD)(表 1)。

1.4 模型

极端梯度提升(eXtreme Gradient Boosting,XGBoost; Chen et al, 2015)是一种高效且可扩展的梯度提升决策树算法,通过迭代训练决策树模型,每棵树都试图纠正前面所有树的残差,从而逐步提升模型的预报性能。XGBoost的目标函数如式(4)所示:

$ \mathit{Φ}(t)=\sum\limits_{j=1}^n l\left[y_j, f_{t-1}\left(x_j\right)+f_t\left(x_j\right)\right]+\mathit{\Omega}\left(f_t\right) $ (4)

式中:ft(x)表示第t棵树的预报结果,yj表示第j个样本的真实输出值,xj表示第j个样本的特征,ft-1(x)表示第t-1棵树的预报结果。右侧第一项为损失函数,用来衡量模型在第t次训练中的预报误差,对于回归问题,通常使用均方误差,对于二分类问题,通常使用交叉熵; 第二项表示t棵树的复杂度,用来控制模型的复杂度和泛化能力,也被称作正则化项,通过引入正则化项可以有效防止过拟合现象。同时,XGBoost还采用了特征子采样和数据子采样等技术,可以有效地解决数据倾斜和特征相关性的问题,从而进一步增强模型的鲁棒性和泛化性能。此外,XGBoost通过并行化处理实现了高效的计算,适用于处理大规模数据集和高维特征空间。相比传统的梯度提升决策树算法,XGBoost在训练速度和预报性能上均有显著提升。由于XGBoost的众多优势,已广泛应用于分类、回归、排序、推荐系统等领域,包括气象领域(张钧民等, 2021; 杨绚等, 2022)。本文使用XGBoost模型对台风未来24 h是否发生RIE进行预报,即基于XGBoost构建一个二分类模型。

1.5 检验指标

RIE是小概率事件,因此台风RIE预报属于样本不平衡的二分类问题。在这种情况下,使用准确率(预报正确的样本占总样本的比例)难以评估模型的性能。因此,本文通过计算气象领域常用的漏报率(FNR)、空报率(FPR)和TS来检验模型预报准确度,使用AUC(Area Under the Curve)评估模型性能以进行参数优化。如表 2所示,TP代表观测为RIE且预报也为RIE的样本数,TN代表观测为NRIE且预报为NRIE的样本数,FN代表观测为RIE而预报为NRIE的样本数,FP代表观测为NRIE而预报为RIE的样本数。

表 2 台风RIE预报的混淆矩阵 Table 2 Confusion matrix for typhoon RI event prediction

FNR、FPR和TS的计算如式(5)~式(7)所示。

$ \mathrm{FNR}=\frac{\mathrm{FN}}{\mathrm{TP}+\mathrm{FN}} $ (5)
$ \mathrm{FPR}=\frac{\mathrm{FP}}{\mathrm{FP}+\mathrm{TN}} $ (6)
$ \mathrm{TS}=\frac{\mathrm{TP}}{\mathrm{FP}+\mathrm{TP}+\mathrm{FN}} $ (7)

式中:FNR表示实际为RIE的样本中,模型错误预报为NRIE的样本所占比例,该指标越接近0,表示模型对RIE捕捉能力越高,而越接近1则表明模型漏报了大量RIE样本。FPR表示实际为NRIE的样本中,模型错误预报为RIE的样本所占的比例,该指标越接近0,表明模型对NRIE的预报准确度越高,而越近1则表明模型空报了大量NRIE样本。TS表示所有实际为RIE样本以及预报为RIE样本中,预报正确的RIE样本所占的比例,该指标越接近1,表明模型对RIE的预报能力越好。

AUC是一种常用的用于衡量二分类模型性能的评估指标,它通过绘制接收者操作特征曲线(ROC)来计算。ROC以不同的分类阈值为基础,绘制模型的查全率(为1-FNR,即所有RIE样本中被模型正确预报的比例)与FPR之间的关系,即利用不同阈值来衡量在尽量提高查全率时会引起多少的空报率。AUC则是ROC下方的面积,取值范围在0~1,其中0.5表示模型的预测性能等同于随机猜测,而1表示模型的预测完全准确, 因此AUC越接近1,模型的性能越好。AUC提供了一个单一的数值来概括分类器的性能,使得不同模型之间的比较变得简单;此外,AUC不受样本不平衡的影响,因此在处理不平衡数据集时具有独特的优势。

2 模型构建 2.1 模型的输入和输出

如上文所述,模型的预报因子包括由GFS生成的8个动态预报因子,以及由IBTrACS生成的3个静态预报因子。各动态预报因子为未来24 h逐6 h间隔的平均值。模型的输出向量为未来24 h是否发生RIE。

2.2 数据集

在构建输入模型的数据集之前,首先对2015—2022年的台风数据进行如下过滤:(1)由于只关注台风是否发生RI,同时为了减小样本不平衡对模型训练的负面影响,因此只保留每个台风首次达到热带风暴级到最后一次出现24 h增强的记录;(2)删除由于GFS数据缺测无法生成动态预报因子的样本;(3)剔除有效记录不满24 h的台风。经过上述筛选后,我们共得到了173个台风,2040个样本,其中发生RI的台风数为90个,发生RIE的样本为390个,占总样本的为19%(表 3)。不同台风等级下发生RIE的比例差别较大,其中比例最高的为台风级(TY),占比为35%,其次为强热带风暴级(STS),而热带风暴级(TS)占比最少。使用2015—2020年的样本训练模型,并结合Optuna超参数搜索框架(Akiba et al, 2019)和分层交叉验证法(Kohavi, 1995)优化超参数,优化目标为AUC最大。使用2021—2022年的样本对模型进行独立性检验。训练集中包含138个台风,1609个样本,其中发生RI的台风74个,发生RIE的样本325个,占总样本的20%;测试集中包含35个台风,其中16个台风发生RI,431个总样本中有65个发生RIE,占比为15%。

表 3 数据集样本信息 Table 3 Sample information of dataset
2.3 试验设计

为了全面、系统地评估基于上述方法构建的RI预报模型的可行性,设计了三组试验:

Exp1:使用由分析数据生成动态预报因子构建的训练集(记为PP训练集)训练“完美假设”下的预报模型(记为FM),并同时使用由分析数据生成的测试集(记为PP测试集)进行检验。该试验假设预报因子本身没有误差,因此可用于评估和分析模型本身的性能。

Exp2:使用由预报数据生成的测试集(记为FST测试集)对FM进行预报检验。该试验旨在检验FM在实时预报中的准确度。

Exp3:考虑到动态预报因子本身预报误差对FM预报性能的影响,使用由预报数据生成的FST训练集直接训练预报订正模型(记为FCM),并同样使用FST测试集进行检验。该试验旨在检验FCM是否能够学习动态预报因子的预报误差,从而减小动态预报因子误差对模型RI预报的影响。

为了避免超参数在比较FM和FCM时的影响,两组试验采用了相同的超参数搜索空间,并且迭代次数均为1000次。

3 检验和分析 3.1 “完美假设”下的模型评估和分析

图 1显示了FM在PP测试集中的检验结果。由图可知,在动态预报因子无明显误差的假设下,模型具有相当不错的RI预报能力,平均的FNR、FPR、TS分别为0.25、0.24、0.32。不同台风等级下的预报准确度有所差异,表现最好的为TY级,FNR、FPR和TS分别为0.09、0.25和0.70。表现最差的为STS级,FNR、FPR和TS分别为0.40、0.48和0.19。

图 1 FM在PP测试集中的检验结果 注:横坐标数字代表不同等级总样本数/RIE样本数(单位:个)。 Fig. 1 Verification results of the FM in the PP test set

在“完美模型”假设下,可以粗略地认为预报因子不存在明显误差,这样便于使用SHAP(Shapley Additive exPlanations)框架对XGBoost分类模型的预报进行分析。SHAP利用合作博弈论方法为每个预报因子分配一个SHAP值,该值反映了其对预报结果的边际贡献,正值(负值)表明该预报因子增大(减小)了RIE发生的概率[更多详细原理参考Lundberg et al(2020)]。图 2展示了PP训练集各预报因子在FM中的SHAP值分布,其中填色代表各预报因子在标准化后的相对大小,从上到下的排列顺序则代表了各预报因子对预测结果的贡献程度。由图可见,TCF对预报结果的影响最为显著,其次为T200。图中,SPD和RHLO的贡献虽然最小,但是通过敏感性试验证明舍弃其中任何一个都会引起误差有所增加。当TCF较大、T200较小、POT较大、D200较大、LVWS和EVWS较小、REFC较小、RHLO较大时,有利于RIE发生,这均与对台风强度发展的认知相一致。另外,DVMAX较大时,其对应较大的正SHAP值,表明当RIE发生时,台风已经处于较强的发展阶段;VMAX较大时,对应较大负SHAP值,表明若台风已经很强,则再次发生RIE的概率较低;SPD越小时,其对应较大的负SHAP值,这或许与海温的负反馈有关,当移速较慢时更容易受海温负反馈影响,不利于台风增强。需要注意的是,每个因子对预报结果的贡献并不是简单的线性相关。比如TCF,在其他因子取平均的情况下,TCF与FM预报概率的曲线总体呈S型(图 3a),即TCF较低时对应较低的概率,随着TCF增大,RIE概率逐渐增大并趋于稳定;VMAX则大概呈Ω型(图 3b),这与不同台风等级下发生RIE的可能性大小相对应,STS和TY等级下发生RIE的比例较高,其他等级则相对较小。

图 2 PP训练集各预报因子在FM中的SHAP值分布 注:填色代表各预报因子标准化后的相对大小。 Fig. 2 SHAP value distribution of each predictor of PP training set in the FM

图 3 FM不同(a)TCF和(b)VMAX的平均预报概率 Fig. 3 Average prediction probability of the FM with different (a) TCF and (b) VMAX

在上述预报因子贡献分析的基础上,可以对STS和TY等级下FM模型预报准确度差异明显的原因进行进一步分析。图 4所示为STS和TY等级下RIE样本和NRIE样本TCF、T200、DVMAX、POT和D200(重要程度最高的5个预报因子)的分布差异。由图可见,相较NRIE样本,TY等级下的RIE样本的T200整体偏低、DVMAX整体偏高,这些预报因子的显著差异有助于模型区分RIE和NRIE;而STS等级下,T200和DVMAX的差异则相对较小,且出现了RIE样本的D200整体低于NRIE样本的情况(与上文预报因子贡献分析不符)的情况,这些都使得模型准确预报RI的难度增大。这也在一定程度上说明,仅利用这11个预报因子构建模型进行RI预报仍存在一定的局限性。

图 4 PP测试集中(a~e)STS和(f~j)TY等级下RIE样本和NRIE样本预报因子的分布差异 注:箱体上、下边界分别代表第75%和第25%分位数,箱体内横线代表中位数,须线上、下两端分别代表最大和最小值(不包括异常值)。 Fig. 4 Distribution differences of predictors of RIE samples and NRIE samples at (a-e) STS and (f-j) TY levels in the PP test set
3.2 实时预报检验

在实时业务预报中,由于无法获取未来时刻的分析数据,只能使用预报数据代替,FST测试集中FM模型的检验结果如图 5a所示,由图可见,受动态预报因子预报误差的影响,FM在实时预报中的准确度有所降低。整体FNR、FPR和TS分别为0.32、0.26和0.27,较在PP测试集中的结果,FNR、FPR分别增加了0.07、0.02,TS降低0.05。各等级下的预报准确度也都较在PP测试集中的结果有所下降。

图 5 (a) FM和(b)FCM在FST测试集中的检验结果 注:横坐标中的数字代表不同等级的总样本数/RIE样本数(单位:个)。 Fig. 5 Verification results of the (a) FM and (b) FCM in the FST test set

为降低预报因子误差对模型性能的影响,直接使用由预报场生成的FST训练集训练和优化台风RI预报模型,以求模型在训练的时候能够学习预报误差,从而使其具备一定的预报订正能力。图 5b为FCM在FST测试集中的检验结果,整体FNR、FPR和TS分别为0.28、0.25和0.30,相较FM,FNR和FPR分别减小了0.04和0.01,TS增加了0.03。同时在大部分等级下的预报准确度均优于FM。此外,模型对RIE的预报准确度远优于NCEP GFS和ECMWF,同样本检验下NCEP GFS的FNR、FPR和TS分别为0.90、0.01和0.09,ECMWF则分别为0.95、0.01、0.05。

选取2116号台风蒲公英和2216号台风奥鹿(图 6),对FM和FCM的实时预报能力进行个例检验,两个台风在发展过程中都经历了多次RIE。

图 6 台风蒲公英和奥鹿的部分路径 Fig. 6 Partial tracks of Typhoon Mindulle and Typhoon Noru

“蒲公英”于2021年9月23日在西北太平洋洋面生成,此后逐渐朝西北方向行进并持续发展增强,于9月26日发展为超强台风并达到强度峰值,在此期间,连续经历了7次RIE(图 7a)。FM和FCM都成功预报出了每一次RIE,但在第一次RIE之前和最后一次RIE之后均出现了空报的现象,且FM较FCM多空报了一次。

图 7 (a) 2021年9月23日12时至26日12时台风蒲公英和(b)2022年9月23日12时至27日12时台风奥鹿的强度变化(黑色实线) Fig. 7 Intensity changes (solid black line) of (a) Typhoon Mindulle from 12:00 BT 23 to 12:00 BT 26 September 2021, (b) Typhoon Noru from 12:00 BT 23 to 12:00 BT 27 September 2022

“奥鹿”于2022年9月23日在菲律宾以东洋面生成,而后逐渐西行增强,并于24日开始出现爆发性增强,至25日发展为超强台风,在登陆并穿越菲律宾期间有所减弱,进入南海后其强度再度发展,于27日再次发展为超强台风。在“奥鹿”两次增强期间,发生了多次RIE(图 7b)。与“蒲公英”相似,FCM较成功地预报出两次发展期间发生的RIE,仅有两次漏报,但仍在NRIE(RIE)和RIE(NRIE)切换之前(之后)出现了两次空报现象。FM对“奥鹿”的RI预报则相对较差,除出现两次空报外,漏报了第一次快速发展期间的全部RIE。

综上所述,使用预报场作为输入会带来一定的误差,但通过训练模型来学习预报误差并进行订正,可以在一定程度上消除预报误差的影响来提高模型的预报准确度。但是,尽管FCM相较FM在实时预报中的准确度有所提升,但仍无法达到FM在PP测试集中的准确度。4结论与讨论

本文基于XGBoost模型,利用2015—2020年NCEP GFS分析和预报数据以及IBTrACS数据分别构建了西北太平洋台风未来24 h的RI预报模型(FM)和预报订正模型(FCM),并使用2021—2022年数据进行独立检验。主要得到以下结论:

(1) 在“完美模型”假设下构建的FM具有较高的性能,2021—2022年回算的FNR为0.25,FPR为0.24,TS为0.32。不同台风等级下的预报准确度有所差异,表现最好的为TY等级(FNR、FPR和TS分别为0.09、0.25和0.70),表现最差的为STS等级(FNR、FPR和TS分别为0.40、0.48和0.19)。利用SHAP进行预报因子贡献分析发现,对FM预报影响最大的5个因子依次为TCF、T200、DVMAX、POT和D200。

(2) 在实时预报中,由于预报因子本身的误差,“完美模型”假设下构建的FM的预报性能会受到影响,整体FNR、FPR和TS分别为0.32、0.26和0.27,较在PP测试集下的结果,FNR和FPR分别增加了0.07、0.02,TS减小了0.05。然而,通过训练模型学习这些误差并进行订正,可以在一定程度上消除这些影响,提高模型的实时预报准确度。FCM的FNR、FPR和TS分别为0.28、0.25和0.30,相较FM,FNR和FPR分别减小了0.04和0.01,TS增加了0.03,同时在大部分等级下的预报准确度均优于FM。通过对比FCM和FM对2116号台风蒲公英和2216号台风奥鹿的实时预报准确度,发现FCM相较FM具有更高的性能,几乎捕捉到了全部的RIE,但在NRIE(RIE)和RIE(NRIE)切换之前(之后)出现了多次空报的现象。

综上所述,本文利用NCEP GFS数据构建了可进行实时预报的西北太平洋RI预报模型,并具有不错的性能,能够为台风强度以及台风RI的实时预报提供参考。但是,模型仍存在一些不足: 一方面,模型对不同台风等级下预报准确的相差较大,这其中背后的原因还需要进行进一步深入分析;另一方面,模型选取的预报因子不够丰富,缺乏对海气相互作用的考虑,且数据来源单一。未来,会对台风不同阶段强度发展的主要影响因子进行进一步深入分析,在机理研究的基础上采用更多的预报因子、多源的数据,进一步改进优化模型。

参考文献
端义宏, 陈联寿, 许映龙, 等, 2012. 我国台风监测预报预警体系的现状及建议[J]. 中国工程科学, 14(9): 4-9. Duan Y H, Chen L S, Xu Y L, et al, 2012. The status and suggestions of the improvement in the typhoon observation, forecasting and warning systems in China[J]. Strateg Study CAE, 14(9): 4-9 (in Chinese).
端义宏, 方娟, 程正泉, 等, 2020. 2020.热带气旋研究和业务预报进展—第九届世界气象组织热带气旋国际研讨会(IWTC-9)综述[J]. 气象学报, 78(3): 537-550. Duan Y H, Fang J, Cheng Z Q, et al, 2020. Advances and trends in tropical cyclone research and forecasting: an overview of the ninth World Meteorological Organization International Workshop on Tropical Cyclones (IWTC-9)[J]. Acta Meteor Sin, 78(3): 537-550 (in Chinese).
高拴柱, 吕心艳, 2023. 台风快速增强爆发前后的背景环流和热力动力条件的演变[J]. 气象学报, 81(5): 702-716. Gao S X, Lü X Y, 2023. Evolution of environmental circulation and dynamic and thermodynamic conditions before and after the onset of typhoon rapid intensification[J]. Acta Meteor Sin, 81(5): 702-716 (in Chinese).
黄燕燕, 陈子通, 冯业荣, 等, 2024. 南海台风模式对台风利奇马快速增强预报能力研究[J]. 气象, 50(5): 532-546. Huang Y Y, Chen Z T, Feng Y R, et al, 2024. Research on the forecasting capability of CMA-TRAMS Model for rapid intensification of Typhoon Lekima[J]. Meteor Mon, 50(5): 532-546 (in Chinese). DOI:10.7519/j.issn.1000-0526.2023.061601
向纯怡, 许映龙, 高拴柱, 等, 2022. 2021年西北太平洋台风活动特征和预报难点分析[J]. 气象, 48(9): 1195-1208. Xiang C Y, Xu Y L, Gao S Z, et al, 2022. Analysis of the characteristics and forecast difficulties of typhoon over the western North Pacific in 2021[J]. Meteor Mon, 48(9): 1195-1208 (in Chinese). DOI:10.7519/j.issn.1000-0526.2022.053001
谢礼江, 邱新法, 王伟, 2013. 西北太平洋热带气旋快速增强与环境垂直风切变统计分析[J]. 热带地理, 33(3): 242-249, 263. Xie L J, Qiu X F, Wang W, 2013. Rapid intensification of tropical cyclones and vertical wind shear over the Northwest-Pacific[J]. Trop Geogr, 33(3): 242-249, 263 (in Chinese).
许映龙, 张玲, 高拴柱, 2010. 我国台风预报业务的现状及思考[J]. 气象, 36(7): 43-49. Xu Y L, Zhang L, Gao S Z, 2010. The advances and discussions on China operational typhoon forecasting[J]. Meteor Mon, 36(7): 43-49 (in Chinese). DOI:10.7519/j.issn.1000-0526.2010.7.009气象:2010,36(7):43-49
杨梦琪, 陈国民, 张喜平, 等, 2023. 2021年西北太平洋和南海台风预报精度评定[J]. 气象, 49(8): 1005-1019. Yang M Q, Chen G M, Zhang X P, et al, 2023. Verification on typhoons forecasts over the Western North Pacific and the South China Sea in 2021[J]. Meteor Mon, 49(8): 1005-1019 (in Chinese). DOI:10.7519/j.issn.1000-0526.2023.051101
杨绚, 张立生, 王铸, 2022. 基于机器学习算法的县域台风灾害经济损失风险评估[J]. 热带气象学报, 38(5): 651-661. Yang X, Zhang L S, Wang Z, 2022. Risk assessment for typhoon economic losses in county-based units using machine learning[J]. J Trop Meteor, 38(5): 651-661 (in Chinese).
张钧民, 阮惠华, 许剑辉, 等, 2021. 基于XGBoost的多源降水数据融合方法研究[J]. 热带地理, 41(4): 845-856. Zhang J M, Ruan H H, Xu J H, et al, 2021. An XGBoost-merging method for high-resolution daily precipitation estimation for a regional rainstorm event[J]. Trop Geogr, 41(4): 845-856 (in Chinese).
Akiba T, Sano S, Yanase T, et al, 2019. Optuna: a next-generation hyperparameter optimization framework[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage: Association for Computing Machinery.
Chen T, He T, Benesty M, et al, 2015. Xgboost: extreme gradient boosting[EB/OL]. (2023-10-30). R package version 0.4-2, 1(4): 1-4. https://cran.uib.no/web/packages/xgboost/index.html.
Emanuel K A, 1986. An air-sea interaction theory for tropical cyclones. Part Ⅰ : steady-state maintenance[J]. J Atmos Sci, 43(6): 585-605. DOI:10.1175/1520-0469(1986)043<0585:AASITF>2.0.CO;2
Gray W M, 1968. Global view of the origin of tropical disturbances and storms[J]. Mon Wea Rev, 96(10): 669-700. DOI:10.1175/1520-0493(1968)096<0669:GVOTOO>2.0.CO;2
Guo X, Tan Z M, 2017. Tropical cyclone fullness: a new concept for interpreting storm intensity[J]. Geophys Res Lett, 44(9): 4324-4331. DOI:10.1002/2017GL073680
Holland G J, 1997. The maximum potential intensity of tropical cyclones[J]. J Atmos Sci, 54(21): 2519-2541. DOI:10.1175/1520-0469(1997)054<2519:TMPIOT>2.0.CO;2
Kaplan J, DeMaria M, 2003. Large-scale characteristics of rapidly intensifying tropical cyclones in the North Atlantic Basin[J]. Wea Forecasting, 18(6): 1093-1108. DOI:10.1175/1520-0434(2003)018<1093:LCORIT>2.0.CO;2
Kaplan J, DeMaria M, Knaff J A, 2010. A revised tropical cyclone rapid intensification index for the Atlantic and eastern North Pacific Basins[J]. Wea Forecasting, 25(1): 220-241. DOI:10.1175/2009WAF2222280.1
Kaplan J, Rozoff C M, DeMaria M, et al, 2015. Evaluating environmental impacts on tropical cyclone rapid intensification predictability utilizing statistical models[J]. Wea Forecasting, 30(5): 1374-1396. DOI:10.1175/WAF-D-15-0032.1
Knaff J A, Sampson C R, Demaria M, 2005. An operational statistical typhoon intensity prediction scheme for the western North Pacific[J]. Wea Forecasting, 20(4): 688-699. DOI:10.1175/WAF863.1
Knapp K R, Kruk M C, Levinson D H, et al, 2010. The International Best Track Archive for Climate Stewardship (IBTrACS): unifying tropical cyclone data[J]. Bull Amer Meteor Soc, 91(3): 363-376. DOI:10.1175/2009BAMS2755.1
Kohavi R, 1995. A study of cross-validation and bootstrap for accur-acy estimation and model selection[C]//Proceedings of the 14th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc: 1137-1145.
Levitus S, 1983. Climatological atlas of the world ocean[J]. Eos, 64(49): 962-963.
Lundberg S M, Erion G, Chen H, et al, 2020. From local explanations to global understanding with explainable AI for trees[J]. Nat Mach Intell, 2(1): 56-67. DOI:10.1038/s42256-019-0138-9
Mercer A, Grimes A, 2017. Atlantic tropical cyclone rapid intensification probabilistic forecasts from an ensemble of machine learning methods[J]. Proc Comput Sci, 114: 333-340. DOI:10.1016/j.procs.2017.09.036
Merrill R T, 1988. Environmental influences on hurricane intensification[J]. J Atmos Sci, 45(11): 1678-1687. DOI:10.1175/1520-0469(1988)045<1678:EIOHI>2.0.CO;2
National Centers for Environmental Prediction, National Weather Service, NOAA, et al, 2015.NCEP GFS 0.25 Degree Global Forecast Grids Historical Archive, Research Data Archive, National Center for Atmospheric Research, Computational and Information Systems Laboratory[EB/OL].[2023-02-10].10.5065/D65D8PWK.
Nguyen L T, Molinari J, Thomas D, 2014. Evaluation of tropical cyclone center identification methods in numerical models[J]. Mon Wea Rev, 142(11): 4326-4339. DOI:10.1175/MWR-D-14-00044.1
Rozoff C M, Velden C S, Kaplan J, et al, 2015. Improvements in the probabilistic prediction of tropical cyclone rapid intensification with passive microwave observations[J]. Wea Forecasting, 30(4): 1016-1038. DOI:10.1175/WAF-D-14-00109.1
Shi D L, Chen G H, 2021. The implication of outflow structure for the rapid intensification of tropical cyclones under vertical wind shear[J]. Mon Wea Rev, 149(12): 4107-4127. DOI:10.1175/MWR-D-21-0141.1
Zhou G B, Xu J, Qian Q F, et al, 2022. Discriminating technique of typhoon rapid intensification trend based on artificial intelligence[J]. Atmosphere, 13(3): 448. DOI:10.3390/atmos13030448