2. 中国气象局,北京 100081;
3. 国家气象中心,北京 100081
2. 2 China Meteorological Administration, Beijing 100081;
3. 3 National Meteorological Center, Beijing 100081
随着天气预报技术与能力的不断提高以及社会的发展,气象因素在国民经济的很多方面所起的作用越来越重要[1-2]。基于更准确、全面的天气预报信息进行各种活动的决策,将会产生更高的经济价值及社会效益或避免更大的损失。杜均等[3]指出不能定量地把不确定性表达出来的预报是不完备的,而决策分析理论也表明,更加客观地反映人对大气状态未来发展趋势认识状态的概率预报,较之确定性预报具有更高的实用价值。因此为用户提供概率天气预报是天气预报服务发展的方向[4-7]。
集合数值天气预报是天气预报向概率天气预报发展过程中的重要一步[8-10]。其思想是针对模式初值及物理过程参数化等方面的不确定性进行扰动,产生一组预报值并借此表达数值预报的不确定性。集合预报的扰动情况反映了人们对大气状态发展变化的认识状况,扰动效应表现为集合成员间的相互关系。集合预报产品释用就是要基于包含着集合预报系统预报性能的历史预报资料,从集合预报产品中,提取出可以定量化表达预报不确定性的概率预报。
随着集合预报技术的发展,现在已存在多种集合预报产品释用技术方法,如:邮票图、集合平均、集合离散度、面条图、概率烟羽图、各种聚类方法等[11],金荣花等[12]采用Ward聚类法开发了中国集合预报系统的聚类产品,严明良等[13]提出了几种基于超级集合思想的多模式数值预报动态变权集成处理方法。在这些产品释用技术方法中,多数只对集合预报结果进行处理,这使得历史预报资料中的集合预报性能信息没有得到利用;有些虽然利用了历史预报资料,但其处理结果不是概率预报,并不能反映预报不确定性。最近,陈朝平等[14]在贝叶斯概率决策理论的基础上,利用四川境内1951—2004年147站暴雨的气候概率,对西南区域中尺度集合预报模式提供的50 mm以上集合降水概率预报产品进行了修正,提高了四川暴雨预报准确率。因此有必要寻找一种能从历史预报资料中提取可用信息,从而将预报不确定性信息定量化为一个概率预报的集合预报产品释用新方法。
本文首先介绍预报不确定性及一种基于贝叶斯统计理论, 可以利用历史观测及预报资料,将单一数值预报产品处理为一个可以定量化表达该产品预报不确定性的概率预报技术——贝叶斯输出处理器(Bayesian Processor of Output, BPO)[15];基于单一数值预报产品概率化技术BPO,将一次集合预报结果融合为一个集成贝叶斯概率预报;最后对这种集合预报产品释用新思路进行了初步试验验证。
1 预报不确定性及BPO简介 1.1 预报不确定性及其定量化由于模式初值及物理过程参数化等方面存在不确定性的原因,导致数值天气预报模式的预报值总具有预报不确定性。如果数值模式的预报值无不确定性,即对于模式每次输出的同一个预报值x,实况都为同一个值,则此数值模式的预报性能就表现为图 1中的那条“Perfect forecast”曲线。但实际情况是,对于模式多次输出的同一确定预报值x,其与历史观测值构成的样本点并不重合,而是构成了x值下的一些离散样本点,这说明一个确定的预报值是具有预报不确定性的。
不同预报值x下,样本点的分布情况并不相同。预报样本中所有样本点的分布状况,即预报值、观测值之间的统计关系,反映了数值模式的预报性能。预报值x下的样本点分布情况代表了x的预报不确定性,因此可以将样本点的分布定量化为一个概率密度函数`形式的条件概率预报,其信息来源有两个:预报值x及来自历史预报样本的预报不确定性信息。这样,就可以将预报信息x转化为其预报不确定性的定量化表达——概率预报,此概率预报可以向用户传达一种更完善的预报信息。
1.2 BPO简介贝叶斯输出处理器BPO通过建立一个数值模式的概率预报模型,将该模式的一个确定预报值转化为一个概率预报,这个概率预报是该预报值预报不确定性的定量化表达。
下面介绍采用单一预报因子(即模式的单一预报值)的连续型预报量BPO。记预报因子X(模式120 h温度预报值)的边缘概率密度函数为k(x),预报量W(武汉站00:00 UTC T2m的120 h预报)的边缘概率密度函数为g(w),X的条件概率密度函数为f(x|w),W的似然密度函数也记为f(x|w),X与W构成的二维随机变量(X, W)的联合概率密度函数记为h(x, w)。由贝叶斯定理有关系式:
$\phi (w|x) = \frac{{h(x,w)}}{{k(x)}} = \frac{{f(x|w)g(w)}}{{k(x)}}$ | (1) |
贝叶斯公式(1) 中的
对此,Krzysztofowicz等[15]基于贝叶斯统计理论,开发出了模式产品统计处理技术——BPO。其主要思想是,通过正态分位数转换(Normal Quantile Transform, NQT)[16],将满足单调似然比要求的原始预报变量X与W的历史预报与观测样本,从原始概率密度空间变换到转换预报变量的二维正态分布概率密度空间,建立W的似然模型,利用贝叶斯公式(1) 推导出转换预报量的概率预报公式,再利用NQT的逆及其雅克比式,将概率预报公式转换回原始概率密度空间,从而得到原始预报量的概率预报公式
应用贝叶斯输出处理器BPO时,首先要从历史观测资料中求取预报量的先验概率分布G(w),从单一数值预报的历史预报资料中求取预报因子的边缘概率分布K(x),然后利用预报因子与预报量的联合样本求得似然参数与后验参数。BPO利用预报值x,将预报量W的先验(气候)概率密度函数g(w)修订为后验概率密度函数
$\phi (w|x) = Q\{ \frac{1}{T}[{Q^{ - 1}}G(w) - {c_1}{Q^{ - 1}}\overline K (x) - {c_0}]\} $ | (2) |
$\phi (w|x) = \frac{1}{T}\exp (\frac{1}{2}\{ {[{Q^{ - 1}}G(w)]^2} - {[{Q^{ - 1}}\phi (w|x)]^2}\} )g(w)$ | (3) |
${w_{p|x}} = {G^{ - 1}}\{ Q[{c_1}{Q^{ - 1}}\overline K (x) + {c_0} + T{Q^{ - 1}}(p)]\} $ | (4) |
wp|x表示在已知模式预报值x的情况下,预报量小于w的概率为p。在以上各式中,Q-1是标准正态分布函数
$IS = {[{(\frac{a}{\sigma })^{ - 2}} + 1]^{ - \frac{1}{2}}}$ | (5) |
其值取决于信噪比:|a|/σ;|a|是预报信息指标,σ是噪音指标。IS的值域为(0, 1),其值越大,则预报因子的预报能力越强[19]。
2 一种温度集合预报产品释用方法的初步研究 2.1 基于BPO的集合预报产品释用思路针对模式初值或物理过程的不确定性进行扰动,得到的一组集合预报结果是对预报不确定性的一种离散形式的表达。由于预报不确定性的存在,每个成员预报都有可能与实况一致,具有一定的预报信息。同时,对于不同地域(或站点)、时间(如1月份或冬季)的不同预报量,集合预报中的某些成员会比其他成员具有更高的预报能力。这说明,各成员具有区别于集合预报的不同预报性能,集合预报的预报不确定性体现为各成员预报不确定性的一定形式的融合。因此,为得到一次集合预报结果的预报不确定性,可以基于集合成员预报能力的高低,进行各成员预报不确定性信息的融合。具体来说就是,对于某一次集合预报,先利用BPO对各成员预报不确定性进行定量化,得到一组成员贝叶斯概率预报,然后基于依赖于各成员IS值的权重,将这组成员贝叶斯概率预报融合为一个定量地表达本次预报不确定性的集成贝叶斯概率预报。释用思路见图 3。
将每一个集合成员视为一个单一的数值预报进行BPO建模,利用历史观测资料、集合预报资料,建立集合预报的一组成员贝叶斯概率预报公式。首先利用这组预报公式,将一次集合预报的温度预报值
$\overline X = ({x_1}, \cdots {x_n}) \to \{ {\phi _i}(w|{x_i})|i = 1, \cdots ,n\} $ | (6) |
然后基于各成员的有效信息评分IS值,将体现各成员预报不确定性的成员贝叶斯概率预报
$\phi (w|\overline X ) = \sum\limits_{i = 1}^n {{\phi _i}(w|{x_i}){r_i}(I{S_i})} $ | (7) |
根据基于BPO的集合预报产品释用公式(7),预报量在w处的概率密度(集合预报的预报不确定性)是各成员概率密度(各成员预报不确定性)的加权平均,权重系数ri(ISi)依赖于成员i的预报能力ISi。
3 初步试验 3.1 试验资料在对基于BPO的集合预报产品释用方法进行验证的初步试验中,预报量W选为武汉站00:00 UTC地面气温,预报因子X选为NCEP集合预报成员(共20个集合成员,记控制预报为第21个集合成员)对武汉站00:00 UTC T2m的120 h预报。
为预报量W选定的气候资料为:1980—2008年,每年1月份武汉站每日00:00 UTC T2m历史观测值(预报系统开放实验室提供);为预报因子X选定的历史预报资料为:2008年1月6日至2008年2月5日(其中1月资料用于建立成员贝叶斯概率预报公式,2月资料用于独立试验),武汉站每日00:00 UTC T2m的NCEP120 h集合预报资料(来自TIGGE资料)。
由于T2m具有明显的年周期性,记一年中第k天的预报量为Wk(1月1日,k=1),其逐日气候概率分布G(Wk)随时间k变化。为符合BPO对预报量统计平稳性的要求,将Wk进行标准化[19]:
$W = \frac{{{W_k} - {m_k}}}{{{s_k}}}$ | (8) |
其中,mk,sk分别为T2m在第k天的气候均值、标准差。
3.2 试验结果 3.2.1 贝叶斯概率预报利用以上历史观测资料、集合预报资料,针对NCEP集合预报每个成员,建立成员贝叶斯概率预报公式,并得到各成员预报能力指标IS。在本次试验中,将释用公式(7) 中的权重系数取为:
${{r}_{i}}(I{{S}_{i}})=\frac{IS_{i}^{3}-\min (\overset{\rightharpoonup }{\mathop{I{{S}^{3}}}}\,)}{\sum\limits_{i=1}^{21}{IS_{i}^{3}-21\cdot \min (\overset{\rightharpoonup }{\mathop{I{{S}^{3}}}}\,)}}$ | (9) |
其中,
利用建立的各成员贝叶斯概率预报公式和释用公式(7),以及独立的NCEP集合预报资料,对2008年2月1日—2月5日武汉站每日00:00 UTC T2m进行120 h概率预报试验。图 4所示为,NCEP集合预报第1、15个成员对2008年2月1日武汉站00:00 UTC T2m的120 h预报、对应的贝叶斯概率预报、NCEP集合预报平均、先验(气候)概率密度函数、集成贝叶斯概率预报及集合预报值的正态分布拟合结果。
由图 4可以看到,集合预报的一组预报值所表达的预报不确定性(图 4正态分布拟合结果Ensemble)与成员贝叶斯概率预报及集成贝叶斯概率预报(图 4正态分布Integrated)的预报不确定性是很不相同的,前者的概率密度具有不太合理的高集中度。NCEP集合预报第1、15个集合成员预报值为-2.0 ℃、-3.1 ℃,分别被这两个成员的BPO处理为均值-0.8 ℃、-1.4 ℃,标准差均为1.6 ℃的正态分布形式的概率预报,观测值为-0.8 ℃,集成贝叶斯概率预报为均值-1.8 ℃、标准差为1.2 ℃的正态分布。独立试验结果(略)表明各成员贝叶斯概率预报均值相对于各成员预报值均有调整;各成员贝叶斯概率预报具有不同的标准差,第1个成员的最大,为1.6 ℃,第4个成员的最小,为0.7 ℃,这说明各集合成员具有明显不同的预报不确定性。集成贝叶斯概率预报的标准差居于各成员贝叶斯概率预报标准差的中间位置附近,表明各成员预报不确定性对集合预报的预报确定性都有一定程度的贡献。
3.2.2 集合成员预报性能为检验各集合成员及其贝叶斯概率预报的预报性能,利用已经建立的各成员贝叶斯概率预报公式及所有集合预报样本,对2008年1月6日至2008年2月5日(检验期)武汉站00:00 UTC T2m进行120 h概率预报试验,利用历史观测资料对预报结果进行检验,部分检验结果如图 5所示。从图 5中可以看到,本次试验中第1个成员的IS值最小,为0.72,第4、9个成员的IS值最大,为0.95。各成员贝叶斯概率预报均值相对于观测值偏差的检验期平均值,基本(除第20个成员外)都小于对应成员预报偏差的检验期平均值。在以IS值衡量的一个集合成员预报能力中,预报不确定性占据了非常重要的地位。随着IS值的增大,代表预报不确定性大小的概率预报标准差明显减小,而代表系统偏差大小的概率预报均值相对于观测值偏差的减小并不显著。集成贝叶斯概率预报均值相对于观测值偏差的检验期平均值为1.5 ℃,其标准差检验期平均值为1.6 ℃。整体检验结果(略)表明,各成员贝叶斯概率预报标准差较好地表达了各成员预报不确定性的大小。
对于如图 4所示概率密度形式的概率预报,有人很关注应该将它以何种形式发布给用户或公众,担心有些用户不能顺利接受和使用这种形式的预报信息。对于使用精细决策模型的用户来说,这种形式的预报是完善的,是可以接受并利用的;对于一些不需要如此精确、全面预报不确定性定量化信息的用户来说,让他们理解并利用这样的预报信息,可能还存在着现实困难,因此需要对这种概率预报形式做一些变换和解释。
概率预报所涉及的概率,即可能性的定量化,表示的是对某一事件形式的认知状态:概率等于0.5,对应于所认知的事件形式是最模糊的,不确定性最大;概率等于1或0,对应于所认知的事件形式是最清晰的,无不确定性;介于0.5与概率端点(0或1) 间的不同概率值,代表着所认知事件形式的不同清晰程度,即人对事件表现为某一种形式的不同相信程度。
对于图 4中所示单峰概率密度函数形式的概率预报,可以转换为如下几种简化形式的概率预报[21]:(1) 定概率中央可信区间(fixed-probability Central Credible Interval, 定概率CCI),例如,图 4中集成贝叶斯概率预报的50% CCI为[-2.6 ℃,-1.0 ℃],90% CCI为[-3.8 ℃,0.2 ℃];(2) 定宽度中央可信区间(fixed-width Central Credible Interval, 定宽度CCI),例如,图 4中集成贝叶斯概率预报的2 ℃ CCI为59%,即观测值出现在[-2.8 ℃,-0.8 ℃]中的概率是59%;(3) 累积概率,例如,根据图 4中的集成贝叶斯概率预报,实况低于-2 ℃、-1 ℃、0 ℃的概率分别为43%,75%,93%。因此可以根据用户的特点与需求,将图 4中的集成贝叶斯概率预报转换为多种简化形式的概率预报信息再提供给用户,只要他们接受概率(可能性)的概念即可。
4 结语通过利用历史观测资料、集合预报资料,对基于BPO的集合产品释用新思路进行试验验证,得到以下主要结论:
(1) 可以通过对各集合预报成员分别进行BPO建模,确定其预报不确定性,从而将它的一个成员预报转化为一个可以表达该集合成员预报不确定性的贝叶斯概率预报。
(2) 各集合成员预报能力存在差异。2008年1月6日至2月5日期间,在中国南方持续低温、雨雪的天气情况下,NCEP集合预报成员4、9、12对武汉站00:00 UTC T2m具有较高的5天预报能力。
(3) 通过赋予具有不同预报能力的各成员贝叶斯概率预报一定形式的权重(依赖于各成员IS值),进行各成员贝叶斯概率预报信息的融合,得到预报不确定性的定量化结果——连续概率密度函数形式的集成贝叶斯概率预报。
(4) 可以从概率密度函数形式的概率预报提取出多种简化形式的概率预报信息。
将武汉站00:00UTC T2m及每个集合成员的概率分布都选定为正态分布,这是为参数估计方便而采取的权宜之计,它们应有更佳的近似分布(偏态分布);此次试验样本长度仅为1个月,较小的样本量可能导致存在较大的BPO建模偏差;由于可用样本较短,检验样本包含了BPO建模样本,检验结果的代表性不是很强。下一步的工作将会针对试验中存在的上述缺陷进行改进,并准备将试验范围扩展至TIGGE资料中的三个主要集合预报中心:NMC、NCEP、ECMWF,以对这里提出的温度集合预报产品释用新思路进行更深入的验证与检验。
[1] |
李泽椿, 毕宝贵, 朱彤, 等. 近30年中国天气预报业务进展[J]. 气象, 2004, 30(12): 4-10. DOI:10.3969/j.issn.1000-0526.2004.12.002 |
[2] |
矫梅燕. 天气业务的现代化发展[J]. 气象, 2010, 36(7): 1-4. DOI:10.7519/j.issn.1000-0526.2010.07.002 |
[3] |
杜均, 陈静. 天气预报的公众评价与发布形式的变革[J]. 气象, 2010, 36(1): 1-6. DOI:10.11676/qxxb2010.001 |
[4] |
陆如华, 裘国庆. 天气概率预报的科学性及其应用前景[J]. 气象, 1995, 21(11): 3-6. DOI:10.7519/j.issn.1000-0526.1995.11.001 |
[5] |
高拴柱, 张守峰, 钱传海, 等. 基于位置误差的分布制作热带气旋路径袭击概率预报[J]. 气象, 2009, 35(9): 38-43. DOI:10.7519/j.issn.1000-0526.2009.09.005 |
[6] |
杜钧, 陈静. 单一值预报向概率预报转变的基础:谈谈集合预报及其带来的变革[J]. 气象, 2010, 36(11): 1-11. DOI:10.7519/j.issn.1000-0526.2010.11.001 |
[7] |
杜钧, 邓国. 单一值预报向概率预报转变的价值:谈谈概率预报的检验和应用[J]. 气象, 2010, 36(12): 10-18. DOI:10.7519/j.issn.1000-0526.2010.12.002 |
[8] |
李小泉, 刘金达, 汪迎辉. 集合预报及其在中期天气预报中的应用[J]. 气象, 1997, 23(8): 3-9. DOI:10.7519/j.issn.1000-0526.1997.08.001 |
[9] |
陈静, 陈德辉, 颜宏. 集合数值预报发展与研究进展[J]. 应用气象学报, 2002, 13(4): 497-507. |
[10] |
李泽椿, 陈德辉. 国家气象中心集合数值预报业务系统的发展及应用[J]. 应用气象学报, 2002, 13(1): 1-15. |
[11] |
毛恒青, 陈谊, 陈德辉. 基于神威中期集合预报系统的产品开发[J]. 应用气象学报, 2001, 13(1): 47-55. |
[12] |
金荣花, 田伟红, 矫梅燕. 基于Ward聚类法的中国业务集合预报系统的产品开发[J]. 气象, 2007, 33(12): 9-15. DOI:10.7519/j.issn.1000-0526.2007.12.002 |
[13] |
严明良, 缪启龙, 沈树勤. 基于超级集合思想的数值预报产品变权集成方法探讨[J]. 气象, 2009, 35(6): 19-25. DOI:10.7519/j.issn.1000-0526.2009.06.003 |
[14] |
陈朝平, 冯汉中, 陈静. 基于贝叶斯方法的四川暴雨集合概率预报产品释用[J]. 气象, 2010, 36(5): 32-39. DOI:10.7519/j.issn.1000-0526.2010.05.004 |
[15] |
Krzysztofowicz R, Maranzano C J. Bayesian processor of output: probabilistic quantitative precipitation forecast[OL]. http://faculty.virginia.edu/rk/BPO.htm.
|
[16] |
Krzysztofowicz R. Transformation and normalization of variates with specified distributions[J]. Journal of Hydrology, 1997, 197: 286-292. DOI:10.1016/S0022-1694(96)03276-3 |
[17] |
张洪刚, 郭生练, 刘攀. 基于贝叶斯方法的实时洪水校正模型[J]. 武汉大学学报(工学版), 2005, 38(1): 58-63. |
[18] |
Kelly K S, Krzysztofowicz R. A bivariate meta-Gaussian density for use in hydrology[J]. Stochastic Hydrology and Hydraulics, 1997, 11: 17-31. DOI:10.1007/BF02428423 |
[19] |
Krzysztofowicz R. Probabilistic forecasts from the national digital forecast database[J]. Weather and Forecasting, 2008, 23: 270-289. DOI:10.1175/2007WAF2007029.1 |
[20] |
Krzysztofowicz R. Bayesian correlation score: a utilitarian measure of forecast skill[J]. Monthly Weather Review, 1992, 120(1): 208-219. DOI:10.1175/1520-0493(1992)120<0208:BCSAUM>2.0.CO;2 |
[21] |
Wilks D S. Statistical methods in the atmospheric sciences[M]. UK: Elsevier, 2006: 302.
|