快速检索
  气象   2013, Vol. 39 Issue (3): 324-332.  DOI: 10.7519/j.issn.1000-0526.2013.03.006

研究论文

引用本文 [复制中英文]

董全, 黄小玉, 宗志平, 2013. 人工神经网络法和线性回归法对降水相态的预报效果对比[J]. 气象, 39(3): 324-332. DOI: 10.7519/j.issn.1000-0526.2013.03.006.
[复制中文]
DONG Quan, HUANG Xiaoyu, ZONG Zhiping, 2013. Comparison of Artificial Nueral Network and Linear Regression Methods in Forecasting Precipitation Types[J]. Meteorological Monthly, 39(3): 324-332. DOI: 10.7519/j.issn.1000-0526.2013.03.006.
[复制英文]

资助项目

公益性行业(气象)科研专项(GYHY201006010-2)、中国气象局气象关键技术集成与应用(1411140000004) 和国家气象中心青年基金“模式预报温度偏差分析和误差订正”共同资助

第一作者

董全,主要从事天气预报和天气预报技术研究.Email:fermidq@gmail.com

文章历史

2012年7月09日收稿
2012年11月04日收修定稿
人工神经网络法和线性回归法对降水相态的预报效果对比
董全 , 黄小玉 , 宗志平     
国家气象中心,北京 100081
摘要:本文主要对相同条件下线性回归法(LR)和人工神经网络法(ANN)对降雨、雨夹雪和降雪3种降水相态的预报效果进行了对比检验。选取降水发生时和发生前6 h的地面2 m温度、露点温度作为预报因子,对降雨、雨夹雪和降雪进行预报。应用国家气象中心2001—2011年我国地面756站实况观测资料,其中应用2001—2010年资料对方法进行训练,2011年资料用来对比检验预报效果。结果显示,(1) 两种方法对3种相态降水都有一定的预报能力,对降雪预报最好,其次是降雨和雨夹雪;(2) 两种方法对北方的雨雪分界线预报比对南方的好;(3) 无论是对全国还是长江中下游流域,在相同条件下,ANN法的预报效果大都优于LR法,当温度和露点温度预报准确时,ANN法对北方的雨雪分界线能进行较准确的预报。
关键词人工神经网络    线性回归    降水相态    对比    
Comparison of Artificial Nueral Network and Linear Regression Methods in Forecasting Precipitation Types
DONG Quan, HUANG Xiaoyu, ZONG Zhiping    
National Meteorological Centre, Beijing 100081
Abstract: The linear regression (LR) and artificial neural network (ANN) methods are compared with each other in forecasting precipitation types under the same conditions. The selected predictors are surface air temperature and dew point when and 6 hours before precipitation happens, and the types include rain, sleet and snow. The observation data from 756 weather stations of the National Meteorological Centre, CMA during 2001-2011 are used, of which the data of 2001-2010 are used to test the methods and the 2011 data are used to verify the forecasting effects. The results show that both of the LR and ANN methods have prediction capacity for the three precipitation types of snow, rain and sleet. The predictability of snow is the best, then is rain, and the worst is sleet. Forecasts for the rain and snow separatrix forcasted by the two methods in the North of China are better than that in the South of China. The forecasting effect of ANN method is superior to that of LR method under the same conditions. When the temperature and dew point are forecasted correctly, the ANN method can be used to predict the rain and snow separatrix in the North of China exactly.
Key words: artificial neural network (ANN)    linear regression (LR)    precipitation type    comparison    
引言

降水相态发生突然变化时,常常会给交通和人们的生产生活带来不便,严重时会致灾。对雨雪转换的预报是天气预报中的难点。一方面,降水相态受温度层结影响(Theriault et al, 2010),另一方面,降水粒子在发生相态转变的过程中,又会影响和改变温度层结(Kain et al, 2000)。

目前,国内在这一领域的研究主要处于个例研究的阶段(周雪松等, 2008; 许爱华等, 2006; 许彤等, 2006; 张立等, 2010),通过对个例的总结,提出了不同地区和台站雨雪转换的经验温度阈值。李江波等(2009)通过对我国东部7次雨转雪过程的对比分析,提出0℃层高度下降到950hPa以下、地面气温在0℃上下,并且925hPa温度≤-2℃时雨转为雪,850hPa温度对降水相态影响不大。漆梁波等(2012)运用我国东部2005—2009年冬季20个探空站的资料,综合考虑温度因子和厚度因子作为判据,得到了我国东部雨、雨夹雪、雪、冻雨/冰粒的较好的判识依据。以上工作都是针对我国的部分地区,而且区域较广,对受地形和下垫面等影响较多的局地降水相态,没有很好的预报能力。

要进行精细化的更高准确率的预报,必须开发针对站点的降水相态的客观预报技术。赵瑞霞(个人交流)通过对多年实况的分析,总结概括了用日平均温度、最高温度和最低温度等预报雨和雪的温度阈值法,并在中央气象台初步实现了实时业务运行。但是这一方法只能给出某站24 h内的雨雪预报,一方面无法预报某一时刻的降水相态,另一方面对24 h内发生雨雪转换的事件,预报效果不好。

① 中国气象局国家气象中心预报员专项“中国降水性质预报的温度条件分析总结及业务应用”。

要对某一时刻的降水相态进行客观化的预报,线性回归法(LR)是应用最多的方法之一(Bocchieri, 1980; Keeter et al, 1991)。Allen(2001)Allen等(2001)将降水相态分为三类,冻雨(包括冰粒)、液态降水(包括降雨和雨夹雪)和固态降水(包括降雪和雪粒),用模式输出的地面、500、700、850、925和1000 hPa温度、露点温度、温度平流、u风速、v风速,以及1000—700 hPa、1000—850 hPa、1000—925 hPa、925—850 hPa、850—700 hPa和700—500 hPa的高度差作为预报因子,分别建立3种相态降水与各预报因子之间的线性回归方程,从而用于降水相态的预报。

然而,大气往往是非线性的,某一相态的降水与温度等要素之间并不是简单的线性关系,同时各气象要素之间又存在相互影响的关系。人工神经网络(ANN)法通过模拟人神经元之间反射的相互传导过程,可以用来模拟这一非线性的复杂系统(Gardner et al, 1998)。它已经被广泛地应用到气象研究和应用领域中(Fabbian et al, 2007; Shank et al, 2008; 胡江林等, 2001; 马学款等, 2007a; 马学款等, 2007b; 刘旸等2011; 孙军波等, 2010陈小华等,2013钱莉等,2010)。胡江林等(2001)将汛期前期(2—4月)的北半球月平均500 hPa高度场、海平面气压场和太平洋海温场的扩展自然正交展开(EEOF)的前几个主要模态的时间系数作为输入,湖北汛期降水场的自然正交展开(EOF)的前2个主要模态的时间系数为输出,运用三层神经网络,建立了湖北汛期降水量的短期气候预测模型,并取得了一定的成功。

本文将ANN法应用到降水相态的预报中,并重点对比了对于相同的预报因子,ANN法和LR法的预报效果。

1 资料和方法 1.1 资料

为了对比ANN法和LR法对降水相态的预报效果,本文只用实况资料,而不涉及数值模式预报资料。选取国家气象中心2001—2010年我国756站地面逐3 h观测资料,分别用ANN法和LR法建立了雨、雨夹雪和雪的预报模型,用2011年资料进行预报效果检验,对两种方法的预报效果进行对比。由于雨雪转换发生在很窄的温度区间内(图 1),为了包含对模型最敏感的样本,所以本文只考虑一定的温度范围内的降水事件,温度范围选为:地面2 m:-16~16℃;925 hPa:-16~16℃;850 hPa:-18~14℃;700 hPa:-24~8℃;500 hPa:-28~4℃;400 hPa:-32~0℃。这样剔除了对模型拟合贡献不大的全部是降雨的盛夏的样本,以及全部是降雪的隆冬的样本。

图 1 2001—2010年伊春站(海拔高度45 m,47.72°N、128.9°E)各高度温度与降水相态(o:降雨,+:降雪,×:雨夹雪)的关系 (a) 2 m与925 hPa温度,(b) 2 m与850 hPa温度,(c) 2 m与700 hPa温度,(d) 2 m与500 hPa温度(本文研究的温度范围内,伊春站发生降雨、降雪和雨夹雪的次数分别为217、215和32次) Fig. 1 Relations between precipitation types (o: rain, +: snow, ×: sleet) and temperatures at different heights of Yichun Station (altitude: 45 m, longitude: 128.9°E, latitude: 47.72°N) from 2001 to 2010 (a) 2 m vs. 925 hPa, (b) 2 m vs. 850 hP, (c) 2 m vs. 700 hPa, (d) 2 m vs. 500 hPa (The numbers of rainy, snowy and sleety days within the study temperature range are 217, 215 and 32 respectively)
1.2 预报量和预报因子的选取

为了将问题简化,并突出解决雨雪转换的预报难题,本文研究三类天气现象,雨、雨夹雪和雪。分别建立3个0—1分布的样本序列,当天气现象为雨(雨夹雪/雪)时,取值为1,是其他天气现象或者缺测值时为0。在2001—2010年的训练期,我国北方地区和青藏高原的样本数在500个左右,南方地区在1000个左右。其中降雨的样本在北方地区和青藏高原占50%~70%,南方地区占80%~90%;降雪样本在北方地区和青藏高原占20%~50%,华南大部没有降雪样本,江南其他地区在1%~10%之间;雨夹雪的样本量最少,在华南和云南南部为0,青藏高原在30~80个之间,我国其他地区在1~15个之间。雨夹雪是预报中的难点所在,其样本量稀少,对预报模型的建立,也会存在很大的不确定性。在2011年的检验期,总样本数以及各类型降水的占比,与训练期的年平均值相当,有接近二分之一的站点出现雨夹雪事件,个数大都在2个左右,青藏高原在10~30次左右(图略)。

降水相态与众多气象要素有关,例如:500、700、850、925和1000hPa的温度、湿度、温度平流、风速、风向,两层等压面之间的高度差,地面2 m的温度、湿度、风向和风速等(Allen, 2001)。为了把问题简化,同时考虑到ANN法的计算量较大,只选取较少的最重要的要素作为预报因子。

为研究不同相态降水与各层温度之间的关系,绘制了全国125个高空探空站降雨、雨夹雪和降雪与各层温度对应关系的散点图。图 1为黑龙江省伊春站的散点图,可见降水性质对地面2 m温度的敏感性最好,其次是近地层。雨、雨夹雪和雪共存的温度区间在地面2 m与925、850、700和500hPa分别为-1~2、-5~2、-8~-1、-20~-5、-20~-5℃,从地面2 m越往高层雨雪共存的温度区间越大,降水相态与温度的对应关系显著减弱。其他站点与伊春有相同的结论,即地面2 m温度的敏感性最好,其次是近地层。另一方面,我国的探空观测站只有125个,不但数量少,而且每天只有08和20时两个时次的观测,不利于大样本的统计计算。因此,在本文的对比试验中,只选取地面2 m的气象要素。再考虑到降水与湿度的关系,引入露点温度作为预报因子。

天气系统具有一定的时间连续性,气温、降水等要素和前期状态有一定的关系。而且中央气象台各家数值模式资料一般延迟7 h左右。这样可以运用实况观测代替模式前6 h的预报,从而能有效减小预报误差。对比试验也表明,引入降水发生前6 h的要素,一定程度上能提高预报准确率。因此本文选取降水发生时和发生前6 h的地面2 m温度和露点温度(T2mTd2mT2mpTd2mp)作为预报因子。

1.3 LR法和ANN法

LR法是应用最为广泛的统计方法之一(Wilks, 2006)。它假设预报量和预报因子之间存在线性关系。即:y=a+bT2m+cTd2m+dT2mp+eTd2mp,之后用训练期资料估计未知参数abcde,从而建立预报方程,最后将预报方程应用到预报中,分别求得3个参数rarssn,以表征降雨、雨夹雪和降雪发生的可能性的大小。降水相态与气象要素之间并不是简单的线性关系,LR法的假设条件不一定成立。而ANN法不存在这一问题,它不依赖于气象要素的概率分布形态,也不需要假设降水相态与气象要素之间存在线性关系(马学款等, 2007a)。通过模拟人类神经元之间的反射过程,ANN法可以用来构建预报因子和预报量之间的非线性的关系。一个神经网络分为输入层、隐藏层和输出层,每层由若干个神经元构成,每个神经元对应一个激活函数。隐藏层的多少,以及每个隐藏层所包含的神经元的个数,可以决定神经网络预报效果的优劣。在本文中,输入层有4个神经元,分别对应4个预报因子,输出层有3个神经元,分别对应3种相态的降水事件(图 2)。Hornik等(1989)的研究指出,只要激活函数光滑并有界,ANN法的预报效果与激活函数的关系不大,为了计算的方便,本文所有的激活函数都选logistic函数(胡江林等, 2001),即f(x)= $\frac{1}{{1 + \exp \left( { - x} \right)}}$ 。神经网络的训练适应,即通过迭代的方法,以方差最小为标准,计算神经元之间的传递参数,从而建立神经网络。迭代计算使得神经网络的计算量随着隐藏层的增加而急剧地增加,为了减小计算量,本文只用了一个隐藏层,且在这个隐藏层中只有2个神经元(图 2)。迭代适应的方法有许多种,由于不是本文的重点,此不累述。

图 2 降水相态与预报因子之间的神经网络示意图 Fig. 2 The artificial neural network between precipitation types and predictors

定义训练期拟合率为拟合正确的样本数与总样本数之比,各相态降水气候概率为训练期样本数与总样本数之比。以3个参数与相应气候概率之差最大,作为该类降水发生的判据。LR法的拟合率,降雨在南、北方分别为60%和80%左右,降雪在大部地区达到95%以上,雨夹雪在10%~50%之间,拟合方差对降雨、雨夹雪和降雪分别为0.09、0.01和0.05左右。ANN法的拟合率,对降雨和降雪都在95%以上,雨夹雪达70%,拟合方差对降雨、雨夹雪和降雪分别为0.08、0.01和0.02左右。可见就训练期拟合率和拟合方差而言,对3种相态降水,ANN法效果明显优于LR法。

1.4 ROC曲线和阈值的选取

ROC曲线(Receiver Operating Characteristics Curve)被广泛地用来表征确定性和概率预报的预报效果(Mason et al, 2002)。对本文而言,通过LR法和ANN法可分别求得3个与3种相态降水发生可能性大小相关的参数rarssn。以降雨为例,选择一个阈值,当ra大于等于这一阈值时,即认为预报了一次降雨事件,ra小于这一阈值,即认为预报了一次非降雨事件。此时可求得发生事件的命中率,即预报正确的降雨事件和总降雨事件的比例,同时求得未发生事件的命中率——正确拒绝率,即预报正确的无降雨事件和总无降雨事件的比例。改变阈值,可得到一组命中率和与其对应的一组正确拒绝率。之后分别以这两组数据为纵坐标和横坐标,可得如图 3所示的ROC曲线。最理想的状态,对发生和未发生事件的命中率都为1,此时ROC曲线通过左上角的(1, 1) 点。ROC曲线下面积为1。如果没有任何预报效果,随着阈值的增大,命中率和正确拒绝率将落在(1,0) 和(0,1) 的对角线上(图 3)。ROC曲线下面积为0.5。一般的预报都不能得到100%的命中率,ROC曲线下的面积在0.5和1之间,它的大小可以表征预报效果的优劣(Mason et al, 2002)。

图 3 ANN法(实线)和LR法(虚线)对2011年全国756站降雨(绿)、雨夹雪(红)和降雪(蓝)预报效果的ROC曲线 (横坐标为对未发生事件“0”的命中率,纵坐标为对发生事件“1”的命中率) Fig. 3 Receiver operating characteristic (ROC) curve for the forecast of rain (green), sleet (red) and snow (blue) of the 756 stations in 2011 by ANN (full line) and LR (dashed line) methods (The horizontal ordinate is the hit rate of no-event "0", and the vertical ordinate is the hit rate of event "1")

在实际应用中,需要从3个参数rarssn中选择一个,以确定最终预报的降水相态。本文用以下几种方法来确定预报的降水相态。

(1) 以最大值为判据。哪个参数最大,即预报哪种相态的降水。

(2) 以对发生和未发生事件命中率之和最大为标准,对3种相态降水分别求得各自的阈值rasrsssns,预报值与阈值之差最大作为标准。

(3) 雨夹雪的预报值rs普遍较小,考虑到预报值本身的概率分布形态,以预报值与阈值之差除以预报值的均方差为标准。

2 结果 2.1 2011年4月1日山西省雨雪个例检验

从2011年4月1日08时至2日08时,随着雨带的东移南下,雨雪分界线从山西省北部向南移动至河南省南部,山西省自北向南经历了一次雨转雪的天气过程(图略)。4月1日20时,山西省东北部以降雪为主,西南部以降雨为主(图 4)。LR法在山西省大部分预报sn在0.5~0.6之间,ra大部分在0.3左右,rs都小于等于0.06,预报降雪的参数明显大于降雨,雨夹雪的参数接近0。如果以最大值作为预报判据,那么LR法预报结果都为降雪,对南部的降雨无预报能力,预报的雨雪分界线明显偏南(图 4a)。ANN法预报效果明显优于LR法(图 4b)。对东北部的降雪事件,预报sn都大于或接近0.9,而预报rars都小于0.1。对西南部的降雨,预报ra都大于或接近0.9,预报rssn都在0.1左右或等于0。非常准确地预报出了20时山西省雨雪分界线的位置(图 4b)。

图 4 2011年4月1日20时山西省天气实况(*:降雪,·:降雨)和LR法(a)以及ANN法(b)对降雨(右上角数字)、雨夹雪(右下角数字)和降雪(左上角数字)的预报 (棕色线为实况雨雪分界线) Fig. 4 The weather (*: snow, · : rain, brown line: rain and snow separatrix) in Shanxi Province at 20:00 BT 1 April 2011 and the forecasts of rain (number at up-right), sleet (number at bottom-right) and snow (number at up-left) by LR (a) and ANN (b) methods

4月1日08时,山西省全境全部为降雨,LR法预报sn在0.4左右,ra在0.5左右,rs接近0,预报降雨的参数略大于降雪(图略)。4月2日08时,除西南部外,山西省全部为降雪,LR法预报sn在0.6左右,ra在0.4左右,rs接近0,预报降雪的参数大于降雨(图略)。综合LR法在1日20时预报结果,可见LR法对山西省此次雨雪天气的降水相态有一定的预报能力,全境都为降雨(雪)时,预报降雨(雪)的参数要大于降雪(雨)。当雨雪共存时,预报能力减弱,对雨雪分界线的预报偏差较大。

4月1日08时,ANN法在山西省全境预报降雪和雨夹雪的参数都接近0,预报降雨的参数在0.9左右(图略)。4月2日08时,ANN法对降雪事件预报sn大于0.9,rars都接近或等于0(图略)。可见ANN法预报雨雪相态的参数之间存在显著的差异,能更好地预报出降水相态。

2.2 2011年1月2日西南地区东部和江南多相态降水过程检验

受特殊的地理环境影响,我国西南地区和江南地区冬季的降水相态复杂多样,冻雨、降雨、雨夹雪、降雪和冰粒等常常同时出现,且不同相态降水经常发生转换,给预报带来了一定的困难。选取2011年1月2日08时至3日08时,发生在西南地区东部和江南地区大部的一次降水过程进行检验。1月2日20时,贵州西部以冻雨为主,东部大部分为雨夹雪,湖南北部以降雪为主,中部出现大量冰粒,南部降雨和雨夹雪共存,江西北部为降雪,中部为降雨,安徽南部和浙江北部大部分都为降雪(图略)。

对于江西省的此次雨雪共存的事件,LR法结果和山西省一样,预报江西全境都为降雨,且降雨参数ra都在0.9左右,明显大于降雪和雨夹雪的参数(图略)。ANN法的预报效果没有上述对山西省个例的好(图略)。对西北部的降雪事件,雨夹雪rs大都接近0,一半预报降雪参数sn在0.5左右,大于降雨ra的0.2~0.3,一半预报降雪参数sn在0.3左右,小于降雨ra的0.6左右,对降雨和降雪的预报参数都较小,不能明显地对降水相态进行区别。对江西省中部的降雨事件,位置偏南的大部分站ANN法预报降雨参数明显大于降雪参数,位置和雨雪分界线接近的站,降雨和降雪参数都较小,且差别不明显。

对于贵州省东部的雨夹雪和西部的冻雨,LR法预报全境降雨参数最大,在0.7~0.8之间,降雪和雨夹雪的参数接近或小于0.1。不但对雨夹雪的预报能力几乎为0,而且对雨夹雪和冻雨几乎没有分辨能力(图略)。ANN法对冻雨事件3个预报参数都在0.1左右,均较小,且相互之间没有明显的差异。对大部分雨夹雪事件,预报降雨的参数都小于0.1,降雪的参数和雨夹雪的参数相对较大,在0.3~0.5之间,且差异不明显(图略)。

1月2日20时,湖南省降水相态复杂,雪、冰粒、雨夹雪和雨共存。LR法预报降雨参数在0.7~0.9之间,降雪参数在0.1左右,雨夹雪接近0,降雨参数明显大于降雪和雨夹雪,对冰粒和降雪都报为降雨。与以上个例相同,对不同相态降水无分辨能力(图 5a)。ANN法预报降雪参数在0.5~0.8之间,降雨和雨夹雪参数在0.1左右或接近0,对冰粒事件,预报雨夹雪参数接近0,一半事件降雪参数明显大于降雨,另一半事件降雨参数明显大于降雪,对冰粒无预报能力(图 5b)。

图 5 2011年1月2日20时湖南省天气实况和LR法(a)以及ANN法(b)对降雨(右上角数字)、雨夹雪(右下角数字)和降雪(左上角数字)的预报 Fig. 5 The weather in Hunan Province at 20:00 BT 2 January 2011 and the forecasts of rain (number at up-right), sleet (number at bottom-right) and snow (number at up-left) by LR (a) and ANN (b) methods

可见,两种方法对北方的降水相态预报效果要优于南方,且ANN法优于LR法。LR法对不同降水相态的分辨能力较弱,当多相态降水同时存在时,LR法往往预报为一种相态降水,但对北方的雨雪共存事件,有一定的预报能力,对雨夹雪事件几乎没有预报能力。ANN法由于考虑了降水相态与各气象要素之间的非线性关系,能更好地反映它们之间的内在联系,对北方的雨雪分界线能够进行准确地预报,对南方的雨雪分界线和雨夹雪也有一定的分辨能力。虽然本文没有考虑对冻雨的预报,但ANN法对冻雨事件预报3个参数都较小,且之间没有显著的差异,可以用来分辨冻雨事件。

2.3 ROC检验

通过以上个例的分析,可以得到LR法和ANN法之间的定性的对比。要系统而全面地了解并比较两种方法之间的优劣,ROC曲线是一个很好的选择,并被广泛地应用到预报效果检验中(Honik et al, 1989)。同时,ROC曲线下面积可以用来定量地表征预报效果的优劣,当面积为1时,说明是最完美的预报,对所有事件预报准确,当面积为0.5时,说明没有任何预报能力(Mason et al, 2002)。

图 3为LR法和ANN法对2011年全国756站降雨、雨夹雪和降雪的预报效果的ROC曲线,可见两种方法对3种相态的降水都有一定的预报能力。但ANN法对降雨和雨夹雪的预报效果都好于LR法。两种方法对全国降雪的预报效果最好,其次是降雨和雨夹雪(表 1)。

表 1 LR法和ANN法对2011年全国756站和2011年1月长江中下游降雨、雨夹雪和降雪预报效果检验的ROC曲线下面积 Table 1 The area beneath the ROC curve for the forecasts of rain, sleet and snow by LR and ANN methods. The time for the 756 stations all over the country is 2011 and for the mid-lower reaches of Yangtze River Basin is January 2011

从第二个个例可见,长江流域的降水相态复杂,其雨雪相态预报是一个难点。2008年1月的低温雨雪冰冻灾害更是给长江中下游造成了巨大的灾害(杨贵名等, 2008)。由于长江流域的雨雪转换主要发生在1月,本文选取长江中下游流域(25°~32°N、103.5°~121°E),检验两种方法对1月雨、雨夹雪和降雪的预报效果。如图 6表 1可见,对长江中下游的降雨和雨夹雪ANN法优于LR法,尤其对降雨的预报优势明显。除降雨外,两种方法对3种相态降水的ROC曲线下面积,长江流域都小于全国756站的平均值,反映出对长江中下游流域降雪和雨夹雪事件进行预报的难度更大。

图 6 ANN法(实线)和LR法(虚线)对2011年1月长江流域中下游(25°~32°N、103.5°~121°E)降雨(绿)、雨夹雪(红)和降雪(蓝)预报效果的ROC检验结果(其他同图 3) Fig. 6 The ROC verification of the forecasts of rain (green), sleet (red) and snow (blue) for the mid-lower reaches of Yangtze River (25°—32°N, 103.5°—121°E) in January 2011 by the ANN (full line) and LR (dashed line) methods

运用两种方法最终都可以得到3个参数:rarssn,分别表征降雨、雨夹雪和降雪发生的可能性的大小。对于同一个站某一特定时刻,只会有一种相态的降水,需要在3个参数中选择一个,以决定最终的预报结果。因此涉及到3个参数的相互比较和阈值的选择。

以最大值作为判断降水相态的标准,能得到0.92以上的对降雨的命中率,但是相应的其正确拒绝率偏低,即误报率偏高,同时对雨夹雪的预报能力非常有限(表 2)。从个例分析中也可以看到,雨夹雪的预报参数rs普遍较小,因此导致了对雨夹雪的命中率接近0。

表 2 全国756站2011年3种阈值法对降雨、雨夹雪和降雪的命中率(h)和正确拒绝率(c) Table 2 Hit rate (h) and correct reject rate (c) of the 756 stations in 2011 for rain, sleet and snow using the three threshold methods

以命中率h和正确拒绝率c之和——即ROC曲线上横坐标和纵坐标之和最大为标准,确定各降水相态的阈值,再以各参数与阈值之差最大为判别标准。此时降雨的命中率会有所减小,但降雨的正确拒绝率会增大,更重要的是雨夹雪的命中率由接近0增大到0.3左右,此方法对降雪的影响不大。

将以上数值再除以预报值的标准差,使结果“标准化”。此时降雨和降雪的命中率进一步减小,相应两者的正确拒绝率增大。最明显的效果是对雨夹雪的预报,使雨夹雪的命中率增大到接近0.6(表 2)。整体而言,运用3种判别方法,ANN法预报效果大都好于LR法。如果以命中率和正确拒绝率之和最大为标准,同时可以不考虑雨夹雪事件时,第二种方法是最好的。如果想提高对雨夹雪事件预报准确率,可以采用第三种方法,同时需要牺牲对降雨和降雪的预报准确率。

将以上3种方法应用到1月的长江中下游流域。用第一种方法时,LR法几乎没有预报能力,把非降雨事件几乎都预报为降雨,对雨夹雪和降雪的命中率都非常低,ANN法预报效果较好。用第二种方法时,LR法和ANN法对3种相态降水的预报能力得到了显著提高。尤其是LR法,对降雨的正确拒绝率从0.012提高到0.862,对雨夹雪和降雪的命中率分别从0.006和0.044提高到0.646和0.609。用第三种方法时,对预报结果的提高不明显,说明3种相态降水的预报参数的均方差接近。与全国的预报结果相比,对降雨和降雪,长江中下游LR法和ANN法用3种方法的命中率和正确拒绝率都小于全国值,但雨夹雪大于全国值,这也许与长江中下游雨夹雪样本较多有关。

3 总结与讨论

对比发现,无论是全国还是长江中下游,对降雨、雨夹雪和降雪,ANN法的预报效果大都优于LR法。同时预报效果与地理位置有关,两种方法对北方的预报效果要好于南方。当温度和露点温度准确时,ANN法对北方的雨雪分界线可以进行准确的预报,对南方的预报存在一定误差。LR法对南方和北方的雨雪分界线的预报误差都较大,对雨雪共存的事件,往往预报结果为单一的降水相态,对其他降水相态无反应。对长江流域较为复杂的降水相态,LR法预报为单一的降水相态,ANN法对各相态降水有一定的预报能力。在3种相态的降水中,雨夹雪的预报效果最差,降雪的预报效果最好,降雨次之。

比较3种降水相态判别的标准,最大值法对降雨的正确拒绝率较低,对雨夹雪的命中率接近0。以命中率和正确拒绝率之和最大为标准确定一个阈值,再以预报值与阈值之差最大为标准,在一定程度上能提高降雨的正确拒绝率,并且对雨夹雪的命中率有明显的提高。进一步将预报值与阈值之差再除以预报值的均方差,能进一步提高雨夹雪的命中率,但对降雨和降雪的命中率有所降低。所以在实际应用中应该综合考虑对雨夹雪的预报要求,而灵活地选择第二或第三种方法。

LR法和ANN法对长江中下游雨夹雪和降雪的预报效果不如全国。用最大值法时LR法对3种相态降水几乎都没有预报能力,其他两种判别方法对3种相态降水的预报能力有明显的提高,且提高程度相同。以实况观测为预报因子,预报当时的实况降水相态,依然存在很大的不可预报性,说明降水相态不仅和地面2 m的温度和露点温度有关,而且和地面2 m的其他气象要素,以及高层的温度、湿度、风速和地形地理环境等要素有关。要对降水相态进行更准确的预报,需要选取更多的预报因子,包括地面2 m和高空各层的气象要素,以及更好的预报方法。

参考文献
陈小华, 段旭, 2013. 基于卫星和雷达资料估测滇中地区降水量方法研究[J]. 气象, 39(2): 203-209. DOI:10.7519/j.issn.1000-0526.2013.02.009
胡江林, 张礼平, 宇如聪, 2001. 神经网络模型预报湖北汛期降水量的应用研究[J]. 气象学报, 59(6): 776-783. DOI:10.11676/qxxb2001.081
李江波, 李根娥, 裴雨杰, 等, 2009. 一次春季强寒潮的降水相态变化分析[J]. 气象, 35(7): 87-95. DOI:10.7519/j.issn.1000-0526.2009.07.013
刘旸, 官莉, 2011. 人工神经网络法反演晴空大气湿度廓线的研究[J]. 气象, 37(3): 318-324. DOI:10.7519/j.issn.1000-0526.2011.03.009
马学款, 蔡芗宁, 杨贵名, 等, 2007a. 重庆市区雾的天气特征分析及预报方法研究[J]. 气候与环境研究, 12(6): 795-803.
马学款, 普布次仁, 唐叔乙, 等, 2007b. 人工神经网络在西藏中短期温度预报中的应用[J]. 高原气象, 26(3): 491-495.
漆梁波, 张瑛, 2012. 中国东部地区冬季降水相态的识别判据研究[J]. 气象, 38(1): 96-102. DOI:10.7519/j.issn.1000-0526.2012.01.011
钱莉, 兰晓波, 杨永龙, 2010. 最优子集神经网络在武威气温客观预报中的应用[J]. 气象, 36(5): 102-107. DOI:10.7519/j.issn.1000-0526.2010.05.015
孙军波, 钱燕珍, 陈佩燕, 等, 2010. 登陆台风站点大风预报的人工神经网络方法[J]. 气象, 36(9): 81-86. DOI:10.7519/j.issn.1000-0526.2010.09.013
许爱华, 乔林, 詹丰兴, 等, 2006. 2005年3月一次寒潮天气过程的诊断分析[J]. 气象, 32(3): 49-55. DOI:10.7519/j.issn.1000-0526.2006.03.009
许彤, 田丰, 2006. 桃仙机场雷雨转雨夹雪天气的分析[J]. 广西气象, 27(4): 34-36.
杨贵名, 孔期, 毛冬艳, 等, 2008. 2008年初"低温雨雪冰冻"灾害天气的持续性原因分析[J]. 气象学报, 66(5): 836-849. DOI:10.11676/qxxb2008.076
张立, 王晖, 张志鹏, 2010. 东营一次初冬寒潮天气的降水相态分析[J]. 山东气象, 30(3): 15-18.
周雪松, 谈哲敏, 2008. 华北回流暴雪发展机理个例研究[J]. 气象, 34(1): 18-26. DOI:10.7519/j.issn.1000-0526.2008.01.003
Allen R L, 2001. MRF-based MOS precipitation type guidance for the United States[J]. NWS Tech Procedures Bull: 485, 12..
Allen R L, Erickson M C, 2001. AVN-based MOS precipitation type guidance for the United States[J]. NWS Tech Procedures Bull: 476, 10.
Bocchieri J R, 1980. The objective use of upper air soundings to specify precipitation type[J]. Mon Wea Rev, 108: 596-603. DOI:10.1175/1520-0493(1980)108<0596:TOUOUA>2.0.CO;2
Fabbian D, Dear R de, Lellyett S, 2007. Application of artificial neural network forecasts to predict fog at Canberra international airport[J]. Wea Forecasting, 22: 372-381. DOI:10.1175/WAF980.1
Gardner M W, Dorling S R, 1998. Artificial neural network (the multilayer perceptron)——A review of applications in the atmospheric sciences[J]. Atmospheric Environment, 32(14/15): 2627-2636.
Hornik K, Stinchcombe M, White H, 1989. Multilayer feedforward networks are universal approximators[J]. Neural Networks, 4(2): 251-257.
Kain J S, Goss S M, Baldwin M E, 2000. The melting effect as a factor in precipitation-type forecasting[J]. Wea Forecasting, 15: 700-714. DOI:10.1175/1520-0434(2000)015<0700:TMEAAF>2.0.CO;2
Keeter K K, Cline J W, 1991. The objective use of observed and forecast thickness values to predict precipitation type in North Carolina[J]. Wea Forecasting, 6(4): 456-469. DOI:10.1175/1520-0434(1991)006<0456:TOUOOA>2.0.CO;2
Mason S J, Graham N E, 2002. Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: statistical significance and interpretation[J]. Q J R Meteorol Soc, 128: 2145-2166. DOI:10.1256/003590002320603584
Shank D B, Hoogenboom G, McClendon R W, 2008. Dewpoint temperature prediction using artificial neural networks[J]. J Appl Meteor Climatol, 47: 1757-1769. DOI:10.1175/2007JAMC1693.1
Theriault J M, Stewart R E, Henson W, 2010. On the dependence of winter precipitation types on temperature, precipitation rate and associated features[J]. J Appl Meteor Climatol. DOI:10.1175/2010JAMC2321.1
Wilks D S, 2006. Statistical methods in the atmospheric science: 2nd edn[M]. Burlington: Academic Press, MA; 649.