2. 宁波市气象信息中心, 宁波 315012;
3. 上海台风研究所, 上海 200030;
4. 宁波市气象台, 宁波 315012
2. Ningbo Meteorolgical Information Center, Ningbo 315012;
3. Shanghai Typhoon Institute/CMA, Shanghai 200030;
4. Ningbo Meteorolgical Office, Ningbo 315012
地面风力的大小通常是由气压梯度、高空风的动量下传等因素决定的,由热带气旋引起的风,也不例外。台风风力的预报既要考虑台风自身的情况,还要考虑环境场及其他系统的作用。早期的站点大风预报往往是基于某个统计学模式[1],分析历史样本数据,找出线性的拟合公式,再用于实际预报。但是,实际上热带气旋风场的分布是非线性的,因而寻找合适的统计模型来进一步提高预报精度,有很大的难度。于是一些非线性的数学理论和方法开始逐渐引入统计预报方法中[2-4]。比如人工神经网络模型,已经在热带气旋的路径和频数预报以及其他气象要素场的反演预报中[5-7, 14],取得了比以前的一些统计预报方法更好的预报效果。现在,随着数值预报的发展,其在实际工作中所起的作用越来越大,把数值预报结果进行统计释用的方法,已经成为预报工作中的一个重要内容。
目前的数值预报对环境场要素的一些预报准确率还是比较高的,但是数值预报的资料都是网格点资料,虽然能反映一定范围内的气象要素特征,但是对于具体某个站点不够直接和缺少针对性,与实际的地面站点的观测数据有一定的误差。本文作为数值预报的一种统计释用方法,结合统计预报的因子分析和数值预报的结果,应用拟合和预报效果相对较好的人工神经网络方法,分析了登陆台风期间站点实况资料和NECP再分析场资料的一些相关特征和因子,尝试直接对各站点的地面风向风速做出预报,以方便在实际预报工作中的应用。
1 资料2002—2007年的NCEP再分析场资料,来自中国气象局上海台风研究所(CMA-STI)的热带气旋最佳路径数据集和来自国家气象中心的MICAPS实时站点资料。其中2002—2006年用于建立模型,2007年作为独立样本检验。
1.1 建模和预报站点的选取台风带来的灾害主要集中在我国东南沿海地区,因而建模样本和预报站点都选择了沿海地区的山东、江苏、上海、浙江、福建、台湾、广东、广西和海南境内的站点,剔除部分资料缺失较多的,共472个站点。整理所有站点和时次的资料,共计86847个建模样本,平均每个站点有184个时次的样本,以及9218个独立检验样本。
1.2 相关因子的内插方法说明由于700 hPa、850 hPa上的风速和地面气压都是选用NCEP再分析场的格点资料,所以必需内插到站点所在位置。为了计算简便,这里采用了简单的距离内插方法:根据站点位置所在的网格的4个格点上的值,把站点到网格格点的距离平方的倒数作为比例系数,计算权重,最后取平均所得。
相关因子中地面西北6格点的变压,是站点所在网格的西北相邻网格上6个格点的平均气压与6小时前平均气压的差(图 1)。西北格点气压值是以(i-2,j+1)到(i, j+2)相邻的6个格点的平均值。副高脊线位置:是以130°E到160°E范围内,副高脊线上经度最小点的纬度位置。
把地面站点上的风分解成纬向分量U和经向分量V两部分,然后按照完全预报法(PP法)[13, 15]的思路,从NCEP再分析场资料和台风年鉴等资料中找出相关因子,分别对U、V做拟合分析。预报时,把实时NCEP数值预报资料和中央台的台风实况和预报位置做内插以后,代替建模时相应的资料,分别对U、V做出预报,计算合成风速和风向。
根据大风产生机理、影响天气系统和以往预报经验的总结,以及从NCEP再分析场资料获得的相关量的分析,选择了与大风产生影响比较大的表示气压场、高低空风场、冷空气、副高和台风本身一些情况等总共27个因子。再利用NCEP的再分析场格点资料,对10°~40°N,100°~130°E范围内做了1°×1°网格点(共961个格点)上的逐步回归分析。在每一个网格点上,针对U和V分别建立了不同的回归预报方程。在格点回归方程的基础上,选出合适的预报因子,再对站点资料采用人工神经网络的方法建立预报模式[8-11]。
2.2 预报因子的选择与分析根据各网格点上回归方程中相关因子引用次数从高到低的原则,选择了引用次数最多的7个因子,作为统计各格点回归方程中的预报因子。再加上根据台风到站点的距离、台风的中心气压和近中心最大风速所构造的2个因子,共9个因子(表 1)。
台风近中心最大风速、中心气压和距离与各点的风速的相关性并不是很好,通过组合形成的X7、X8两个因子,获得了比单个因子更好的相关性。
一般认为[12],站点的风速与到台风中心的距离和台风中心的最低气压成反比,跟台风中心附近最大风速成正比,所以构造了两个因子,一个因子是中心气压乘以距离,另一个最大风速除以距离,以反映台风本身强度和站点离台风中心的远近,对站点的风所造成的影响。但是考虑实际情况中, 台风中心附近的风速并不大,而近中心最大风速圈一般在距台风中心几十千米左右,而台风影响范围一般在500~1000 km范围内,因而需要对这两个因子中,位于最大风速圈半径内的站点到台风中心的距离做一些修正,使得风速和台风径向距离尽可能地呈一种反比关系。对台风最大风速圈外和圈内的径向风速递减率做简单处理,把风速递减看成是线性的,而且台风即将登陆或登陆以后,台风眼结构往往变得不明显或者消失,所以台风中心的风速也不会像理想情况那样,接近于无风区,实际观测至少要比台风影响范围边缘的风要大很多(图 2),得到在最大风速圈内的距离修正公式,距离台风中心越近,修正后的距离越大。由于缺少台风结构的直接数据,若以一般情况假设台风影响范围半径700 km,最大风速圈50 km,最大风速35 m·s-1, 边缘环境场风速4 m·s-1,台风中心区风速12 m·s-1, 代入公式计算最大风速圈内外的风速递减比率之比为9.6,为简单起见取比例为9。则最大风速圈内的距离修正公式为:
$ {{R}_{\rm{内修}}}=50+9\times \left( {{R}_{\rm{内}}}-50 \right) $ |
从表 1相关系数的情况可以得出:
(1) 700 hPa、850 hPa的风速同地面站点风速有着比较直接的关系。
(2) 台风近中心最大风速、台风中心气压这两个因子不能很好地反映台风本身的风场分布,而且整个台风范围内的实际风速分布与假设台风风速径向上线性变化有着较大差别。
(3) 两个变压因子是用来反映冷空气或者其他一些天气系统的影响,虽然与U分量的相关性很差,但与V分量要好一些,考虑冷空气等因素对秋季台风的影响较大,所以也采用。
(4) 某一时次的副高位置是个定值,而各站的地面风速却是相差很大的,所以总体的相关性很小,但是从逐步回归方程的引用次数反映,对于具体某个站点还是有一定的相关性,再考虑到副高脊线位置对台风预报的重要意义,所以也把它作为一个预报因子。
2.3 人工神经网络站点预报模型的建立台风影响下的站点风速有很大的地域差异,所以对每个预报站点分别建立风速风量U、V的预报模型。
2.3.1 人工神经网络的构造每个站点都采用了相同的4层前馈(BP)人工神经网络模型。网络输入层,9个节点;两个隐藏层,第一隐藏层9个节点,第二隐藏层3个节点,输出层,1个节点。激活函数,采用S型函数:
$ \begin{array}{l} {\varphi _j}\left( {{v_j}\left( n \right)} \right) = \frac{1}{{1 + \exp \left[ { - a{v_j}\left( n \right)} \right]}}\\ a > 0\;\;\; - \infty < {v_j}\left( n \right) < + \infty \end{array} $ |
其中vj(n)是j神经元的局部诱导域,a=0.75。反向训练中:网络系数修正量:
$ \Delta {w_{ij}} (n)= \alpha \Delta {w_{ij}}\left( {n - 1} \right) + \eta {\delta _j}\left( n \right){y_j}\left( n \right) $ |
动量系数α=0.3,学习率η,输出层到第二隐藏层取0.1,其余层取0.2。反向训练采用串行方式,即每一个样本训练后立即修改网络权重系数。
2.4 样本的人工神经网络拟合效果 2.4.1 风速的拟合效果所有站点样本拟合风速平均误差是0.72 m·s-1,平均绝对误差是1.24 m·s-1,标准差1.93 m·s-1。拟合风速比实际风速略偏小。从各站点的所有样本的平均实际风速和拟合风速的平均绝对误差的分布图(图 3)上看到:
(1) 各站点的拟合效果相差还是较大,平均绝对误差在0.7~2.6 m·s-1的范围内。
(2) 当测站的实际风速不大,拟合误差小,拟合风速和测站的实际风速接近,相关性好。实际风速增大,误差也有增大的趋势,当拟合风速>8 m·s-1时,平均绝对误差达到了2.31 m·s-1,对于大风的拟合效果相对要差一些。
2.4.2 风向的拟合效果拟合风向是根据拟合风速U、V的大小,计算方位角所得。
统计所有拟合风速和实际风速都>0 m·s-1的样本(静风除外), 总体平均风向夹角36°,以十六制风向衡量,拟合风向与实际风向相差在一个到两个风向以内。各站的风向拟合效果,除个别站点差异较大,大部分还是比较接近的。
2.4.3 拟合风速系统误差分析最终的站点风速是由风速分量U、V的计算所得,由于计算误差以及各因子对U、V影响程度的差异等原因,造成了系统误差的存在。统计不同实况风速条件下的总体拟合风速误差(表 2)。对实况风速>5.4 m·s-1(风力4级及以上)的样本进行统计,表明拟合风速分量U和V合成得到的拟合风速比实际风速平均偏小2.25 m·s-1。
在实际台风预报工作中比较关注站点大风的预报精度。对于小风速,预报偏大2~3 m·s-1,对实际预报服务工作并没有大的影响。但是对于大风,预报偏小一些比预报偏大一些的负面影响就要大得多。所以根据表 2,对预报风速再做出修正如表 3。
选2007年主要的5个登陆影响台风,利用NCEP再分析场资料和台风实况路径资料对其做独立预报检验,用地面台站的实况资料,对距离台风中心经纬度小于10°范围内站点的预报结果做检验(表 4)。
从检验效果看:模式的风速预报效果要好于NCEP再分析场资料站点风速的直接内插。但风向拟合建模比较好,预报要差一些。其部分原因是实际地面风向受测站周围地形影响很大,在预报因子中没有考虑这方面因素,再加上风向垂直切变较大,而预报因子中高空因子居多,使得基于历史样本的预报模型对于风向预报的泛化性比较差。
4 小结与讨论模型中的预报站点涵盖了我国沿海地区的绝大部分测站,在热带气旋登陆期间,可以做到风场面上的预报。站点中包括了海岛站、高山站等多种地形下的站点,一定程度上体现了地形等因素干扰下的风场特征,减少了数值预报结果在海平面上风场平滑后的误差。而且直接对站点做预报,更加直观,减少了数值预报网格资料的内插和修正的环节,有利于在实际预报工作中的应用。
在时效上,预报模型的时间间隔6小时,总计60小时的预报时效,接近目前实际预报工作中对热带气旋即将登陆期间的预报时效的要求。预报结果能够反映各站点在此期间的风的变化情况,使得预报员对于大风的预报节奏,有个整体的把握。
预报模式准确率的时效变化,主要取决于模式采用的资料。由于独立样本检验采用的NCEP再分析场资料和台风实况路径资料,不同时效的预报准确率是接近的。在实际应用中,实况资料会被数值预报资料代替,随着预报时效增长,预报效果会有所变差。
4.1 关于预报精度预报模型比以前的统计方法的精度有所提高。在热带气旋即将登陆期间,对台站大风预报有较好的参考作用。不过在实际应用中,对于个别站点出现风速较大,变化较快时,预报误差相对偏大。
分析整个预报方法和预报结果,要想进一步提高预报精度,还存在以下几方面的影响因素:
(1) 所有样本中的相关因子与站点风速并不是线性可分的,由于数据中风速较小的样本占了大多数,因而整个人工神经网络系统在拟合训练以后,拟合精度自然地偏向风速小的样本。
(2) 所选的相关因子有限。地面风的变化除了与入选的几个因子相关外,还跟站点的地理位置、台风系统中的中尺度结构、大气湍流等等因素有关。而且风是阵性的,即使在气象条件相近似的情况下,不同站点或者同一站点不同时间,风速也存在较大差异。
(3) 预报精度除了系统本身的误差之外,还依赖于NCEP数值预报和国家气象中心的台风路径和强度预报的精度。
4.2 关于预报结果的应用由于资料的原因,本文方法预报的是各站点的定时2分钟风向风速,所以预报和实际风速都相对较小。但在实际的预报服务工作中,我们关心更多的是一段时间内站点出现的最大风速和极大风速。因而实际预报时,在定点2分钟风的基础上,增加两到三级,作为站点的最大和极大风速预报,与实际测站出现的最大和极大风速比较接近。
杨平章, 郭英琼, 李丹, 1994. 华南沿海台站热带气旋风力预报[J]. 中山大学学报论丛, (5): 33-39. |
金龙, 2004. 神经网络气象预报建模理论方法与应用[M]. 北京: 气象出版社, 75-201.
|
Simon Haykin著. 叶世伟, 史忠植译. 神经网络原理[M]. 北京: 机械工业出版社, 2004: 33-76.
|
Buck Land, M. 著. 吴祖增, 沙鹰译. 游戏编程中的人工智能技术[M]. 北京: 清华大学出版社, 2006: 158-239.
|
余晖, 薛宗元, 2000. 若干经验统计方法预测影响华东地区热带气旋年频数的对比试验[J]. 大气科学研究与应用, (19): 87-93. |
周曾奎, 韩桂荣, 朱定真, 等, 1996. 人工神经网络台风预报系统[J]. 气象, 22(1): 18-21. DOI:10.11676/qxxb1996.002 |
李柞泳, 邓新民, 1995. 人工神经网络在台风预报中的应用初探[J]. 自然灾害学报, 4(2): 86-90. |
蒋乐贻, 费亮, 1997. 台风路径人工智能预报方法的研制[J]. 应用气象学报, 8(2): 254-255. |
王静, 程明虎, 2007. 用神经网络方法对雷达资料进行降水类型的分类[J]. 气象, 33(7): 55-60. DOI:10.7519/j.issn.1000-0526.2007.07.006 |
施能, 1992. 气象统计预报中的多元分析方法[M]. 北京: 气象出版社, 234-297.
|
黄崇福, 王家鼎, 1995. 模糊信息优化处理技术及其应用[M]. 北京: 北京航空航天大学出版社, 186-213.
|
丁一汇, 2005. 高等天气学(第二版)[M]. 北京: 气象出版社, 281-294.
|
林良勋, 程正泉, 张兵, 等, 2004. 完全预报(PP)方法在广东冬半年海面强风业务预报中的应用[J]. .应用气象学报, 15(4): 485-493. |
张雪慧, 官莉, 王振会, 等, 2009. 利用人工神经网络方法反演大气温度廓线[J]. 气象, 35(11): 137-142. DOI:10.7519/j.issn.1000-0526.2009.11.018 |
高栓柱, 张守峰, 钱传海, 等, 2009. 基于位置误差的分布制作热带气旋路径袭击概率预报[J]. 气象, 35(9): 38-43. DOI:10.7519/j.issn.1000-0526.2009.09.005 |