2. 中国科学院大气物理研究所;
3. 总参气象水文空间天气总站
2. Institute of Atmospheric Physics, Chinese Academy of Sciences;
3. Meteorology, Hydrology and Space Weather Terminal Center of General Staff
经典的时间序列分析方法基本上都是线性时间序列分析,所谓线性时间序列分析就是指产生该时间序列的系统是线性的[1],线性时间序列分析的方法已经很成熟了。ARIMA模型是目前最常用的线性时间序列拟合模型。它有四种不同的表现形式:自回归(AR)、滑动平均(MA)、自回归滑动平均(ARMA)、自回归求和滑动平均(ARIMA)。其流程主要包括四个步骤:模型识别→参数估计→模型检验→序列预测。然而实际中的时间序列更多的是非线性的,用线性的方法去做往往会得出不正确的结论或者是拟合很好但预测很差。在实际预测工作中人们发现数理方法尽管十分完善,但在天气预报和气候预测中有时也会遇到巨大困难,即所谓的“预测瓶颈”[2]。
20世纪70年代末,以混沌理论为核心的当代非线性科学得到了迅速发展,有力地推动了时间序列的分析研究。人们发现,即使是一个十分简单的、完全确定的非线性系统,在一定的条件下也可以表现出非常复杂、非常随机的性质。动力学意义上的非线性时间序列分析开创于20世纪80年代初,它以重建相空间为基础,研究相空间动力轨道的性质,并据此进行预测。这类方法在本质上是动力学的、非线性的,在观念和方法上都有原始性的创新,非线性科学的思想和手段被应用到时间序列分析领域,形成了非线性时间序列分析这一新型的学科分支[3]。
非线性时间序列分析有许多方法,但没有通用的方法。非线性模型不像线性模型那样有统一的表达方式,而且某些类型的模型在某些领域有较好的应用前景,而对另外领域却不适合,这也是非线性时序分析的难题之一[1]。
本文着重介绍非线性时间序列分析方法在气候领域中的应用[4-6],主要包括以下三个方面:观测数据处理、气候突变、气候预测。
1 非线性时间序列分析在观测数据处理中的应用观测数据处理主要包括观测数据的信息提取和降噪。在信息提取方面,常用的方法有小波变换(Wavelet Transform, WT)、经验模态分解(Empirical Mode Decomposition)。小波变换是泛函分析、傅里叶变换、样条分析、调和分析和数值分析的结晶,其在时频域中具有良好的局部化特征,能够比较有效地从变化信号中提取信息,通过对基函数的伸缩、平移运算,达到对信号的多分辨率分析[7]。经验模态分解从本质上讲是将一个信号进行平稳化处理,可以把不同特征尺度或层次的波动或趋势从原信号中分解出来,得到一系列具有不同特征尺度的本征模函数(Intrinsic Mode Function, IMF)分量,对各个IMF分量进一步作Hilbert变换,可得到Hilbert谱。该方法被认为是近年来以傅里叶变换为基础的线性和稳态谱分析的一个重大突破[8]。龚志强等[9]对经验模态分解和小波分解异同性进行了系统的比较;并对不同代用资料进行周期检测,发现存在不同尺度周期且准100年尺度是共同周期,在准100年以上尺度层次上动力学结构特征和外部特征有可比性,随尺度降低可比性降低。姚檀栋等[10]将Hilbert变换和Fourier变换结合应用于青藏高原古里雅冰芯发现,其中18O时间序列的变化存在着不同尺度的准周期;将结果与树轮序列对比发现存在相似周期。杨保等[11]研究了近2000年都兰树轮10年尺度的气候变化及其与中国其他地区温度代用资料的比较。
在观测数据的降噪方面,通常从两个不同的方面着手。一方面是设计一些抗噪声的算法来提取感兴趣的信息,如具有较好鲁棒性的计算Lyapunov指数的方法、近似熵、复杂度等;另一方面是首先降低噪声对数据的影响,然后再分析信号中所包含的有用信息,如从物理学的角度出发对数据中的噪声进行剔除,或者计算数据的概率密度分布、数据的粗粒化和平滑等方法。降噪就是将实验采集的时间序列分解为干净的信号和随机的噪声波动两部分,其次去除噪声波动便得到干净的信号[12]。在气象中应用时,由于大气系统是一个非线性系统,线性滤波方法不仅不能将噪声去除,反而会使非线性确定性信号发生扭曲,进一步增加信号复杂性,因此需要采用非线性的降噪方法。侯威等[13]引入了基于相空间重构和返回图法的搜索平均法(Searching Average Method, SAM),其核心思想是,先确定某数据点的最佳局部邻域,从被噪声污染的混沌信号中正确识别出原动力系统的流形(局部演变特征),再在局部将原始信号向流形方向靠拢,用最佳邻域内数据点的平均值作为该点降噪后的修正值,将搜索平均法SAM应用于被高斯白噪声污染的Henon映射和逐日气温观测时间序列,用非线性预报衡量降噪效果,验证了SAM的有效性。为了衡量降噪效果,可用正规化预报误差来量化实际数据降噪前和降噪后的可预报性。由于气候系统的层次性,近年来,发展了一种基于数据的机理模式用于降噪[14]。
2 非线性时间序列分析在气候突变中的应用时间序列分析是一门涉及到几乎一切科学和技术的学问,突变分析是时间序列研究的一个重要方面。气候突变是指气候变化中相对稳定态的不连续跳跃,气候性质发生了根本改变,它是一种多时间尺度现象,是气候系统所具有的非线性表现形式之一。气候突变的研究对认识气候变化的性质及气候预测有重要意义,因此,气候突变作为非线性时间序列的一个重要规律受到人们的重视,其主要内容是突变的检测与归因。龚志强等[15]基于非线性时间序列分析方法,提出一种新的动力结构突变的检测方法——动力学指数分割算法,将原序列划分为若干窗口,分别将其作为参考窗口并计算动力学自相关因子指数值,然后用统计值量化表示某点左右两个窗口动力学指数的差异,统计值越大表示左右两部分动力结构差异越大。通过理想时间序列试验,验证了该方法检测动力结构突变的有效性,同时发现相对少量的尖峰噪声对该方法的影响较小,但连续分布的随机白噪声对其具有一定的影响,并与传统的滑动T检验法[2]和Yamamota法[2]进行了比较。龚志强等[16]对树轮宽度和石笋微层厚度距平序列从不同角度进行检测比较,以全球气候变化为背景研究我国华北气候变化特征,结果表明局地和全球气候同步变化,在百年尺度上自然变率是气候突变主要贡献者,而高频部分人为因素对其有影响。侯威等[17]计算了古里雅冰芯资料和北京石花洞石笋资料的复杂度,表明复杂度序列有几个特征准周期,取不同滑动步长和窗口长度特征基本相同,其突变和气候突变有较好对应关系;380年准周期振荡振幅在减弱;人为因素还没影响到世纪尺度层次上。
气候突变还与气候系统的层次结构有关。气候系统是一个典型的非线性强迫耗散的开放非平稳系统,而气候系统的多层次结构正是产生非平稳行为的根本原因。杨培才等[18]详细讨论了气候系统的层次结构和非平稳行为。施能[19]从层次结构理论出发,对青藏高原古里雅冰川序列以及地球自转、ENSO信号和太阳黑子等自然因素进行了具有物理背景的分层,并对原序列及其两个层次进行对比分析,结果表明有准周期演变特征,近百年来年代际突变可能是全局性的,影响因素中ENSO年际变化的贡献最大。戴新刚等[20]研究了近50年华北汛期降水的频谱结构和演变特征及其与夏季风衰变的关系,表明伴随20世纪60~70年代东亚季风的两次年代际变化,我国大部分地区都出现了年代际尺度的旱涝更替。
3 非线性时间序列分析在气候预测中的应用预测和控制是所有时间序列分析的终极目标,建模几乎是必经之路,模型种类很多,包括传统的线性模型,如AR, MA, ARIMA;传统的非线性模型,如门限自回归、马尔科夫链;动态系统模型,如Kalman滤波,多层递阶预测;多元回归模型;变量场预测模型;统计学习模型,如神经网络,支持向量机[21];混沌模型;随机统计模型等。在气象方面,魏凤英[2]提出了用多元分析手段解决时间序列预测的均生函数(Mean Generate Function, MGF)模型,均生函数即均值生成函数,它是按照一定的时间间隔计算均值而生成的,把均生函数看作基函数对其作周期性延拓,可得预报方程;Kalman滤波多被用于短期天气预报和数值预报产品释用,但也有人用于短期气候预测[22];回归发展出了与最小二乘法估计不同的方法,如主成分回归、特征根回归、岭回归;王革丽等提出了场时间序列预测的新思想和新理论[23]。
气候预测模型的研究上,万仕全等[24]构建了基于IMF的气候预测模型,其基本思想是:首先利用EMD对时间序列进行平稳化处理,得到一组平稳分量IMF;然后利用均生函数MGF模型分别对各IMF分量作多步预测;最后以部分预测值作为新样本,作最优子集回归(Optimal Subset Regression, OSR)拟合建立预测方程,实现预测。张德宽等也采用均生函数——最优子集回归法设计了短期气候预测模型,结果表明该模型不但能较好地拟合历史实况, 而且对未来1~5年的演变趋势也具有一定的预报能力[25]。基于大气运动是一种不可逆过程的观点, Cao[26]提出了大气运动的自忆性原理并建立了自忆方程,封国林、董文杰等对其进行了丰富与应用。曹杰等[27]根据反演建模理论,在引入一次样条函数的基础上,设计了一种局地非线性气候动力统计模型及其一整套反演方案并用云南逐月温度距平和雨量距平的时间序列进行了试验,结果表明此模型具有一定的拟合和预报能力,同时具有良好的稳定性。洪梅等[28]用遗传算法从离散时间序列资料中反演重构了非线性动力模型,随后,对10年平均的副热带高压形态指数时间序列进行动力模型参数反演和仿真预报试验,结果表明,遗传算法具有的全局搜索和并行计算优势能够较为准确地描述和刻画副热带高压活动,能对副高活动进行较为准确的描述与建模,是诊断和预测副热带高压等复杂天气系统活动的一条有效途径。刘春霞[29]利用非线性理论,对广东省热带气旋年频数时间序列采用相空间向量相似和相空间投影预报方法建立预报模型。经过5种方案的试验,发现这两种方法都有一定的预报能力,而且通过对比发现,热带气旋年频数内在的性质和外部强迫因子的作用在预报中都不可忽视,且外部因子的选取是否适当也非常重要。李坤玉等[30]运用非线性时间序列分析方法,结合全局函数拟合和Lyapunov指数分析对ENSO的时间演变进行研究,结果表明,采用混沌时间序列预报,相比其他模式,能用较少的资料得到较好的预报结果,为ENSO预报提供了一个可供参考的方法。
需要说明的是,非线性时间序列分析在气候研究中应用的文献还有许多,文中只是列举了这些方面具有代表性的一部分文献。
4 小结综上所述,有许多学者为非线性时间序列分析方法在气候领域中的应用做了大量的工作,大部分文章用到了非线性时间序列分析方面较新的方法,几乎每种方法都能在某个方面取得一定的成功,但这些基本上是个例的研究,得出的结论有待更多的验证和理论上更系统的阐述。正如上文所言,时间序列分析的终极目标是预测和控制,在预测方面有许多文献表明某方法在某个例中可行,但能否找到一种可用于业务预测且可提高预报技巧的通用的方法至今仍是疑问。由此可见,非线性时间序列分析在气候中的应用还是任重而道远。
许小可. 基于非线性分析的海杂波处理与目标检测[D]. 大连海事大学博士学位论文, 2008: 130. http: //cdmd. cnki. com. cn/Article/CDMD-10151-2009074898. htm
|
魏凤英, 1999. 现代气候统计诊断与预测技术[M]. 北京: 气象出版社, 269.
|
Drazin P G, 1992. Controlling chaotic dynamical systems[J]. Physica D, 58(1-4): 165-192. DOI:10.1016/0167-2789(92)90107-X |
罗勇, 1995. 从时间序列中提取维数信息[J]. 气象, 21(4): 16-21. DOI:10.7519/j.issn.1000-0526.1995.04.004 |
罗伯良, 2008. 近40年湖南省极端强降水气候变化趋势与突变特征[J]. 气象, 34(1): 80-85. DOI:10.7519/j.issn.1000-0526.2008.01.012 |
叶笃正, 严中伟, 戴新刚, 等, 2006. 未来的天气气候预测体系[J]. 气象, 32(4): 3-8. DOI:10.7519/j.issn.1000-0526.2006.04.001 |
Mallat S, 1989. Multifrequency channel decomposition of images and wavelet models[J]. IEEE Trans Signal Process, 37(12): 2091-2110. DOI:10.1109/29.45554 |
Huang N E, 1999. A new view of nonlinear water waves--the Hilbert spectrum[J]. Ann Rev Fluid Mech, 31(1): 417-457. DOI:10.1146/annurev.fluid.31.1.417 |
龚志强, 邹明伟, 高新全, 等, 2005. 基于非线性时间序列分析经验模态分解和小波分解异同性的研究[J]. 物理学报, 54(8): 3947-3958. DOI:10.7498/aps.54.3947 |
姚檀栋, 杨学海, 康兴成, 2001. 从古里雅冰芯与祁连山树轮记录看过去2000年气候[J]. 第四纪研究, 21(6): 514-520. |
杨保, 康兴成, 施雅风, 2000. 近2000年都兰树轮10年尺度的气候变化及其与中国其他地区温度代用资料的比较[J]. 地理科学, 20(5): 371-383. |
Matassini L, Kantz H, Holyst J, et al, 2002. Optimizing of recurrence plots fornoise reduction[J]. Phys Rev E, 65(2): 1102-1-021102-6. |
侯威, 廉毅, 封国林, 2007. 基于搜索平均法的气象观测数据的非线性去噪[J]. 物理学报, 56(1): 589-594. DOI:10.7498/aps.56.589 |
Kostelich E J, Schreiber T, 1993. Noise reduction in chaotic time series data: A survey of common methods[J]. Phys Rev E, 48(3): 1752-1763. DOI:10.1103/PhysRevE.48.1752 |
龚志强, 封国林, 董文杰, 等, 2006. 非线性时间序列的动力结构突变检测的研究[J]. 物理学报, 55(6): 3180-3185. DOI:10.7498/aps.55.3180 |
龚志强, 封国林, 万仕全, 等, 2006. 基于启发式分割算法检测华北和全球气候变化的特征[J]. 物理学报, 55(1): 477-483. DOI:10.7498/aps.55.477 |
侯威, 封国林, 高兴全, 等, 2005. 基于复杂度分析冰芯和石笋代用资料时间序列的研究[J]. 物理学报, 54(5): 2441-2448. DOI:10.7498/aps.54.2441 |
杨培才, 卞建春, 王革丽, 等, 2003. 气候系统的层次结构和非平稳行为:复杂系统预测问题探讨[J]. 科学通报, 48(13): 1470-1476. DOI:10.3321/j.issn:0023-074X.2003.13.023 |
施能, 1996. 北半球冬季大气环流遥相关的长期变化及其与我国气候变化的关系[J]. 气象学报, 54(6): 675-683. DOI:10.11676/qxxb1996.070 |
戴新刚, 汪萍, 丑纪范, 2003. 华北汛期降水多尺度特征与夏季季风年代际衰变[J]. 科学通报, 48(23): 2483-2487. DOI:10.3321/j.issn:0023-074X.2003.23.015 |
李智才, 马文瑞, 李素敏, 等, 2006. 支持向量机在短期气候预测中的应用[J]. 气象, 32(5): 57-61. |
陈雷, 刘开福, 李英, 2001. 卡尔曼滤波在短期气候预测中的应用[J]. 气象, 27(10): 42-45. |
王革丽, 杨培才, 吕达仁, 2004. 场时间序列预测方法及其预测能力的试验分析[J]. 大气科学, 28(4): 536-544. |
万仕全, 封国林, 周国华, 等, 2005. 基于EMD方法的观测数据信息提取与预测研究[J]. 气象学报, 63(4): 516-523. DOI:10.11676/qxxb2005.051 |
张德宽, 杨贤为, 邹旭凯, 2003. 均生函数—最优子集回归在高温极值预测中的应用[J]. 气象, 29(4): 44-47. |
Cao H X, 1993. Self-memorization equation in atmospheric motion[J]. Science in China Series B, 36: 845-855. |
曹杰, 陶云, 2001. 一种局地非线性气候动力统计模型及其预报试验[J]. 高原气象, 21(3): 315-320. |
洪梅, 张韧, 吴国雄, 等, 2007. 用遗传算法重构副热带高压特征指数的非线性动力模型[J]. 大气科学, 31(2): 346-352. |
刘春霞, 2002. 广东热带气旋短期气候预测[J]. 热带气象学报, 18(1): 83-90. |
李坤玉, 李晓东, 2007. ENSO非线性预报[J]. 北京大学学报(自然科学版), 43(1): 30-34. |