2. 南京信息工程大学遥感学院,南京 210044;
3. 江苏省气象科学研究所,南京 210008
2. School of Remote Sensing, Nanjing University of Information Science and Technology, Nanjing 210044;
3. Jiangsu Institute of Meteorological Sciences Nanjing 210008
气温是反映某地区热量资源最主要的指标,气温的平均状况、极端情况、温差大小都是体现某地区热量资源多少的重要气候特征量,它对农业生产建设、生态环境治理都有相当重要的意义[1-4]。由于气象站点数量有限且空间分布不均匀,野外考察资料稀少,因此,如何利用有限的观测资料,采用合理的方法研究气温分布规律,一直是气候学、农业气象学等领域的研究热点[5-6]。
现有的气温推算方法主要有两大类:一是利用空间内插技术直接对气温进行内插;二是建立多元地理统计模型进行趋势面拟合并外推。其中,插值方法是研究最多、应用最为广泛的方法[7-8]。特别是20世纪90年代以来,随着GIS技术的业务化应用[22],空间插值方法的种类不断增多、精度不断提高。常用的气温空间内插方法有逆距离权重反比法(IDW)[9]、克立格法(Kriging)[10]、样条函数法(Spline)[11]、线性内插法(linear interpolation)、双线性内插法(bilinear interpolation)等,大量研究表明,不同内插方法得到的气温空间分布结果存在较大差异[12-14],不同研究者认为的最适气温空间内插方法存在明显的不一致[15-16],有研究认为不存在绝对最优的气温空间插值方法[17]。近些年来,不断有学者提出将地形因子考虑到插值方法当中,李军等[18]认为在中国地区考虑了海拔高度影响可以大大提高插值精度;蔡迪花等[19]提出了基于DEM的多元线性回归空间插值法,其精度和空间分布均优于传统插值方法。由此可见,把确定性方法和随机插值方法结合起来研究气温空间分布特征是必要的。仲嘉亮等[20]在新疆地区提出将地理因子和空间残差相结合对气温数据进行栅格化,但没有讨论其时空外推性及插值方法的不同对空间残差插值精度的影响。
本文以综合余项法为例,即把气温影响因子当中的确定性部分(地形因子,如纬度、经度、海拔对气温的影响)和随机部分分开讨论,采用逆距离权重反比法、克立格法、样条函数法3种插值方法,对比了直接插值法和综合余项法的气温空间外推误差,并在此基础上分析了影响气温空间插值精度的因素:插值方法和台站分布密度,得出综合余项法有更高的空间气温插值精度,这为气候资源的合理开发和利用了提供科学依据。
1 资料和方法 1.1 数据来源月平均气温来源于全国743个常规气象站1961—2000年的观测值(气象基本站和气象基准站),经过严格的质量控制和筛选后,资料长度大于等于30年的共有660个台站。台站经度、纬度、海拔数据来源于全国气象台站表。站点的空间分布如图 1所示。
气温形成机理复杂,影响因子众多,本文以最常用的地理因子回归法为例,来表示气温形成中的确定性部分,即根据经度、纬度、海拔建立回归方程,除了确定性部分以外,还有地理地形因子不能解释的随机部分,这部分以残差ΔT表示,因此某一地点的气温可表示为:
$T=a+b\varphi +c\lambda +dh+\Delta T$ | (1) |
式中T为气温观测值(℃),φ为纬度(°),λ为经度(°),h为海拔高度(m),a、b、c、d为回归系数,式(1) 中前4项可表示确定性因子(地理地形因子)对气温的影响。
利用全国660个气象站的气温资料用公式(1) 进行统计回归,相关统计参数如表 1所示,从表 1可以看出,气温与地理因子(经度、纬度、海拔)有较好的相关性,各月复相关系数均在0.92以上,全年的复相关系数为0.98,这说明气温的形成中相当一部分是地理和地形特征作用的结果。
以全国1 km×1 km分辨率的栅格为计算单元,DEM数据作为地理因子的综合反映,获取栅格单元的海拔高度h;运用ArcGIS,获取DEM栅格单元所在的纬度φ、经度λ,结合表 1给出经验系数a、b、c、d,采用IDW (或其他插值方法)插值方法获得残差ΔT的栅格分布,根据公式(1) 即可获得1 km×1 km分辨率全国气温的空间分布。
由于DEM (数字高程模型)与真实地形存在偏差,因此直接用DEM进行空间运算实质上是根据气候要素与地理因子的关系,由栅格的地理信息推算出来的,它只代表栅格面积上气温要素的平均值,与气象台站点上的要素值有本质的区别[21-22]。因此,为了尽量减小DEM不确定性对插值产生的影响,更加客观地评判直接插值法和综合余项法对气温插值精度的影响,本文采用T、ΔT插值,然后将格点值与观测气温值、实际误差值进行对比。所有的插值均在ArcGIS 9.2中实现,插值空间分辨率1 km×1 km。
2 验证方案与结果分析本文采用三种方案来验证模型精度,即交叉验证、2005年个例年验证、浙江省一般气象观测站验证,分别从时间、空间上来分析不同的插值方法在直接插值法和综合余项法中误差大小,并讨论了气象台站的空间分布密度对插值精度敏感性的影响。用平均绝对误差、均方根误差作为检验精度的标准。平均绝对误差反映样本数据估值的总体误差或精度水平,均方根误差反映了样本数据的估值灵敏度和极值[18]。
2.1 交叉验证对全国660个台站分别采用IDW、克立格、样条函数3种插值方法进行交叉验证,直接插值法、综合余项法的各绝对误差平均值统计值如表 2所示。
从表 2中可以看出,直接插值法的绝对误差平均值在1.43~2.46 ℃之间,综合余项法的绝对误差平均值分布在0.56~1.22 ℃之间,综合余项法和直接插值法相比精度提高了36%~68%,其中IDW和Kriging的误差大小相差很小,Spline误差最大,但综合余项法中3种插值方法相差不大。图 2是以IDW方法插值得出的误差空间分布图,它由各台站的绝对误差平均值通过插值得出。图 2a采用直接插值法,图 2b采用综合余项法。由图可以看出,全年绝对误差西高东低,这是由东部台站分布密度高于西部的缘故。直接插值法的误差大部分分布在1~5 ℃,综合余项法的误差大部在0~2 ℃,且综合余项法的空间分布较均匀,除新疆西北部个别地区误差超过了5 ℃,而直接插值法即使在台站分布密集的东部地区,也产生了大量误差在5 ℃以上区域,这说明综合余项法对台站密度的依赖较小。Kriging和Spline的空间分布情况与IDW相似。
根据全国2005年660个台站的月平均气温观测值与表 1计算出的确定性因子相减,得到2005年的综合余项。抽取出60个空间分布均匀的台站做为验证点,用其余的600个台站分别采用IDW、克立格、样条函数3种方法对气温、综合余项进行插值,平均绝对误差如表 3所示。从表 3中可以看出,直接插值法中IDW的平均绝对误差在1.34~1.53 ℃之间,Kriging法在1.32~1.76 ℃之间,Spline法的误差最大,在1.77~2.18 ℃之间;使用综合余项插值时,3种方法的平均绝对误差相差不大,误差均在1 ℃以内。同一时间段上,以年平均气温为例,3种不同的插值方法,综合余项法均比直接插值法中的误差减少了55%左右,且综合余项法的波动0.24 ℃比直接插值法中的0.52 ℃减小了一半以上。这说明综合余项法具有良好的时间外推性。
对全国660个台站分别采用反距离权重、克立格、样条函数对气温、综合余项进行插值,利用浙江省1961—2000年有30年以上有效气温观测资料的47个一般气象站作为验证点,以检验各种插值方法对气温的影响。表 4中列出了各种方法的绝对误差平均值,从表 4中可以看出,3种插值方法,IDW与Kriging效果相当,均优于Spline。但综合余项法明显优于直接插值法,综合余项的平均插值误差在0.5 ℃左右,最大月份为0.63 ℃,最小月份仅为0.24 ℃;而气温直接插值法的平均绝对误差均在0.73 ℃以上,最大误差出现在样条函数法中,达到了1.6 ℃。就以年平均气温而言,综合余项法中的IDW、Kriging、Spline比直接插值法的误差分别减少了59.7%,60.18%,73.41%,且三种插值方法中综合余项法的波动仅为0.04 ℃,远远小于直接插值法中的0.65 ℃。这说明综合余项法具有良好的空间外推性。
抽取出空间分布均匀的60个站点做为验证点,选取出空间分布均匀的600、500、400、300、200、100个气象站点利用公式(1) 分别建模,然后利用逆距离权重反比法、克立格法、样条函数法分别对气温、残差项进行插值,最后提取出60个验证点的格点气温和格点残差,分别与观测气温、实际残差做对比。结果如图 3所示。
图 3a为使用IDW直接对气温进行插值所得绝对误差平均值随月份的变化图,图 3b为使用IDW对综合余项进行插值所得的绝对误差平均值随月份的变化图,从这两图中可以看出,使用综合余项法的误差在0.46~1.01 ℃之间,明显小于直接插值法的1.35~1.79 ℃,且插值的误差并不是完全随站点密度的增加而减小,这在图 3b中表现更为明显;图 3c和图 3d分别为使用IDW对气温直接插值和使用综合余项法进行插值的均方根误差随月份的变化图,从这两幅图可以看出,使用综合余项法插值的均方根误差0.41~0.94 ℃明显小于直接插值法的1.35 ℃~1.93 ℃,这说明综合余项法对台站密度的敏感性较直接插值法小得多。图 3e为直接插值法和综合余项法的年绝对误差平均值随台站数的变化,图 3f为随机插值方法和综合余项法的年均方根误差随台站数的变化,TI、TK、TS为直接插值法中的IDW、Kriging、Spline,DI,DK,DS为综合余项法的中IDW、Kriging、Spline,由这两幅图可以看出,不论IDW、Kriging、Spline使用哪种方法,台站空间分布密度如何变化,综合余项法的绝对误差平均值、均方根误差均小于直接插值法;且综合余项法中不同插值方法的绝对误差平均值、均方根误差的差别很小,由此可以说明,综合余项法的气温推算精度受台站密度、插值方法的影响很小。
3 结论本文以逆距离权重反比法、克立格法、样条函数法进行讨论,通过交叉验证、时间上外推验证和空间上外推验证,对比分析了直接插值法和综合余项法对气温空间外推精度的影响,并在此基础上分析了气象台站空间分布密度对插值方法的敏感性。通过研究,得出以下几点结论:
(1) 交叉验证绝对误差平均值表明,直接插值法的1.43~2.46 ℃较综合余项法的0.56~1.22 ℃精度提高了36%~68%,其中IDW和Kriging的误差大小相差很小,Spline误差最大,而对综合余项法而言,3种插值方法差别不大;绝对误差空间分布上是西高东低,这与台站的分布密度有关。
(2) 直接插值法中,个例年验证、一般气象站验证绝对误差平均值分别为1.33~2.18 ℃、0.73~1.84 ℃;综合余项法中,个例年验证、一般气象站验证绝对误差平均值分别为0.46~1.10 ℃、0.28~0.63 ℃。不同的月份最优的插值方法不同,但不论哪种插值方法,综合余项法的插值误差明显小于直接插值法,可减少31%~85%,这说明综合余项法具有良好的时间和空间外推性。
(3) 直接插值法对台站密度的敏感性较大,而综合余项法则不依赖于台站密度的大小,它与残差项的大小(影响气温的随机因素)有关;直接插值法的精度因插值方法的不同而有很大的区别,而综合余项法对插值方法的依赖较小,由此说明增加观测密度和改进插值方法并不是提高气温空间推算精度的主要途径。
(4) 本文只是使用了简单的地理统计方法来计算气温形成中的确定性部分,因此,发展具有明确物理意义的气温模型以减小气温形成中的不确定性部分,是提高气温空间插值精度的关键性因素。
徐宗学, 隋彩虹, 2005. 黄河流域平均气温变化趋势分析[J]. 气象, 31(11): 7-10. DOI:10.7519/j.issn.1000-0526.2005.11.002 |
李军, 黄敬峰, 2004. 山区气温空间分布推算方法评述[J]. 山地学报, 22(1): 126-132. |
孙宁, 李廉水, 2009. 基于SVAR模型的气温变化对南京市工业经济的影响研究[J]. 气象, 35(10): 90-96. DOI:10.7519/j.issn.1000-0526.2009.10.011 |
李兰, 陈正洪, 洪国平, 2008. 武汉市周年逐日电力指标对气温的非线性响应[J]. 气象, 34(5): 26-30. DOI:10.7519/j.issn.1000-0526.2008.05.005 |
Aikawa M, Hiraki T, 2007. Characteristic air temperature distributions observed in summer and winter in urban area in Japan[J]. Environmental Monitoring and Assessment, (8): 255-265. |
Benavides R, Montes F, 2007. Geostatistical modeling of air temperature in a mountainous region of Northern Spain[J]. Agricultural and Forest Meterology, 146: 173-188. DOI:10.1016/j.agrformet.2007.05.014 |
蔡秀华, 曹鸿兴, 2005. 资料插值的进展[J]. 气象, 31(8): 3-7. DOI:10.7519/j.issn.1000-0526.2005.08.001 |
游性恬, 1996. 几种数值插值方法的试验比较[J]. 气象, 22(4): 3-7. DOI:10.7519/j.issn.1000-0526.1996.04.001 |
Patrick M B, 1996. Multivariate interpolation to incorporate thematic surface data using inverse distance weighing[J]. Computer & Geoscience, 22(7): 795-799. |
Holdaway M R, 1996. Spatial modeling and interpolation of monthly temperature using Kriging[J]. Climate Research, 6(3): 215-225. |
Luo Z, Wahba G, Johnson D R, 1998. Spatial temporal analysis of temperature using smoothing spline ANOVA[J]. J Clim, 11(1): 18-28. DOI:10.1175/1520-0442(1998)011<0018:STAOTU>2.0.CO;2 |
Jarvis C H, Stuart N A, 2001. Comparison among strategies for interpolating maximum and minimum daily air temperatures. Part Ⅱ: The interaction between number of guiding variables and the type of interpolation method[J]. J Appl Meteor, 40(6): 1075-1084. DOI:10.1175/1520-0450(2001)040<1075:ACASFI>2.0.CO;2 |
Price D T, McKenney D W, Nalder I A, et al, 2000. A comparison of two statistical methods for spatial interpolation of Canadian monthly mean climate data[J]. Agri Forest Meteor, 101(2-3): 81-94. DOI:10.1016/S0168-1923(99)00169-0 |
Robeson S M, Janis M J, 1998. Comparison of temporal and unresolved spatial variability in multiyear time averages of air temperature[J]. Clim Res, 10(1): 15-26. |
林忠辉, 莫兴国, 李宏轩, 等, 2002. 中国陆地区域气象要素的空间插值[J]. 地理学报, 57(1): 47-56. DOI:10.11821/xb200201006 |
潘耀忠, 龚道溢, 邓磊, 等, 2004. 基于DEM的中国陆地多年平均温度插值方法[J]. 地理学报, 59(3): 366-374. DOI:10.11821/xb200403006 |
李新, 程国栋, 卢玲, 2003. 青藏高原气温分布的空间插值方法比较[J]. 高原气象, 22(6): 656-573. |
李军, 游松财, 黄敬峰, 2006. 中国1961-2000年月平均气温空间插值方法与空间分布[J]. 生态环境, 15(1): 109-114. |
蔡迪花, 郭铌, 李崇伟, 2009. 基于DEM的气温插值方法研究[J]. 干旱气象, 27(1): 10-17. |
仲嘉亮, 2007. 基于RS和GIS技术的新疆气温空间插值方法探讨[J]. 沙漠与绿洲气象, 1(4): 33-35. |
刘新安, 于贵瑞, 范辽生, 等, 2004. 中国陆地生态信息空间化技术研究(Ⅲ)—温度降水要素[J]. 自然资源学报, 19(6): 818-825. DOI:10.11849/zrzyxb.2004.06.018 |
吴焕萍, 2010. GIS技术在气象领域中的应用[J]. 气象, 36(3): 90-100. DOI:10.7519/j.issn.1000-0526.2010.03.013 |
张红杰, 马清云, 吴焕萍, 等, 2009. 气象降水分布图制作中的插值算法研究[J]. 气象, 35(11): 131-136. DOI:10.7519/j.issn.1000-0526.2009.11.017 |