2. 国家气象中心, 北京 100081
2. National Meteorological Centre, Beijing 100081
地面气象资料是大气探测资料的一个重要组成部分,随着通信、电子计算机等技术的飞速发展,气象观测站网不断发展和完善,气象数据无论在数量还是质量上都已有了质的飞越,卫星、雷达等遥感观测在气象中的应用越来越广泛,地面观测站网也有了较大发展,全国共有2000多个国家级地面自动站和4万多个省级区域自动站,观测频次为6~10 min·次-1,是天气及数值预报应用的重要资料来源之一。相对其他非常规资料,地面资料最大优点是观测量均为模式变量,且时空分辨率高于常规探空资料,蕴含着丰富的中小尺度信息。王可丽等(2001)指出,质量良好的资料是进行气候研究的前提和保障。
资料同化是提高数值预报能力的有效方法之一,由于地面资料的质量控制和同化算子的不完善,地面资料相对探空、卫星、雷达等资料而言,其在我国数值预报中的应用仍处在一个起步阶段。目前,国家区域模式进入业务系统的地面资料只有国家级的地面气压和湿度资料,且在地面气压资料使用过程中发现大地形区域资料使用情况并不是很好。究竟是资料的原因还是同化算子的原因,并不清楚,因此开展地面气压资料的质量控制工作尤为重要和迫切。自由大气的观测(贾蓓西等,2014)多种资料之间的互较、资料与模式预报背景场的比对,不但能发现资料的质量问题,而且能发现资料的系统性偏差,如综合质量控制方法(Gandin,1998)、特征层资料综合质量控制方法(Collins,1998;2001) 等,而地面资料只有近地层一层观测资料,缺乏可互较的观测资料,加上我国地形复杂多样,使得地面资料质量的控制难度增大。因此,我国地面资料的质量控制,传统的质量控制方法仍是主要工具(刘小宁和任芝花,2005),主要包括极值检查、持续性检查、时间一致性检查、内部一致性检查、空间一致性检查等方法。依托传统质量控制技术,不少科学研究者进行了许多地面资料质量控制工作。陶士伟等(2009)通过历史资料平均值加减4倍标准差作极值检查,广泛应用于我国地面自动站资料的质量控制。尹嫦姣等(2010)针对气象单一要素引入差值稳定性原理建立了一种空间差值检验法,对2007年7个行政区基本站地面要素进行了初步研究,具有较好的使用效果。Wan et at(2007)针对加拿大1953—2002年761站的逐小时地面气压资料设计了全面综合质量保证系统(QA),获得了高质量的可用于气候研究的逐小时地面气压资料。任芝花和熊安元(2007)介绍了由台站、省级、国家级组成的三级质量控制业务系统的研制,系统还融合了自动控制技术和交互式应用技术,允许在必要时对疑误资料进行详细的人工分析、判断和修正。鞠晓慧等(2010)利用台站海拔高度统计法,得出经验公式来估计气压值,对2000多个国家级台站的建站至2008年的气压观测资料进行了质量控制,该方法可用于气象业务中实时和非实时气压的台站气压极值检查。王海军和刘莹(2012)设计了线性回归的综合一致性质量控制方法,运用于湖北、湖南、河南三省1961—2009逐日气温资料,取得了较好成果。徐枝芳等(2013)在传统的质量控制基础上,提出了不同区域的资料质量控制检查需依据不同地区的气候特点进行划分和统计,将全国地面观测站按地域和气候特征分为8个区域,对气压和温度进行了质量控制。刘雨佳等(2014)利用传统质量控制方法以及雷达估测降水值进行多步骤质量控制,并研究了雨量计测量之间的相关关系。傅娜等(2014)利用上海自动站气温资料,探讨了Barnes插值方法对上海自动站的空间一致性质量控制效果。张颖超等(2017)针对缺乏有效邻站或内部参考资料的情况,提出改进的PSO-PSR-ELM集成学习算法,对江苏省八市2007—2009年的地面气温观测资料进行质量控制,相对TPI及传统方法,质量控制效果更好。相对而言,这些传统的地面资料质量控制方法并不能完全满足资料同化的需求,随着数值模式水平不断提升,数值分析(预报)场成为地面观测可以互较的重要资料源。近来的研究发现(Yang and Slingo, 2001; Dai and Trenberth, 2004; 黄安宁等,2008;戴泽军等,2011),日变化是检测和评估天气预报模式和气候模式物理性能的重要指标。地面观测资料因太阳辐射加热的日循环强迫作用具有明显的日变化特征(Rileyet al, 1987),模式背景场能否抓住地面观测场的主要日变化周期、振幅相关特征,对地面观测资料的质量控制技术建立具有重要意义。Zou and Qin(2010)通过深入对比分析了2 m温度的观测和NCEP背景场的周期、振幅特征,为2 m温度EOF方法质量控制技术(Qin et al,2010)的建立提供了重要理论依据。
Xu et al(2013)提出双权重平均法背景场订正与递进式EOF相结合的2 m温度质量控制方法,有效解决了模式系统性偏差和连续错误资料识别问题。相对传统方法,与数值模式分析(预报)进行分析建立的质量控制技术(赵虹,2015)更能满足资料同化需求。本文通过对比分析地面气压的周期、振幅特征的异同,分析地面气压质量控制存在的关键技术,进而建立有效地面气压质量控制方法。本文采用功率谱分析序列的周期,小波分析振幅。功率谱可以诊断出序列的主要周期,能给出序列在整个时间域上平均振幅、位相和功率贡献,在气候领域被广泛应用。小波分析在时域和频域具有良好的局部性质,能给出某个固定的频率或周期的振幅随时间变化的信息,可以单独分析序列日变化的最重要的逐日周期对应的振幅随时间变化的特征(魏凤英,2007;吴洪宝和吴蕾,2005)。
1 资料和方法介绍 1.1 资料本文采用的观测资料是2013年6—8月(夏季)全国每6 h地面气压、2 m温度和2 m湿度,同时对观测资料数少的站点进行了剔除。为便于比较和计算,观测场不同要素标识为:
$ p_{k, t}^{{\rm{obs}}}, T_{k, t}^{{\rm{obs}}}, RH_{k, t}^{{\rm{obs}}}, \;k = 1, 2 \cdots, m;\;t = 1, 2 \cdots, n $ | (1) |
其中pk,tobs为地面气压观测场,Tk,tobs为2 m温度观测场,RHk,tobs为2 m湿度观测场,m为站点序号;t为观测时次;夏季资料m为3039,n为368。本文同时采用了同时次T639(0.28125°×0.28125°)地面气压、2 m温度、2 m湿度分析格点场作为背景场资料,分别表示为pb,Tb,RHb。格点资料插值到观测点的数据记为pk,tb,Tk,tb,RHk,tb,k,t表达的意义同式(1)。
1.2 方法 1.2.1 区域划分我国地形复杂多样,为了更为细致对比分析地面气压的周期和振幅特征异同,本文依据我国地形高度差异及气候特征,重点分析了青藏高原区域、成都平原区域、长江中下游区域、华北区域、华南区域五个区域的地面气压周期和振幅特征。五个区域的划分见表 1,区域标号分别为Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,其中青藏高原区域、成都平原区域、长江中下游区域处在同纬度带,不同经度范围,华北区域、长江中下游区域及华南区域则是处在经度相同纬度不相同范围。为更好分析地形高度差异与周期振幅的关系,青藏高原区域仅选取了海拔高度在1500 m以上的测站,成都平原区域仅选取了观测海拔高度低于750 m以下的测站。各区域对应的夏、冬季观测站点数见表 1所示,相对而言成都平原区域小,样本量也最少,其他四个区域的样本量基本相当。
OMB(observation-minus-background)质量控制方法是依据观测增量进行质量控制,即背景场检查,这也是目前很多同化系统采用的方法。由于地面资料的特殊性,在将进行OMB质量控制前,应先对背景场进行订正(订正方法见下文),地面气压观测场用pk,tobs表示,k为站点序号,t为观测时次,订正后的背景场用pk,tb,cal表示,使用pk,tobs-pk,tb,cal进行资料剔除,方法如下:
(1) 计算pk,tobs-pk,tb,cal的双权重平均(BMean)和双权重标准差(BSTD)。双权重平均和双权重标准差与通常的平均值和标准差类似,双权重标准差离群资料影响相对较小(Lanzante,1996;Zou and Zeng, 2006)。
$ {w_{k, t}} = \frac{{\left[ {p_{k, t}^{{\rm{obs}}} - p_{k, t}^{b, cal}} \right] - M}}{{7.5 \times MAD}} $ | (2) |
$ BMean = M + \frac{{{{\sum\limits_{k, t} {\left[ {(p_{k, t}^{{\rm{obs}}} - p_{k, t}^{b, cal})} \right] - M\left[ {1 - w_{k, t}^2} \right]} }^2}}}{{\sum\limits_{k, t} {{{\left[ {1 - w_{k, t}^2} \right]}^2}} }} $ | (3) |
$ BSTD = \frac{{{{\left\{ {m \times n\sum\limits_{k, t} {{{\left[ {(p_{k, t}^{{\rm{obs}}} - p_{k, t}^{b, cal}) - M} \right]}^2}{{\left[ {1 - w_{k, t}^2} \right]}^4}} } \right\}}^{0.5}}}}{{\left| {\sum\limits_{k, t} {{{\left[ {1 - w_{k, t}^2} \right]}^2}\left[ {1 - 5w_{k, t}^2} \right]} } \right|}} $ | (4) |
式中,m为站点总数,n为总时次,M为pk,tobs-pk,tb,cal的中位数,MAD为pk,tobs-pk,tb,cal的绝对离差中位数。wk,t是权重,如果wk,t≥1,取wk,t=1。
(2) 识别离群资料:
$ {Z_{k, t}} = \frac{{(p_{k, t}^{{\rm{obs}}} - p_{k, t}^{b, cal}) - BMean}}{{BSTD}} \geqslant Z-Score $ | (5) |
式中,Z-Score是一个给定的参数(通常取3~5),当Zk,t≥Z-Score时,此时pk,tb,cal位于(k,t)的资料被视作离群资料剔除。
1.2.3 递进式OMB质量控制方法考虑到递进式EOF质量控制的方法计算处理复杂,基于OMB质量控制方法提出了一个类似递进式EOF质量控制的方法(徐枝芳等,2013)——递进式的OMB质量控制方法。该方法以OMB质量控制方法为基础,10 d为一周期[在地面气压观测资料特征分析中(图 1)发现地面气压观测资料不仅存在半日、日周期,还存在一个明显的10 d左右的周期(通过显著性检验),对应的频率0.273,因此10 d (比9 d略大)的样本量可以表现出地面气压的主要特征],一个周期一个周期递进式的往前进行质量检查,该方法通过将前一周期识别出的离群资料标识出来,不进入下一周期检查,从而减少上一周期中离群资料对下一周期资料质量控制的影响。递进式OMB和递进式EOF方法主要区别在于,每组数据质量控制时不需要进行EOF模态重构而是直接使用观测与背景的偏差。
本文分析了地面气压冬、夏两季周期和振幅特征,两季节分析结论一致,这里重点对夏季结果进行分析(冬季的图略)。地面气压五个区域的观测和格点T639分析场的功率谱值曲线十分接近(图 1),插值到测站后的T639和格点T639分析场的周期特征在各区基本一致(图略)。地面气压五个区域的观测场、T639分析场也存在显著的逐日周期,均通过了α=0.05的显著性水平检验,逐日功率谱值(即方差贡献)均在102左右。观测场T639分析场半日周期除成都平原区域未通过外,其余四个区域均通过了0.05显著性水平检验,即地面气压半日周期除成都平原外其余区域也是均显著的。从图 1还可发现,青藏高原和华北区域逐日周期的T639分析场功率谱值在10左右,而观测场谱值在102左右。由此可见,青藏高原和华北两个区域T639分析场的逐日周期信号强度跟观测场相比偏弱。通过以上分析可知,夏季地面气压五个区域观测、T639分析场除成都平原半日周期不显著外,同样存在逐日和半日为主的周期特征。另外,地面气压的观测和T639分析场周期特征在各区域表现不一致,青藏高原和华北区域T639分析场模拟逐日周期强度较观测弱。
由图 2可见,地面气压五个区域插值到测站后T639分析场以及格点T639分析场振幅不完全重合,地面气压表现出了局地性特征,不同区域表现不一样,在青藏高原区域最为明显,其次是华北区域。在青藏高原区域,观测场振幅与其他四个区域明显不同,整个时间序列的振幅值远远高于其他四个区域,最大振幅值为6.77,其他四区域最大值不超过2。同时,青藏高原区域T639分析场振幅跟观测场差异也最大,T639分析场振幅值及振幅随时间变化的幅度较小,如6月3—5日、11—21日、20—26日等时段T639分析场振幅几乎完全不能模拟出观测场振幅峰值变化特征。同样华北区域T639分析场振幅值也比观测偏小,特别是7月3日至8月10日时段T639分析场振幅很小,振幅大小几乎不变化,与观测场差异较大。成都平原、长江中下游、华北区域观测和T639分析场振幅变化较为一致,T639分析场能较好地模拟观测振幅变化特征。由以上分析可知,青藏高原区域、华北区域的地面气压观测和T639分析场振幅存在很大的差异,这也与地面气压的逐日周期观测比T639分析场弱的结论相印证,在复杂地形区域,如青藏高原及华北区域,T639分析场振幅与观测振幅差异过大,几乎不能描述出观测的振幅特征,这也许就是王轶(2012)地面气压质量控制直接采用2 m温度质量控制方案不能取得较为理想结果原因之一。
第2节分析结果表明,地面气压观测与T639分析场的周期和振幅特征差异最大的区域在青藏高原及华北区域等复杂地形区域。我们都知道,气压随高度是非线性变化,而温度随高度大体是线性变化的,在复杂地形区域模式与观测站地形高度差异一般也较大(徐枝芳等,2007),因而在复杂地形区域气压表现出不一致的特征,可能与观测站地形与模式地形高度差异相关。因此,本文对T639分析场进行了订正,将其由模式地形高度订正到观测地形高度。
3.1 地面气压订正方法本文采用以下公式进行订正,
$ p_{k,t}^{b,cal} = p_{k,t}^b \times {{\text{e}}^{ - \frac{{2g}}{{{R_d}(Tv_{k,t}^{{\text{obs}}} + T_{{v_{k,t}}}^b)}}(H_k^{{\text{obs}}} - H_k^b)}} $ | (6) |
式中,pk,tb,cal,pk,tb分别为订正前后背景场地面气压,Hkobs和Hkb分别为实际地形高度和模式地形高度,Tvk,tobs和Tvk,tb分别为观测和背景场计算出来的虚温,g为重力加速度(大小为9.81 J·km-1·m-1),Rd是干空比气体常数,大小为287.05 J·km-1·K-1。在计算Tvk,tobs和Tvk,tb的过程中,采用考虑了水相态变化的ECWMF饱和水汽压计算方法,以Tvk,tobs计算为例,具体计算公式如下:
当Tvk,tobs≥Twater时,
$ {{e}_{s\_{\text{water}}}} = 6.112 \times {{\text{e}}^{\frac{{17.502 \times ({T}_{k,t}^{{\text{obs}}} - {{T}_{{\text{water}}}})}}{{{T}_{k,t}^{{\text{obs}}} - 32.19}}}} $ |
Tk,tobs≤Tice时,
$ {{e}_s} = 6.112 \times {{\text{e}}^{\frac{{22.587 \times ({T}_{k,t}^{{\text{obs}}} - {{T}_{{\text{ice}}}})}}{{{T}_{k,t}^{{\text{obs}}} + 0.7}}}} $ |
Tice < Tk,tobs < Twater时,
$ \begin{gathered} {{e}_{s\_{\rm{water}}}} = 6.112 \times {{\text{e}}^{\frac{{17.502 \times ({T}_{k,t}^{{\text{obs}}} - {{T}_{{\text{water}}}})}}{{{T}_{k,t}^{{\text{obs}}} - 32.19}}}} \hfill \\ {{e}_s} = {w_i} \times {{e}_{s\_{\rm{water}}}} + (1 - {w_i}) \times {{e}_{s\_ice}} \hfill \\ e = {{e}_s} \times RH_{k, t}^{{\rm{obs}}} \times 100\% \hfill \\ T_{{{v}_{k, t}}}^{{\rm{obs}}} = T_{k, t}^{{\rm{obs}}} \times (1 + 0.378\frac{e}{{p_{k, t}^{{\rm{obs}}}}}) \hfill \\ \end{gathered} $ | (7) |
式中,Tk,tobs为2 m温度观测场(单位:K),Twater为水面温度临界值270.16 K,Tice为冰面温度临界值250.16 K,es为饱和水汽压,e为水汽压,RHk,tobs为2 m湿度观测场,es_water为冰水混合时水相饱和水汽压,es_ice为冰水混合时冰相饱和水汽压,wi为冰水混合时权重系数。
3.2 结果分析选取高原区域Ⅰ和长江中下游区域Ⅲ为代表区域进行分析。
从图 3可见,订正后的T639分析场在青藏高原区域逐日周期的功率谱值超过102,比订正前T639分析场功率谱值增大了不少(图 1、图 3),半日周期信号也明显增强,T639分析场订正后期周期特征很接近观测场。长江中下游区域订正前、后的T639分析场周期几乎无变化。由此可见,T639分析场能很好捕捉地面气压的周期特征,但在青藏高原等复杂地形区域需要考虑模式与观测站的地形高度差异,进行地形高度差异订正后的周期特征与观测基本一致。
同样,青藏高原区域订正后的T639分析场振幅跟订正前相比增大很多,较为接近观测场的振幅变化强度,订正后的T639分析场和观测场振幅随时间变化的趋势较为吻合(图 4)。由此可见,订正后的T639分析场振幅值很接近观测场且能够很好地模拟出观测场的振幅变化。长江中下游订正后跟订正前比略有变化,说明订正后的T639分析场振幅对模拟好的区域不产生影响,这也印证了压高订正后的T639分析场对长江中下游周期信号强度无影响的结论。
由此可见,考虑了模式与观测站地形高度差异,将T639分析从模式地形订正到观测站地形高度后,地面气压T639分析场的振幅与观测基本一致。地面气压观测与T639分析场的周期和振幅特征表现出较好的一致性。因此,要做好地面气压质量控制,在使用模式背景资料时需要考虑模式地形与观测地形高度差异,将背景场从模式地形订正到观测站地形。由于气压随高度非线性变化,必须通过压高等方法进行订正。因为采用平均或者双权重订正方法则不能有效改变背景场的周期和振幅,青藏高原等地区的背景场周期和振幅与观测就会存在明显差异,从而影响订正及质量控制效果。
4 质量控制结果分析以下质量控制结果采用的背景气压均经过了第3节气压订正方法订正。
4.1 观测场与背景场的差值分布从图 5可以看出,OMB的双权重标准差总体表现为东西走向分界,在110°E以西偏大,110°E以东偏小,这与2 m温度南北向划分有所不同(王轶,2012)。双权重标准差大的地方表明观测场与背景场差异较大,为使观测场与背景场更匹配,双权重标准差大的地方,应该多剔除离群资料,反之亦然。依据式(5),当Z-Score小时,资料剔除率会增加;当Z-Score大时,资料剔除率会减小,对于110°E以西的区域,Z-Score取3.5,110°E以东取4.0。OMB方法质量控制时,取值与递进式OMB方法相同。
图 6分别是OMB和递进式OMB方法质量控制前后的pobs-pT639, cal偏度与峰度系数。由图 6可见,无论是OMB方法还是递进式OMB方法,压高与双权重相结合方法的背景订正、质量控制后的偏度系数较订正前更接近于0,峰度系数较订正前更接近3。OMB方法和递进式OMB方法质量控制前后pobs-pT639, cal的偏度系数与峰度系数较为接近。
质量控制一方面要尽可能地剔除离群数据,另一方面还要应尽可能地保留大气异常状态的数据。图 7为OMB、递进式OMB质量控制方法剔除资料的散点图。OMB质量控制方法数据剔除率为0.62%,递进式OMB质量控制方法数据剔除率为0.60%,递进式OMB方法较OMB方法剔除资料数略少。由图 7可以看出,无论OMB方法还是递进式OMB方法剔除的资料pobs-pT639, cal偏差绝对值大体在2 hPa以上,两种方法都能全部剔除背景与观测偏差较大的资料,从这个角度来看,剔除的离群资料是合理的。同时,还发现OMB方法2 hPa附近剔除的资料几乎在一条直线上,这是因为OMB方法剔除标准几乎是固定的,所有时次的资料剔除采用了统一的分区标准。而递进式OMB方法在2 hPa附近剔除的资料与OMB方法相比有一定的不同,如600~700 hPa(海拔较高的测站)偏差2 hPa附近的资料并不完全是被统一剔除,而是保留了一部分资料。如950~1000 hPa(海拔较低的测站)偏差2 hPa附近偏差略微小一点的资料也有一定的剔除。主要是因为递进式OMB方法剔除资料采用的是略微变化的滑动标准,且将离群资料识别后避免了对后续的影响,所以两种方法剔除的资料略不同。
图 8为OMB和递进式OMB方法质量控制后观测资料剔除率空间分布。从图 8可以看出,OMB和递进式OMB方法空间分布剔除率大体比较相似,东部区域的资料剔除率整体较小,西部较大。我国大巴山以及秦岭山脉一带等复杂地形区域大部分均在1%以下,福建东部一带在1%~2%。资料剔除率高于3%的观测站位于均方差误差大的区域,主要分布在川西、青藏高原以及新疆北部及附近区域复杂地形一带。
由于地面观测气压与海拔高度、大气温度、大气密度等因素有关,同时还受天气系统等的影响。为了能够有效比对剔除资料的合理性,选择距离被剔除测站较近且观测海拔高度也十分接近的相邻测站来作为比对的参考测站进行对比分析。
新疆北部两种质量控制方法资料剔除率差异较大的站为蔡家湖站(44.2°N、87.5°E,海拔高度441 m),选取邻近石河子站(44.3°N、86.1°E,海拔高度443 m)作为参考站。该蔡家湖站OMB方法共剔除16次,递进式OMB方法共剔除11次。截取了部分时间序列进行分析,尽管石河子站(图 9b)存在不少缺测,由于两站距离很近且海拔高度几乎相同,仍然可以从图 5中看出两站的观测气压很接近且随时间的变化趋势几乎完全一致。说明同时次邻近参考测站的观测气压具有可对比性。选取蔡家湖站资料被剔除,而石河子站资料保留的时次进行对比分析。在6月18日以前,蔡家湖站(图 9a)观测的气压随时间变化的幅度趋势较大,两种方法共同剔除资料的OMB绝对偏差在3.1 hPa以上,而OMB方法剔除的资料最小绝对偏差为2.3 hPa。6月26日之后观测气压的变化幅度趋势减小,两种方法共同剔除的OMB偏差绝对值减少,最小为2.3 hPa。在6月4日(18:00) 时蔡家湖站OMB偏差绝对值为3.6 hPa,两种方法均将该时次的资料进行了剔除,而蔡家湖站的观测气压高于石河子站1.1 hPa,类似的情况如6月8日(18:00) 时,蔡家湖站OMB偏差绝对值为3.1 hPa,蔡家湖站的观测气压高于石河子站观测2.2 hPa。由此可见,这2个时次蔡家湖站资料剔除是合理的。蔡家湖站的观测6月4日(06:00)、6月7日(18:00)、6月10日(18:00)、6月15日(18:00) 时仅被OMB方法剔除,而递进式OMB方法没有剔除,分析发现蔡家湖站与石河子站观测气压OMB偏差分别为0.2、0.4、0.8和-0.6 hPa,这些时次OMB方法剔除有些是不合理的。而7月3日(00:00) 时蔡家湖站观测比石河子站气压高0.7 hPa,递进式OMB方法进行了剔除,该时次资料剔除可能存在不合理。通过蔡家湖站的分析,两种方法对离群资料能有效剔除,尤其是较大的离群资料,但也存在一些不合理资料剔除,总体而言递进式OMB方法略比OMB方法好。
图 10为2013年6月1日至8月31日OMB和递进式OMB方法质量控制后的资料剔除时序图。从图 10可以看出,6月21号以前OMB方法较递进式OMB方法剔除资料多,主要因为这一时间段双权重标准差相对于总体双权重标准差略微较大,因此采用OMB方法时剔除资料更多。6月21日后两种方法资料剔除整体较为接近,有时OMB方法剔除资料多,有时递进式OMB方法剔除资料多。
在所有时间段中6月9日12:00(世界时,下同)时是OMB方法资料剔除率最大的一个时次,剔除率为3.11%,递进式OMB方法剔除率为1.39%,两种方法剔除的资料差异最大;8月12日(06:00) 时是递进式OMB方法资料剔除率最大的一次,剔除率为2.67%,OMB方法为2.60%。8月21日(06:00) 时递进式OMB比OMB方法资料剔除率明显要大的一个时次,递进式OMB方法的剔除率为1.58%,OMB方法剔除率为0.89%。从图 11可以看出,6月9日12:00时OMB比递进式OMB方法剔除的资料多且相对比较集中,主要分布在(20°~32°N、90°~110°E)川西及青藏高原复杂地形下的区域。8月21日(06:00) 时递进式OMB方法的剔除资料较多,主要集中在(24°~30°N、112°~122°E)区域。
针对上述两个个例作进一步的深入分析,选取6月9日12:00时(22°~32°N、90°~104°E)OMB值进行分析,发现28°~32°N的递进式OMB方法剔除资料的偏差绝对值在2.8 hPa以上,剔除资料OMB绝对值高于周围测站OMB绝对值,OMB方法则剔除资料的OMB绝对值在2.5 hPa以上,而22°~26°N递进式OMB方法剔除资料的偏差绝对值在2.6 hPa以上,OMB方法在2.3 hPa以上,此时使用递进式OMB方法剔除资料阈值相对较大。8月21日06:00时则选取了(24°~30°N、112°~122°E)OMB值进行分析,发现OMB方法剔除的资料OMB绝对值在2.0 hPa以上,而递进式OMB方法剔除的资料OMB绝对值在1.8 hPa以上,递进式OMB方法剔除资料阈值相对较小一些。从偏差角度来看,OMB和递进式OMB方法剔除的离群资料均为OMB绝对值较大,且该值为周围测站最大,因此剔除的资料具有一定的合理性。
从上两个个例关注的区域选取部分测站对比分析OMB和递进式OMB方法剔除资料的有效性。两个个例共选取了8个站点(图 12c)作典型分析,分为三类:(1) 两种质量控制方法共同剔除的资料(蓝色圆圈),对应参考站为无圆圈标记(下同),选取的分析测站记1、2、3、4;(2) OMB方法剔除而递进式OMB方法保留的测站资料(红色圆圈),标记为5、6;(3) 仅递进式OMB方法剔除而OMB方法保留的测站资料(绿色圆圈),标记为7、8。测站1和参考站的观测气压和海拔高度分别为826.8 hPa、1626 m和829.1 hPa、1617 m,两站海拔高度仅相差8 m,测站1低于参考站2.3 hPa,由此可见,该站资料被认为离群资料有一定的合理性。测站2和参考站的观测气压和海拔高度分别为885.7 hPa、1044 m和876.5 hPa、1055 m,测站2海拔高度低于参考站11 m,而气压却还低于参考站0.8 hPa,这是不符合气压随高度递减的规律,测站2的观测存在一定的问题,可认为是不合理的。测站3和参考站的情况与测站2类似,气压和海拔高度分别为986.2 hPa、40 m和988.1 hPa、41 m,两站海拔高度十分接近,测站3低于参考测站1.9 hPa。测站4和参考站的观测气压和海拔高度分别为979.2 hPa、86 m和981.9 hPa、86 m,两站海拔高度相同,测站4低于参考测站1.7 hPa,剔除也是合理的。由上分析可见,OMB和递进式OMB方法均能较好地剔除OMB偏差较大的离群资料,两种方法同时剔除的离群资料是合理的。
下面来看看其他测站的情况,测站5和参考站的观测气压和海拔高度分别为876.0 hPa、1140 m和877.4 hPa、1121 m,测站5海拔高度比参考站高19 m,而测站5气压低于参考站1.4 hPa,由此可见,该站被认为离群资料并不合理。测站6和参考站的观测气压和海拔高度分别为878.9 hPa、1105 m和879.1 hPa、1109 m,两站海拔高度十分相近,两站气压也很相近,测站6不应该被剔除。由上述分析可知,可以得出OMB和递进式OMB方法均能较好地剔除OMB偏差较大的离群资料,但OMB方法可能会剔除一些正确的资料,而递进式OMB方法可以更好地保留这些资料,由此来看,递进式OMB比OMB方法要好一些。
测站7和参考站的观测气压和海拔高度分别为971.7 hPa、131 m和973.3 hPa、130 m,两站海拔高度几乎相同,测站7低于参考站1.6 hPa,由此可见,该站资料有可能存在问题,是可疑的,应被剔除。测站8的情况类似,测站8和参考站的观测气压和海拔高度分别为967.4 hPa、205 m和965.3 hPa、206 m,两站海拔高度几乎相同,测站8低于参考站2.1 hPa,测站8的资料也是可疑的。由测站7和8的分析可知,递进式OMB法相比OMB法能够更好地剔除OMB偏差较小一点的可疑资料。
由以上8个测站的分析可知,由于递进式OMB方法滑动式的剔除离群资料,更能反映连续演变天气系统随时间的变化趋势,质量控制效果较OMB方法更合理有效。
5 结论本文使用地面气压观测与T639分析场,依据我国地形特点和气候特征划分为五个区域分别进行细致分析,从而抓住了地面气压资料进行质量控制时的主要难点问题,为地面气压资料的质量控制奠定了基础。采用压高与双权重平均相结合的方法对背景场进行订正,能有效解决地面气压使用背景场资料时同化前进行质量控制的主要难点。依据地面观测气压的资料周期特性,提出了计算较为简单的递进式OMB质量控制方法,利用该方法和OMB质量控制方法对我国及周边地区地面观测气压进行了质量控制分析。主要结论如下:
(1) 地面气压的观测与T639分析场的周期和振幅特征不完全一致,华南和长江中下游区域观测与背景的周期和振幅特征较为接近,存在逐日和半日周期。成都平原夏季观测和T639分析场半日周期不显著外,也存在逐日、半日为主的周期特征,另外青藏高原和华北区域T639分析场模拟逐日周期信号的强度较观测偏弱,青藏高原等复杂地形区域T639分析场周期和振幅特征与观测振幅差异过大,T639分析场几乎完全不能描述出观测的周期振幅特征,这可能是王轶(2012)地面气压直接采用2 m温度质量控制方案不能取得较为理想结果的原因之一。
(2) 在地面气压周期振幅特征分析中考虑了模式与观测站地形高度差异后,所有区域,T639分析场与地面气压观测的周期和振幅特征表现出较好的一致性。因此要做好地面气压质量控制,在使用模式背景资料时需要考虑模式地形与观测地形高度差异,将背景场从模式地形订正到观测站地形。
(3) 从观测增量是否更接近正态分布的角度来分析,OMB和递进式OMB两种方法质量控制后的结果均能够接近正态分布,压高与双权重结合的背景订正后的效果明显好于订正前。
(4) 从资料剔除结果来看,OMB和递进式OMB质量控制法都能够将OMB绝对值大于2 hPa附近以上的离群资料有效进行识别。两种质量控制法资料剔除率的空间分布大体相似,东部区域的资料剔除率相对西部小。个例分析结果发现,OMB和递进式OMB质量控制方法均能很好地剔除OMB绝对值较大的离群资料。由于递进式OMB方法滑动式的剔除离群资料,能反映连续演变天气系统随时间的变化趋势,与OMB方法相比较,不仅能有效识别离群资料,同时也能将合理的观测资料保留下来。总体而言,递进式OMB方法比OMB方法要更好,质量控制效果更好。
附录: 1 功率谱分析功率谱可以诊断出序列的主要周期,其以傅里叶变化为基础的频域分析可将序列的总能量分解到不同频域上的分量,然后根据不同频率的波的功率(方差贡献)诊断出序列的主要周期。
具体的计算流程(算法参照魏凤英,2007)以青藏高原区域夏季地面气压观测资料为例,该区域有216站点。首先计算该区域地面气压各时次的平均值ptobs,然后采用式(1) 计算相关系数r(j):
$ \begin{gathered} r(j) = \frac{1}{{n - j}}\sum\limits_{t = 1}^n {(\frac{{p_t^{{\rm{obs}}} - {{\overline p }^{{\rm{obs}}}}}}{{{S_{p_t^{{\rm{obs}}}}}}})} (\frac{{p_{t + j}^{{\rm{obs}}} - {{\overline p }^{{\rm{obs}}}}}}{{{S_{p_t^{{\rm{obs}}}}}}}) \hfill \\ j = 0, 1, 2, \cdots, m \hfill \\ \end{gathered} $ | (1) |
式中n为ptobs时间序列的样本量,大小为368,pobs为ptobs序列的平均值,Sptobs为ptobs序列的标准差,本文最大滞后时间长度m均取40,范围
$ \begin{gathered} {{\hat S}_k} = \frac{1}{m}\left[ {r(0) + 2\sum\limits_{j = 1}^{m - 1} {r(j)\text{cos}\frac{{k{\rm{ \mathsf{ {\pi }} }}{j}}}{m} + r({m})\text{cos}{k}{\rm{ \mathsf{ {\pi }} }}} } \right] \hfill \\ k = 0, 1, \cdots, m \hfill \\ \end{gathered} $ | (2) |
$ \begin{gathered} {{\hat S}_0} = \frac{1}{{2m}}\left[ {r(0) + {r}({m})} \right] + \frac{1}{m}\sum\limits_{j = 1}^{m - 1} {r({j})} \hfill \\ {{\hat S}_k} = \frac{1}{m}\left[ {r(0) + 2\sum\limits_{j = 1}^{m - 1} {r(j)\text{cos}\frac{{k{\rm{ \mathsf{ {\pi }} }}{j}}}{m} + r({m})\text{cos}{k}{\rm{ \mathsf{ {\pi }} }}} } \right] \hfill \\ {{\hat S}_0} = \frac{1}{{2m}}\left[ {r(0) + (- 1){r}({m})} \right] - \frac{1}{m}\sum\limits_{j = 1}^{m - 1} {{{(- 1)}^j}r({j})} \hfill \\ \end{gathered} $ | (3) |
最后通过式(4) 对式(1) 和式(3) 得到的功率谱估计
$ S_0=0.5{\hat S}_0+0.5{\hat S}_1\\ S_k=0.25{\hat S}_{k-1}+0.5{\hat S}_k+0.25{\hat S}_{k+1}\\ S_m=0.5{\hat S}_{m-1}+0.5{\hat S}_m $ | (4) |
确定周期:当m为较大值时,谱估计会在某一频率附近存在一个尖锐的谱峰,而在别的频率处功率谱值较小,这个谱峰对应的频率的倒数就是隐含的周期(唐洁,2013),周期值Tk与波速k关系为
小波分析在时域和频域具有良好的局部性质,可以分析出时间序列的周期变化的局部特征,从而可以更清楚地看到各周期随时间的变化情况(算法参照魏凤英,2007;吴洪宝和吴蕾,2005),Morlet小波是正弦和余弦波的振幅被高斯函数调节产生的。本章采用标准Morlet小波作为母小波。记为:
$ {{\psi }_t} = {{\rm{e}}^{i2{\rm{ \mathsf{ {\pi }} }}t}}{{\rm{e}}^{ - \frac{{{t^2}}}{2}}} $ | (5) |
连续形式为
$ w({a}{\rm{, }}{b}) = ({x}, {{\mathit{\Psi }}_{a, b}}) = {{a}^{ - \frac{1}{2}}}\int_{ - \infty }^\infty {x({t})} {{\mathit{\Psi }}^*}(\frac{{t - b}}{a})d{t} $ | (6) |
式中,符号(,)表示内积,*表示共轭,a为伸缩尺度,b为平移参数,x(t)为被分析对象,
$ \begin{gathered} w({a}{\rm{, }}{b}) = ({f}, {{\mathit{\Psi }}_{a, b}}) \hfill \\ = {{a}^{ - \frac{1}{2}}}\Delta t\sum\limits_{i = t}^n {f({i}\Delta t)} {{\mathit{\Psi }}^*}(\frac{{i\Delta t - b}}{a}) \hfill \\ \end{gathered} $ | (7) |
式中,Δt为取样间隔,n为样本量。离散化的小波变换构成标准正交系从而扩充了实际应用的领域。小波系数w(a, b)的模,或者称为振幅(吴洪宝和吴蕾,2005),本文以下统称为振幅,单位为无量纲。
小波分析对于给定的某个频率或周期,能给出振幅、功率贡献随时间变化的信息。
戴泽军, 宇如聪, 李建, 等, 2011. 三套再分析资料的中国夏季降水日变化特征[J]. 气象, 37(1): 21-30. |
傅娜, 陈葆德, 谭燕, 等, 2014. 上海自动站气温资料的空间质量控制与特征分析[J]. 大气科学学报, 37(2): 199-207. |
黄安宁, 张耀存, 朱坚, 2008. 物理过程参数化方案对中国夏季降水日变化模拟的影响[J]. 地球科学进展, 23(11): 1174-1184. |
贾蓓西, 徐海明, 安月改, 2014. 中国区域再分析湿度资料与均一化探空湿度资料的对比分析[J]. 气象, 40(9): 1123-1131. |
鞠晓慧, 曹丽娟, 朱建华, 2010. 地面自动站气压的台站极值检查方法研究[J]. 气象与环境学报, 26(3): 48-52. |
刘小宁, 任芝花, 2005. 地面气象资料质量控制方法研究概述[J]. 气象科技, 33(3): 199-203. |
刘雨佳, 陈洪滨, 金德镇, 等, 2014. 加密自动气象站雨量计资料的质量控制及其相关关系的研究[J]. 大气科学, 38(1): 159-170. |
任芝花, 熊安元, 2007. 地面自动站观测资料三级质量控制业务系统的研制[J]. 气象, 33(1): 19-24. |
陶士伟, 仲跻芹, 徐枝芳, 等, 2009. 地面自动站资料质量控制方案及应用[J]. 高原气象, 28(5): 1202-1209. |
王海军, 刘莹, 2012. 综合一致性质量控制方法及其在气温中的应用[J]. 应用气象学报, 23(1): 69-76. |
王可丽, 江灏, 陈世强, 2001. 青藏高原地区的总云量——地面观测、卫星反演和同化资料的对比分析[J]. 高原气象, 20(3): 252-257. |
王轶, 2012. 面向数值天气预报的地面气压和温度质量控制[D]. 成都: 成都信息工程学院.
|
魏凤英, 2007. 现代气候统计诊断与预测技术:第2版[M]. 北京: 气象出版社.
|
吴洪宝, 吴蕾, 2005. 气候变率诊断和预测方法[M]. 北京: 气象出版社.
|
徐枝芳, 陈小菊, 王轶, 2013. 新建地面气象自动站资料质量控制方法设计[J]. 气象科学, 33(1): 26-36. |
徐枝芳, 龚建东, 王建捷, 2007. 复杂地形下地面观测资料同化Ⅰ.模式地形与观测站地形高度差异对地面资料同化的影响研究[J]. 大气科学, 31(2): 222-232. |
尹嫦姣, 江志红, 吴息, 等, 2010. 空间差值检验方法在地面气象资料质量控制中的应用[J]. 气候与环境研究, 15(3): 229-236. |
张颖超, 姚润进, 熊雄, 等, 2017. PSO-PSR-ELM集成学习算法在地面气温观测资料质量控制中的应用[J]. 气候与环境研究, 22(1): 59-70. |
赵虹, 2015. 地面观测资料的质量控制方法研究及其在数值模式中的应用[D]. 南京: 南京信息工程大学.
|
Collins W G, 1998. Complex quality control of significant level rawinsonde temperatures[J]. J Atmos Ocean Tech, 15(1): 69-79. DOI:10.1175/1520-0426(1998)015<0069:CQCOSL>2.0.CO;2 |
Collins W G, 2001. The operational complex quality control of radiosonde heights and temperatures at the national centers for environmental prediction.Part Ⅰ: Description of the method[J]. J Appl Meteor, 40(2): 137-151. DOI:10.1175/1520-0450(2001)040<0137:TOCQCO>2.0.CO;2 |
Dai Aiguo, Trenberth K E, 2004. The diurnal cycle and its depiction in the community climate system model[J]. J Climate, 17(5): 930-951. DOI:10.1175/1520-0442(2004)017<0930:TDCAID>2.0.CO;2 |
Gandin L S, 1998. Complex quality control of meteorologicalobservations[J]. Mon Wea Rev, 116(5): 1137-1156. |
Lanzante J R, 1996. Resistant, robust and nonparametric techniques for the analysis of climate data: theory and examples, including applications to historical radiosonde station data[J]. Int J Climatol, 16(11): 1197-1226. DOI:10.1002/(ISSN)1097-0088 |
Qin Z K, Zou X, Li G, et al, 2010. Quality control of surface station temperature data with non-Gaussian observation-minus-background distributions[J]. J Geophys Res, 115(D16): D16312. DOI:10.1029/2009JD013695 |
Riley G T, Landin M G, Bosart L F, 1987. The diurnal variability of precipitation across the central Rockies and adjacent Great Plains[J]. Mon Wea Rev, 115(6): 1161-1172. DOI:10.1175/1520-0493(1987)115<1161:TDVOPA>2.0.CO;2 |
Wan Hui, Wang X L, Swail V R, 2007. A quality assurance system for Canadian hourly pressure data[J]. J Appl Meteor Climatol, 46(11): 1804-1817. DOI:10.1175/2007JAMC1484.1 |
Xu Zhifang, Wang Yi, Fan Guangzhou, 2013. A two-stage quality control method for 2-m temperature observations using biweight means and a progressive EOF analysis[J]. Mon Wea Rev, 141(2): 798-808. DOI:10.1175/MWR-D-11-00308.1 |
Yang Guiying, Slingo J, 2001. The diurnal cycle in the tropics[J]. Mon Wea Rev, 129(4): 784-801. DOI:10.1175/1520-0493(2001)129<0784:TDCITT>2.0.CO;2 |
Zou X, Qin Z K, 2010. Time zone dependence of diurnal cycle errors in surface temperature analyses[J]. Mon Wea Rev, 138(6): 1137-1156. |
Zou X, Zeng Z, 2006. A quality control procedure for GPS radio occultation data, J Geophys Res, 111, D02112.DOI:10.1029/2005JD005846.
|
唐洁, 2013. 功率谱分析方法在周期分析中的应用[J]. 陕西理工学院学报(自然科学版), 29(5): 71-74. |