2. 国家气象中心,北京100081
2. National Meteorological Centre, Beijing 100081
随着我国天气预报技术的不断发展,无线电探空观测在业务、科研等相关领域发挥着非常重要的作用。它是唯一可以观测温、压、湿、风三维大气的常规观测手段。无线电探空是天气分析与预报的重要依据,也是气候分析和数值天气预测的基础资料。通过高空观测,可以分析不同云垂直结构,形成基于业务探空的云结构分析技术(周毓荃等, 2010)。随着卫星与雷达等观测技术的发展,探空资料在大气遥感观测真实性检验与校准检验(李伟等, 2009; 王洪等, 2010; )中发挥着无可替代的基准作用。
探空温度在观测过程中,存在多种因素影响着温度传感器测量的准确性,其误差来源通常包括电路自加热效应、滞后性、长波辐射、短波辐射等,尽管对包含众多误差因素的观测资料进行了系统订正,但仍会存在残余误差。从近地层到高空大气,温度元件受长波辐射影响使观测残余误差仍然存在,并且太阳辐射误差随高度增加以及高层大气空气稀薄等因素,使得探测残余误差在高层越来越大(李柏等, 2011)。William等(2006)用历史探空资料研究对流层中的温度趋势偏差,指出因温度元件可能受过冷却水影响,使计算对流层的温度趋势时会产生偏差。Lanzante(2008)通过对比探空与GCM模式垂直温度趋势廓线,得出模式模拟的温度垂直趋势廓线相对于探空有正的偏差。Wolfgang(2008)对比Vaisala RS 80和RS 92探空仪器温度的差异,指出RS 80探测的温度在白天低于RS 92,且温度偏差随高度而增大,偏差来源多数是因对RS 80的过渡订正,而晚上两者温度基本保持同步。陶士伟等(2006)通过对比L波段和59型探空仪的温度,指出L波段和59型的观测温度与模式温度差的平均偏差差异不大,但300 hPa以上L波段温度随机误差明显减小。马颖等(2010)研究探空仪换型对探空数据一致性的影响,指出在低层两者差异小,70 hPa以上59型观测值低于L波段观测值,同时受不同厂家、探测地和季节等因素而产生不同系统差异。
探空资料质量控制是探空资料在数值模式同化应用取得较好效果的重要保障,随着模式分辨率不断提高,探空资料随高度飘移信息越来越需要考虑到同化应用。李伟等(2005;2010) 从探空雷达探测系统、探测原理分析介绍了高空探测气球飘移的计算方法,同时从探空飘移的方向、量级、时间等方面研究飘移特性,指出飘移受天气系统影响,其主要飘移以纬圈向东方向为主,经圈向南为辅,但因季节、区域不同而飘移方向又有差异,同时指出中小尺度天气系统对飘移的影响不可忽略。刘红亚等(2005)采用3D-Var资料同化结合数值预报结果分析飘移影响差异,指出考虑飘移对高分辨率数值预报产生正面影响,嵇磊等(2008)对MM5模式中客观分析系统的探空资料位置订正,指出位置订正后的模拟更接近实际情况,对降水预报有很大改进。
当前用于国内数值预报系统的探空观测资料质量控制方法主要是常规检查,例如气候极值检查、空间一致性检查、静力学检查、时间一致性检查、要素一致性检查、风切变检查等(翟盘茂, 1997; 杨贤为, 1998; 周尚河, 2000; 张峻, 2003)。大部分质量控制方法并未考虑到各气压高度上温度、位势高度标准误差随高度增大固有特性。如考虑探空飘移信息,许多常规质量控制方法并不适用。探空资料飘移信息随着模式分辨率提高不能忽略,采用怎样的质量控制技术既能考虑探空资料飘移信息,又能保障质量控制效果?飘移信息对质量控制效果有无影响?本文拟采用双权重质量控制方法对探空温度资料进行研究。但数值模式地形相对平滑,与实际地形高度存在一定的差异,徐枝芳等(2007)指出模式地形与观测站地形高度差异在地面资料质量控制与同化中需要考虑,地形高度差异是否影响探空资料质量控制结果?夏季飘移量最小,如果飘移信息在质量控制中仍不能忽略,那么其他季节就更不能忽略,因此本文选取2011年7月的温度资料进行质量控制研究,首先对探空温度资料的特性进行分析,利用双权重质量控制方法分析探空飘移、地形高度差异以及探空观测温度残余误差等多种因素对质量控制结果的影响,从而建立合适的探空温度质量控制技术。
1 资料及方法 1.1 资料本文使用的探空资料是国家气象信息中心提供的全国分钟级探空资料(共119站),每天00、12时两个时次,2011年7月共有7277根廓线,566700个数据。背景场采用的是国家气象中心全球谱模式T639L60(简称T639)(管成功等, 2008; 袁国波等, 2009; 邱学兴等, 2012)同时次分析场,垂直分辨率36层,从1000~0.1 hPa,水平分辨率为0.28125°×0.28125°。同时选取与探空资料相配的588根COSMIC (Constellation Observation system for Meteorology, Ionosphere and Climate) (Christian et al, 2000; Richard et al, 2000; 王柏春等, 2002)掩星湿廓线作为辅助资料,含400×588个数据点,该资料垂直分辨率100 m,共400层。
1.2 方法先将T639背景场温度插值到观测点,水平方向采用双线性插值,垂直方向采用三次样条插值。然后选取Lanzant(1996)提出的双权重离群值判别方法进行质量控制,该方法的特点是能减小离群值对资料平均值和标准差的影响。Zou等(2006)应用此方法进行了CHAMP RO的质量控制研究,取得较好成果。
双权重离群值判别计算方法(本文简称双权重标准法)如下:
(1) 计算每个样本量xi(i=1, 2, …, n)的权重函数wi:
$ {w_i} = \frac{{{x_i} - M}}{{c \times MAD}} $ | (1) |
式中,xi为探空温度观测与T639分析场的差值,即观测增量。c为敏感参数,取c=7.5,当|wi|>1.0时设定wi为1。M为观测增量样本量的中位数,MAD为绝对偏差中位数(即|xi-M|的中位数)。
(2) 计算双权重平均值Xbi:
$ {{\bar X}_{bi}} = M + \frac{{\sum\limits_{i = 1}^n {({x_i} - M){{(1 - w_{_i}^{^2})}^2}} }}{{\sum\limits_{i = n}^n {{{(1 - w_{_i}^{^2})}^2}} }} $ | (2) |
(3) 计算双权重标准差(BSD):
$ BSD = \frac{{{{\left[ {n\sum\limits_{i = 1}^n {{{({x_i} - M)}^2}{{(1 - w_{_i}^{^2})}^4}} } \right]}^{0.5}}}}{{\left| {\sum\limits_{i = n}^n {{{(1 - w_{_i}^{^2})}^2}(1 - 5w_{_i}^{^2})} } \right|}} $ | (3) |
(4) 计算Z-Score值:
$ {Z_i} = \frac{{{x_i} - {{\bar x}_{bi}}}}{{BSD}} $ | (4) |
式中,Zi表示Z-Score计算结果,文中取4为离群点临界温度判断标准,即当观测增量与其双权重平均值(xbi)的偏差大于其4倍双权重标准差(BSD)时作为离群资料。
2 探空温度资料特性 2.1 飘移信息分析本文飘移信息来源来自探空报文,从探空飘移与气压图(图 1)可见,随着探空气球的升高,飘移增大,在300~100 hPa之间出现了较大的飘移速率。通过分析知飘移速率主要受西风带影响,飘移量与风速随高度变化相关系数达0.61。单站在70~40 hPa出现最大飘移量1.58°(图 1a),平均飘移量(图 1b)在100~10 hPa变化小,基本稳定在0.35°~0.40°。因此,当模式分辨率低于30 km时,探空飘移信息在同化中不可忽略。
在100 hPa以下温度随气压降低而降低,从20~30℃降低到-90~-50℃,到达逆温层后,随气压降低而逐渐升高,在5~3 hPa附近,温度上升到-30~-20℃(图 2)。
从T639分析场(图 2b)与探空观测温度(图 2a)可以看出,在10 hPa以下,T639分析场温度垂直分布与观测基本一致,而在10 hPa以上存在明显偏差。观测温度在50 hPa以上整体保持线性趋势,而T639分析场温度从10 hPa开始向左偏移,明显小于观测温度。利用COSMIC掩星温度资料(图 2c)与T639分析场进行对比,可以确定T639模式在10 hPa以上存在明显的负偏差。由此可见,T639分析场10 hPa以上的温度资料不适合作为质量控制的背景场资料。
3 质量控制结果分析 3.1 质量控制阈值不随高度变化利用式(4) 计算从地面至10 hPa之间观测增量Z值。质量控制结果见图 3,图中红色为离群点,蓝色为通过检查的点。从图 3可见,逆温层以上离群点非常多,且随着高度增加离群点逐渐增多,15~10 hPa离群点占总剔除量的50%以上,600 hPa以下离群资料也比较多,500~150 hPa离群点最少。同时离群点主要是观测与背景相差较大(见图 3b)。但高、低层离群资料较多的原因是什么?是观测资料不好,还是质量控制方案存在缺陷?围绕高、低层离群资料较多现象,本文逐步分析问题原由,包括:飘移信息影响、测站地形与模式地形差异影响及观测资料温度残余误差影响。
是否包含飘移信息观测增量差值随气压变化见图 4。由图 4可见,观测增量差值量与飘移距离(图 1)存在正相关,飘移距离随高度增加,观测增量差值也随高度逐步增加,低层飘移信息对观测增量影响较小,300~10 hPa飘移信息则对观测增量有较大影响,温度观测增量差值最大可达3℃。
对比是否含有飘移信息质量控制确定的离群点差异,当含飘移信息时,离群点数量为5954,占总量的1.088%,而不含飘移信息时离群点量为6203,占总量的1.0972%。进一步分析飘移信息对质量控制影响,统计离群点随高度变化分布(图 5),可发现飘移信息对400 hPa以下离群资料几乎没有影响,而300 hPa以上飘移信息对离群点多少有明显影响,随着高度增加,是否包含飘移信息离群点数量差异逐渐增大。由此可见,是否考虑飘移信息对质量控制结果有影响,尤其在高层观测资料离群点的判断。因此在探空资料质量控制中加入飘移信息。
数值模式地形相对平滑,模式地形与测站地形存在一定的高度差异,易导致近地层观测值与模式值存在一定的偏差。为了分析低层离群点是否受地形因素影响,将图 3b结果按测站地形高度划分4类(见图 6a),其中1 km以下有73个观测站,1~2 km有28个观测站,2~3 km有8个观测站,3 km以上有10个观测站。从图 6a可见,离测站近的高度上离群资料多,而到一定的高度后离群资料突减或消失。取测站1500 m高度以下的资料分析测站地形及与模式地形高度差异大小对质量控制结果的影响。
从测站高度至1500 m范围内离群点百分率变化曲线(图 6b)可以看出,当测站地形高度大于模式地形高度时,离群点百分率几乎为0,而当测站地形高度小于模式地形高度时出现离群点,两种地形差异大小与离群点百分率变化呈正相关,两者地形高度差异越大,离群点百分率越大。同时测站地形越高,模式地形与观测站地形差异较大的概率越高,离群点也越多。由此可见,低层离群点主要受观测与模式地形高度差异影响。
3.2 质量控制阈值随高度变化在图 3b中,100~10 hPa离群点数量较大,由前面分析可知飘移信息的影响不大。下面从观测温度残余误差考虑,由于高空空气稀薄以及气压误差对应的温度残余误差比近地层大得多,导致高空各等压面的温度、位势高度订正的残余误差的离散度明显大于低空。在确保样本量的前提下,先将探空分为13层,利用式(2) 和(3) 统计每一层内的双权重平均值和双权重标准差,再利用最小二乘法进行多项式曲线拟合,得出随气压变化双权重平均值和双权重标准差拟合式(5) 和(6)。再用式(7) 计算其Zp值。
$ \begin{array}{l} Xb{w_p} = - 0.4723{({\rm{log}}_{_{10}}^{^p})^3} + 3.1777{({\rm{log}}_{_{10}}^{^p})^2} - \\ \;\;\;\;\;\;\;\;\;\;\;\;6.7798({\rm{log}}_{_{10}}^{^p}) + 4.5935 \end{array} $ | (5) |
$ \begin{array}{l} BS{D_p} = 0.3014{({\rm{log}}_{_{10}}^{^p})^3} - 1.3127{({\rm{log}}_{_{10}}^{^p})^2} + \\ \;\;\;\;\;\;\;\;\;\;\;\;0.7451({\rm{log}}_{_{10}}^{^p}) + 2.4940 \end{array} $ | (6) |
$ {Z_p} = \frac{{|O{b_p} - Xb{w_p}|}}{{BS{D_p}}} $ | (7) |
式中,p为气压,范围从1010~10 hPa,Xbwp和BSDp为气压p的函数,分别为双权重平均值和双权重标准差,Obp表示观测与模式之差,Zp表示随气压p变化Z-Score值。取4为临界判断标准,得出离群点临界温度随气压变化的分布(图 7)。由图 7可见,考虑温度残余误差后拟合的离群点临界温度(图 7实线)先减小再增加。与原整层大气统一临界温度值(图 7虚线)相比,120 hPa以下,临界温度偏小,而120 hPa以上,临界温度偏大,且随高度变大,二者最大相差约5℃。
新温度阈值质量控制后的离群点分布见图 8,与图 3相比较,高层离群资料明显减少,且离群点主要是偏离中心较大、孤立的异常资料。高层温度探测仪器由于受太阳辐射等因素影响,探测误差在高层越来越大(李柏等, 2011),只要知道观测误差大小,该资料就能在数值模式中用得很好,因此在质量控制中需要保留下来。由此可见,采用新温度阈值更能保障质量控制后资料质量。进一步分析飘移信息对质量控制结果影响(见图 9),含飘移信息时离群点为2017个,占总量0.368%;不含飘移信息时离群点为2079个,占总量0.38%;与整层大气温度固定阈值质量控制结果比较,飘移信息同样对300 hPa以上离群点数量有明显影响,但离群资料明显减少。在飘移速率大值区间(300~100 hPa),飘移信息对质量控制结果影响较大。由此可见,是否考虑飘移信息对高层飘移速率较大区间资料质量控制结果有明显影响。
提取4根探空温度廓线验证本文质量控制方法效果。图 10给出了探空温度、T639温度、观测增量以及离群点随气压的分布,其中红色点为剔除的离群资料。图 10a剔除了50 hPa以上观测增量较大的离群点,离群点观测增量平均值达12℃。图 10b剔除了近地层4个观测资料,该站测站高度为2589 m,而模式地形高度4179 m,两种地形高度差异达1590 m,属于地形差异较大因素而产生的离群资料。图 10c在250 hPa附近,探空温度发生跳跃,温度从-35℃降到-60℃,跃变观测点全部剔除。图 10d在对流层中上层观测出现逆温,T639模式未能模拟出来,因而逆温段观测资料被剔除。
从上分析可见,该质量控制能有效剔除错误和不合理观测、测站与模式地形高度差异较大的近地层观测以及模式不能分辨的观测资料,从而有效保障质量控制后资料质量。
4 结论本文通过对探空温度资料的特性及其质量控制方法研究,得出以下结论:
(1) 探空探测器飘移量随高度逐渐增大,在300~100 hPa之间出现较大飘移速率,单站最大飘移1.58°,高空平均飘移稳定在0.35°~0.40°,因此模式分辨率低于30 km时,探空飘移信息在同化系统不可忽略。
(2) 模式地形与测站地形高度差异在背景场一致性检查中影响离群点的判断。当测站地形高度大于模式地形高度时,离群点百分率几乎为0,而当测站地形高度小于模式地形高度时出现离群点,离群点百分率变化与两种地形差异大小呈正相关,即两者地形高度差异越大,离群点百分率越大。同时测站地形越高,模式地形与观测站地形的差异较大的概率越高,离群点就越多。
(3) 基于探空温度资料残余误差和飘移因素建立的双权重标准差质量控制方法能有效保障资料质量。观测温度残余误差和飘移信息对质量控制结果有明显影响。当考虑温度残余误差时,高层可疑资料量减少,低层增加,总体可疑资料量减少。当考虑飘移信息时,高层飘移速率较大区间可疑资料量减少。
管成功, 陈起英, 佟华, 等, 2008. T639L60全球中期预报系统预报试验和性能评估[J]. 气象, 34(6): 11-16. DOI:10.7519/j.issn.1000-0526.2008.06.002 |
嵇磊, 李伟, 雷恒池, 等, 2008. 探空气球飘移位置订正在MM5模式中的应用研究[J]. 高原气象, 27(3): 668-676. |
刘红亚, 薛纪善, 沈桐立, 等, 2005. 探空气球飘移及其对数值预报影响的研究[J]. 应用气象学报, 16(4): 518-526. DOI:10.11898/1001-7313.20050413 |
李柏, 李伟, 2011. 阳江第八届国际探空系统比对试验综述[J]. 气象科技进展, 1(3): 6-13. |
李伟, 李书严, 王建凯, 等, 2010. 中国地区高空气象探测气球空间飘移分析[J]. 气象学报, 68(3): 421-427. DOI:10.11676/qxxb2010.041 |
李伟, 王志文, 谢庄, 等, 2005. 高空探测资料气球飘移的计算方法[J]. 应用气象学报, 16(6): 835-840. DOI:10.11898/1001-7313.20050609 |
李伟, 邢毅, 马舒庆, 2009. 国产GTS1探空仪与VAISALA公司RS92探空仪对比分析[J]. 气象, 35(10): 97-102. DOI:10.7519/j.issn.1000-0526.2009.10.012 |
马颖, 姚雯, 黄炳勋, 2010. 59型与L波段探空仪温度和位势高度记录对比[J]. 应用气象学报, 21(2): 214-220. DOI:10.11898/1001-7313.20100211 |
邱学兴, 王东勇, 陈宝峰, 2012. T639模式预报系统误差统计和订正方法研究[J]. 气象, 38(5): 526-532. DOI:10.7519/j.issn.1000-0526.2012.05.002 |
陶士伟, 陈晓红, 龚建东, 2006. L波段探空仪温度资料误差分析[J]. 气象, 32(10): 46-51. DOI:10.7519/j.issn.1000-0526.2006.10.007 |
王柏春, 彭洪淼, 顾大权, 等, 2002. COSMIC及其在气象领域的应用[J]. 气象科学, 22(2): 247-251. |
王洪, 曹云昌, 肖稳安, 2010. COSMIC掩星数据与L波段探空数据的对比分析[J]. 气象, 36(9): 14-20. DOI:10.7519/j.issn.1000-0526.2010.09.003 |
徐枝芳, 龚建东, 王建捷, 等, 2007. 复杂地形下地面观测资料同化Ⅰ.模式地形与观测站地形高度差异对地面资料同化的影响研究[J]. 大气科学, 31(2): 222-232. |
杨贤为, 1998. 气候应用专用数据库气象资料的质量检验[J]. 气象, 24(12): 33-36. DOI:10.7519/j.issn.1000-0526.1998.12.007 |
袁国波, 韩子亮, 赵红霞, 2009. T639数据格式及其读取方法[J]. 陕西气象, (4): 8-10. |
翟盘茂, 1997. 中国历史探空资料中的一些过失误差及偏差问题[J]. 气象学报, 55(5): 563-572. DOI:10.11676/qxxb1997.055 |
张峻, 2003. 探空资料质量控制及可视化处理系统(HBTK)的研究与应用[J]. 气象, 26(3): 33-50. |
周尚河, 2000. 全国高空资料质量控制和建库方法的研究[J]. 应用气象学报, 11(3): 364-370. |
周毓荃, 欧建军, 2010. 利用探空数据分析云垂直结构的方法及其应用研究[J]. 气象, 36(11): 50-58. DOI:10.7519/j.issn.1000-0526.2010.11.008 |
Christian R, Kuo Ying-Hwa, Schreiner W., et al, 2000. COSMIC system description[J]. TAO, 1(1): 21-52. |
Richard A A, Christian R, Kuo Yinghwa, 2000. Applications of COSMIC to meteorology and climate[J]. TAO, 1(1): 115-156. |
John R Lanzante, Meliss F, 2008. Comparison of Radiosonde and GCM Vertical Temperature Trend Profiles[J]. J Climate, 21. |
Lanzante J R, 1996. Resistant, robust and nonparametric techniques for the analysis of climate data theory and examples, including applications to historical radiosonde station data[J]. Revision for International Journal of Climatology, 16: 1197-1226. DOI:10.1002/(ISSN)1097-0088 |
Zou X, Zeng Z, 2006. A quality control procedure for GPS radio occultation data[J]. J Geophysical Research, 111(D2): D02112. |
William J R, Wu Fei, 2006. Biases in stratospheric and tropospheric temperature trends derived from historical radiosonde Data[J]. J Climate, 19: 2094-2104. DOI:10.1175/JCLI3717.1 |
Wolfgang S, Hans C, et al, 2008. Pressure and temperature differences between vaisala RS80 and RS92 radiosonde systems[J]. American Meteor Social, 25: 909-927. |