2. 浙江省嘉兴市气象台
2. Jiaxing Meteorological Office of Zhejiang Province
气象卫星探测资料对现代天气预报起到了越来越大的作用[1],但由于卫星感应器接收到的能量是来自某一厚层的大气的辐射,反演的垂直分辨率精度比较低[2],使得卫星资料在数值预报及天气诊断中的使用具有较大的局限性。装载在地球观测系统(EOS)Aqua卫星上的先进的大气红外探测器AIRS(Atmospheric Infrared Sounder)是一个高光谱大气红外探测仪,它使大气探测的垂直分辨率和反演精度上了一个台阶。AIRS仪器的信息量是以往探测仪器的上百倍,它能够显示精细的大气结构[3],但目前对其大信息量资料的处理还不完善。
业务上处理AIRS数据主要使用晴空大气业务反演MODIS/AIRS处理软件包IMAPP (International MODIS/AIRS Preprocessing Package)中的特征向量统计反演法[4],它算法简单、求解过程稳定且运算速度快,但由于线性的统计方法精确度不高,使得反演结果的误差较大。
20世纪90年代以来,国内外在气象学科中开展了很多有关神经网络预报建模和气候分析等应用的研究[5-6],人工神经网络已经应用于降雨的预报[7-8]、AMSU-A仪器的微波观测资料反演[9]等。本文针对气象卫星高光谱红外资料反演问题,尝试采用神经网络的方法来提高AIRS资料反演大气温度廓线的精度。
1 资料来源AIRS是NASAAqua卫星平台上六个观测仪器中的一个主要观测仪器,红外辐射资料具有通道多、信息量大、光谱窄的优点。它的光谱覆盖从3.7μm到15.4μm共2378个红外光谱通道,能提供从地面到40km高度的大气信息。Aqua卫星每天过境中国两次, 大约在北京时间1:30和13:30[3]。
基于晴空状况下的大气参数反演使用CIMSS (Cooperative Institute for Meteorological Satellite Studies, University of Wisconsin-Madison)的全球晴空反演训练样本,CIMSS由TIGR3(TOVS Initial Guess Retrieval)、NOAA88和ECMWF等的全球有代表性的温、湿和臭氧等廓线组成,同时还补充了沙漠地区的无线电探空和臭氧探空值(所有廓线从1100 hPa到0.005 hPa被内插到101个气压层)。在研究中使用的辐射值是由SARTA (Stand-Alone Radiative Transfer Algorithm)辐射传播模式得到的,该软件包是AIRS-RTA(大气红外探测器辐射传输算法)的实际应用,是一个用于计算AIRS辐射传输值的快速前向模式[10]。
2 神经网络反演法 2.1 BP网络结构人工神经网络模型中BP网络(Back propagation Neural Network)应用最为广泛,一个3层的前馈网络能够实现任意精度的连续函数映射,它可以有效地用于复杂的非线性函数的逼近[11]。BP模型由不同层次的结点组成(图 1),每一层的结点输出送到下一层结点,输出值由于连接权值不同而被放大衰减或抑制。每一个结点的激励输出值由结点输入、激励函数及偏置量决定。
神经网络模型的输出是
用于训练网络的模拟AIRS资料具有信息量大的特点,涵盖2378个通道的辐射值,样本值约为12208个,反演101个高度层上的温度值,尝试用这么多的数据来训练出一个适合的神经网络是困难的。
主成分分析方法(PCA)是系统降维和特征提取的一种基本方法。它的思想是将原多维序列特征, 通过线性变换,得到一组性质与原特征相同的新特征。新的综合因子变量与原因子变量相比有如下特点[4]:
(1) 每一个新的综合因子变量是原因子变量的线性组合, 即
$ \begin{array}{l} {{\rm{z}}_i} = {v_{i1}}{x_1} + {v_{i2}}{x_2} + \cdot \cdot \cdot + {v_{in}}{x_n}\\ \left( {i = 1, 2 \cdot \cdot \cdot n} \right)其中{v_i}为特征向量 \end{array} $ | (1) |
(2) 新的综合因子变量之间是相互正交的, 即各个因子间的相关系数为零:
$ r\left( {{z_i}, {z_j}} \right) = 0\;\;\;\left( {i, j = 1, 2 \cdot \cdot \cdot n, i \ne j} \right) $ | (2) |
(3) 各个新的综合因子变量的特征值明确表示了它对于原因子组的方差贡献大小。
反演时,最佳特征向量个数与所使用通道个数有关。对AIRS的2378个通道的辐射值作主成分分析,根据参考文献[12]总结的经验,选取前30个主成分分量作为神经网络的输入。
2.3 隐含层的设置三层的BP网络中间一层是隐含层,确定隐含层中适宜的隐节点数使模型的泛化能力最大是神经网络设计中重要的环节[13]。为了寻找泛化性能好的适宜网络结构, 很多研究工作给出了不同的确定适宜隐节点数计算公式[14-15]。由于选用30个特征向量值作为输入层,101个高度上的温度值为输出层,是一个输出多于输入的网络模式,所以使用文献[16]中用曲面对隐节点数的规律进行拟合分析后得到的公式:
$ \begin{array}{l} h = \sqrt {0.42nm + 0.12{m^2} + 2.54n + 0.77m + 0.35} + \\ \;\;\;\;\;0.51 \end{array} $ | (3) |
其中h为隐节点数,n为输入节点数,m为输出节点数。
由公式(3)算出隐节点数为52,以此为初定隐节点数,实际计算不同个数隐节点时网络的训练误差,寻找能使网络收敛最快的隐节点适合量。计算30至70个隐节点时网络训练1000步以后的网络性能,以均方根误差为参考,网络性能越好误差值应越小,得到表 1。
从表 1中可看出,隐节点为60时均方根误差值最小,即最佳隐节点数在50至70之间。再在50到70间,逐个运算,发现隐节点最适合值在60到65之间,如表 2。
从表 2中可以得出,当隐节点为63时,网络收敛最快。神经网络可定型为如图 2样式:输入层、隐含层、输出层节点数分别为30、63、101。
IW{1,1}为输入层到中间层的权值,LW{2,1}为中间层到输出层的权值,b{1}、b{2}分别为两层的偏置。
3 反演结果在晴空状况下CIMSS资料的AIRS模拟辐射值在全球有12208个样本,使用其中9767条廓线训练神经网络,其余2441条独立廓线模拟出AIRS的观测值,代入训练好的网络反演得到101层上的温度值,将此数值与探空观测值及特征向量统计反演法(以下简称统计回归方法)结果作比较,检验神经网络方法的反演结果。
3.1 反演个例图 3给出了两种算法温度反演的个例,该样本位于东经22.2度,北纬65.8度。图中实线为无线电探空观测值(radiosonde),虚线为统计回归方法(regression)反演得到的温度廓线,圆点为神经网络方法(neural network)反演得到的温度值。可以看出,圆点走向与探空值的黑线一致,较好地覆盖了实线,经计算平均误差为0.45K,而统计法结果与实线重合程度较差,平均误差为1.7K。图 4为两种方法反演的温度值相对于无线电探空值的误差,虚线为统计回归方法的误差值,圆点为神经网络法反演结果的误差。图中虚线偏离探空值(0线)较远,而圆点则集中于0线周围,误差幅度小于统计方法1.24K。可以看出神经网络方法得到的整条廓线反演结果较好,近地面层误差减小明显。且在各高度层上都有不同程度的改进,反演结果更加贴合无线电探空的温度廓线。
综合考虑检验反演效果的2441条廓线的均方根误差,得到图 5。图中实线代表使用神经网络反演算法得到的温度与无线电探空观测值的均方根误差曲线,虚线代表回归方法反演得到的温度值与无线电探空观测值的均方根误差曲线。从中可以看出,使用神经网络反演算法比原先使用回归方法反演的廓线与无线电探空温度值误差更小,垂直方向平均改进0.63K。神经网络反演算法在0.01~1hPa改进较大,平均值在2.1K;在1~200hPa改进较小,约为0.36K;在200hPa到近地面层改进值为0.56K。从这样的反演结果看出,神经网络的方法在各高度层上均有一定程度的改进。
AIRS红外探测资料能够显示精细的大气结构,信息量是以往探测仪器的上百倍,文中使用神经网络的方法来处理AIRS资料反演大气温度,并将反演结果与目前使用的特征向量统计回归反演法得到的结果作比较,结果表明,神经网络反演方法略优于特征向量回归反演法。
从训练网络的过程来看,神经网络方法的训练时间长于特征向量回归反演法;从反演的两千多条温度廓线的均方根误差来看,神经网络的方法在大气各层都有着一定程度的改进,特别是在0.01~1hPa改进较大,在平流层和对流层也有0.5K左右的改进;从反演的温度廓线个例来看,神经网络方法反演的结果更加贴合无线电探空的温度值,在温度转折或变化较大的地方反应更加灵敏。
下一步工作中准备使用AIRS实际观测资料,将由神经网络反演得到的温度廓线与匹配的ECMWF (European Center of Medium-range Weather Forecasts)欧洲中心中期天气预报分析场数据比较,进行神经网络反演算法的检验。
宏观, 张文建, 2008. 我国气象卫星及应用发展与展望[J]. 气象, 34(9): 3-9. DOI:10.7519/j.issn.1000-0526.2008.09.001 |
蒋德明, 董超华, 陆维松, 2006. 利用AIRS观测资料进行红外高光谱大气探测能力试验的研究[J]. 遥感学报, 10(4): 586-592. DOI:10.11834/jrs.20060486 |
高文华, 赵凤生, 盖长松, 2006. 大气红外探测器(AIRS)温、湿度反演产品的有效性检验及在数值模式中的应用研究[J]. 气象学报, 64(3): 271-280. DOI:10.11676/qxxb2006.026 |
Smith W L, Woolf H M, Jacob W J, 1970. A regression method for obtaining real-time temperature and geopotential height profiles from satellite spectrometer measurements and its application to Nimbus 3 "SIRS" observation[J]. Mon WeaRev, 98(8): 582-603. |
金龙, 况雪源, 黄海洪, 等, 2004. 人工神经网络预报模型的过拟合研究[J]. 气象学报, 62(1): 62-70. DOI:10.11676/qxxb2004.007 |
蔡敏, 黄艳, 朱宵峰, 等, 2009. 基于BP神经网络的地质灾害细网格预报模型[J]. 气象, 35(7): 95-100. DOI:10.7519/j.issn.1000-0526.2009.07.014 |
金龙, 陈宁, 1999. 基于人工神经网络的集成预报方法研究和比较[J]. 气象学报, 57(2): 198-207. DOI:10.11676/qxxb1999.018 |
李永华, 刘德, 金龙, 2002. 基于BP神经网络的汛期降水预测模型研究[J]. 气象科学, 22(4): 461-467. |
Lei Shi, 2001. Retrieval of atmospheric temperature profiles from AMSU-A measurement using a neural network approach[J]. Journal of atmospheric and oceanic technology, 18: 340-347. DOI:10.1175/1520-0426(2001)018<0340:ROATPF>2.0.CO;2 |
Strow L L, Hannon S E, Motteler H E, 2003. An Overview of the AIRS radiative transfer model[J]. IEEE Trans. Geosci. Remote Sensing, 41(2): 303-313. DOI:10.1109/TGRS.2002.808244 |
Martin T Hagan, Howard B Demuth, Mark H Beale, 2002. 神经网络设计[M].
北京: 机械工业出版社.
|
官莉. 卫星红外超光谱资料及其在云检测、晴空订正和大气廓线反演方面的应用[D]. 博士论文, 2005. http://cdmd.cnki.com.cn/Article/CDMD-10300-2005066292.htm
|
江学军, 唐焕文, 2000. 前馈网络泛化性能力的系统分析[J]. 系统工程理论与实践, 20(8): 36-40. |
袁曾任, 1999. 人工神经网络及其应用[M]. 北京: 清华大学出版社.
|
Mirchandani Gagan, Gao Wei, 1989. On hidden nodes for neural nets[J]. IEEE transactions on circuits and systems, 36(5): 661-664. DOI:10.1109/31.31313 |
高大启, 1998. 有教师的线性基本函数前向神经网络结构研究[J]. 计算机学报, 21(4): 80-86. |