2. 河南省气象服务中心, 郑州 45000;
3. 河南省人工影响天气中心, 郑州 450003
2. Henan Meteorological Service Center, Zhengzhou 45000;
3. Weather Modification Center of Henan Province, Zhengzhou 450003
太阳能因其具有清洁、无污染、分布广泛等优势,在“碳达峰、碳中和”的目标驱动下,得到了更为广泛的关注和应用。在太阳能的众多利用方式中,光伏发电因其转换效率高、使用期长,装机容量迅速增长,截至2023年11月底,河南省新能源装机容量达6021万kW,首次突破6000万kW,新能源装机占全省电源总装机的44%,稳居河南省第二大电源,其中分布式光伏装机容量增速为全国第一。随着光伏并网的快速增长,光伏功率预报已成为制约光伏发电并网消纳的重要瓶颈,大规模的光伏并网会对电网的稳定性造成冲击,增加电网计划和调度的难度,影响电网稳定运行(Delannoy et al, 2021)。
地表太阳总辐射作为影响光伏功率预报的关键因子,其在时间变化上具有不连续、不确定性,如何提高太阳短波辐射精细化预报的准确率是亟待解决的问题(Haupt and Kosovic, 2017;李遥等,2020)。白永清等(2013)、顾婷婷等(2022)、孙朋杰等(2015)利用MOS订正方法对模式预报总辐照度进行订正,研究表明该方法对太阳辐射的预报精度有一定程度的改善。随着计算机性能的提高以及海量数据的收集,越来越多的研究者开始使用机器学习方法对预报模拟偏差进行订正,研究表明机器学习方法较传统统计学方法订正效果更为明显(普智勇等,2023;Belmahdi and el Bouardi, 2024)。王雪洁等(2022)基于随机森林方法对ERA5总辐射产品进行了订正,结果表明经过随机森林订正后精度有明显的提高,随机森林模拟精度高,有较高的稳定性。陈昱文等(2020)挖掘观测数据的时序特征并结合气温预报训练机器学习模型,发现集成学习方法在数值模式预报结果订正中具有较大的应用潜力。机器学习在气温数值预报(陈有龙等,2020;李韬等,2022;方鸿斌等,2024;智协飞等,2020)、空气质量(芦华等,2020)以及海洋环境预报(许立兵等,2020)、风速(孙全德等,2019;徐景峰等,2023)、强对流监测预报(周康辉等,2021;李文娟等,2024)、灾害等级评估(刘淑贤等,2024;Zhang et al,2019)等方面都有应用且效果较好。
中国气象局风能太阳能预报系统(CMA-WSP2.0)预报产品,其时间分辨率为15 min,空间分辨率为9 km,包含总辐照度、温度、湿度、气压等与光伏功率预报相关的要素(万超等,2023)。但由于模式初始场、动力和微物理参数化方案的不完善等多种原因,导致模式预报结果偏差较大,目前该预报产品在河南省的预报准确性和适用性有待检验和提高。因此为提高CMA-WSP2.0的模式预报总辐照度产品质量,提升该产品在河南省适用性,本研究采用多种机器学习方法(随机森林、XGBoost、LightGBM),结合地理特征、日变化特征、模式偏差及融合多种影响总辐照度的物理因子,对CMA-WSP2.0预报总辐照度进行订正。将河南省划分为豫东、豫西、豫南、豫北、豫中5个区域(张凡和程凯琪,2024),基于LASSO回归进行相关特征要素的选择,进行机器学习训练建模,对CMA-WSP2.0预报总辐照度进行订正,并通过准确率、合格率、均方根误差、平均绝对误差等相关统计量比较不同订正方法的修正效果。
1 数据和方法 1.1 数据本文使用的实测总辐照度数据为河南省23个辐射观测站(图 1)逐时观测总辐照度,数据来源于河南省“天擎”平台,其中郑州、固始、南阳提供总辐照度观测较早,分别于1957年、1960年、1990年开始进行总辐照度观测,其他辐射观测站于2018年提供总辐照度观测,各气象站的观测运维及数据质量控制由各地市级气象局和河南省气象探测数据中心负责。观测设备使用TBQ-2-B型号总辐射表,该设备能够捕捉到波长介于0.3~3.0 μm的太阳总辐射。对于地面总辐照度的观测,一般通过每分钟至少进行6次的总辐照度数据采集,取1分钟内数据平均值作为该分钟的总辐照度值。
![]() |
图 1 河南省辐射观测站分布及区域划分 注:填色为地形高度。 Fig. 1 Distribution and regional division of radiation observation stations in Henan Province |
河南省地形复杂,地势西高东低,北、西、南三面被太行山、伏牛山、桐柏山、大别山环绕,中东部为平原,为更好探索不同订正方法效果,将河南省划分为豫东、豫西、豫南、豫北、豫中5个区域,23个辐射观测站也进行了划分(图 1,表 1)。
![]() |
表 1 河南省辐射观测站区域划分 Table 1 Regional division of radiation observation stations in Henan Province |
模式数据为CMA-WSP2.0预报产品,模式每日20时(北京时,下同)起报,时间分辨率为15 min,空间分辨率为9 km,模式数据来源于中国气象局业务下发,时间范围为2022年1月1日至12月31日。提取研究时段内CMA-WSP2.0模式每日20时起报的0~84 h的逐时预报要素场,使用邻近插值法把模式预报场插值到23个辐射观测站位置,构建总辐照度订正模型。初步选取要素包括:时间、总辐照度、法向短波辐射、地表向下直接辐射、晴空地表向下直接辐射、地表散射辐射、地表向下长波辐射、10 m纬向风、10 m经向风、70 m纬向风、70 m经向风、80 m纬向风、80 m经向风、100 m纬向风、100 m经向风、120 m纬向风、120 m经向风、2 m温度、2 m比湿、地面温度、地面气压、雪水当量、积云对流累计降水量、网格尺度累计降水量、地表反照率、边界层高度,共26个预报要素场,使用LASSO回归对26个预报要素场做特征变量筛选,并进行机器学习方法模型的训练,订正模式预报总辐照度。
1.2 方法 1.2.1 LASSO回归Tibshiran(2011)提出的LASSO回归,是一种用于线性回归的正则化方法,通过在损失函数中添加L1正则项来促使模型参数稀疏化,得到一个更为精炼简单的模型,将一部分系数进行压缩,一些系数设定为0,因此保留子集收缩的优点。
在本文总辐照度订正中,给定有m个气象因素(特征)的特征向量x=(x1, x2, …, xm),其中xi为x在第i个特征上的取值,通过m个气象特征的线性组合来预测总辐照度,公式如下:
$ f(\boldsymbol{x})=w_1 x_1+w_2 x_2+\cdots+w_m x_m $ | (1) |
式中wi为第i个气象特征的权重。
损失函数的定义为:
$ \operatorname{loss}(w)=\|f(x)-y\|^2+\alpha\|w\| $ | (2) |
式中:y表示总辐照度实测值,α‖w‖是正则化项,不仅有助于降低过拟合风险,还具有特征选择的作用。通过对loss(w)求最小值,得到w,从而确定LASSO回归模型。
1.2.2 随机森林基于集成学习的随机森林算法是一种经典的机器学习方法,最早由Breiman(2001)提出,其通过组合多个决策树进行预测,在回归问题中取其平均值。随机森林方法在数据挖掘各个领域具有较广的应用性,对于异常值和噪声具有较好的容忍度,不容易出现过拟合。
随机森林一般采用以下步骤进行训练:第一步,数据准备,对原始数据集进行构建;第二步,随机抽样,构建多个决策树进行预测,每个决策树的训练样本通过随机抽样得到,进行重复训练后得到多个决策树,组成随机森林;第三步,随机森林的预测,采用平均的方式,最终结果为每个决策树的预测值取平均。
1.2.3 XGBoostXGBoost是一种基于梯度提升决策树的机器学习方法,具有快速训练时间、自动处理数据不平衡、自动选择最佳特征等优势。XGBoost方法通过不同的目标函数、正则化以及损失函数来训练模型,其以树模型为基础,可以使模型自动学习特征的权重,并且具有较高的准确率。
1.2.4 LightGBMLightGBM是微软于2016年开源的一种将决策树作为机器学习的梯度提升机器学习的框架,是对梯度提升方法的高效实现,原理上和XGBoost类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。
1.2.5 检验方法检验指标主要包括平均绝对误差(MAE)、均方根误差(RMSE)、相关系数(R)、准确率(A)、合格率(Q),MAE和RMSE主要反映真实值与预测值之间的偏离情况,反映模式的预测能力和准确性。A则是反映一段时间内连续的太阳辐射预报值与实测值之间接近程度的指标,Q是反映一段时间内到达基本评判要求的太阳辐射预报占比的指标(张敏等,2024)。
$ \mathrm{MAE}=\frac{1}{n} \sum\limits_{i=1}^n\left|I_{\mathrm{f}}^i-I_{\mathrm{o}}^i\right| $ | (3) |
$ \text { RMSE }=\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(I_{\mathrm{f}}^i-I_{\mathrm{o}}^i\right)^2} $ | (4) |
$ R=\frac{\sum\limits_{i=1}^n\left(I_{\mathrm{o}}^i-\bar{I}_{\mathrm{o}}\right)\left(I_{\mathrm{f}}^i-\bar{I}_{\mathrm{f}}\right)}{\sqrt{\sum\limits_{i=1}^n\left(I_{\mathrm{o}}^i-\bar{I}_{\mathrm{o}}\right)^2} \sqrt{\sum\limits_{i=1}^n\left(I_{\mathrm{f}}^i-\bar{I}_{\mathrm{f}}\right)^2}} $ | (5) |
$ A=\left(1-\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(\frac{I_{\mathrm{f}}^i-I_{\mathrm{o}}^i}{I}\right)^2}\right) \times 100 \% $ | (6) |
$ Q=\frac{1}{n} \sum\limits_{i=1}^n Q_i \times 100 \% $ | (7) |
$ Q_i= \begin{cases}1 & \frac{\left|I_{\mathrm{f}}^i-I_{\circ}^i\right|}{I}<0.3 \\ 0 & \frac{\left|I_{\mathrm{f}}^i-I_{\circ}^i\right|}{I} \geqslant 0.3\end{cases} $ | (8) |
式中:n为样本总量,Iif和Iio分别为当日第i时刻的预报和实测总辐照度,
在订正模型构建之前,首先对数据进行预处理,剔除实测总辐照度及模式预报要素中的错误值及缺测值,将实测总辐照度与模式预报结果进行匹配,同时为了避免训练时各要素值数值小而贡献小的问题,对各要素进行标准化处理。将处理后的各个站点数据分成两个部分(原始训练集和原始测试集),考虑模型训练更适用于样本量较大的数据集,同时避免因客观条件对训练与测试产生影响,将数据集打乱后随机选取80%的数据作为原始训练集,其中豫东、豫西、豫南、豫北、豫中样本量分别为99 090、99 167、123 951、123 981、123 722条,剩下20%数据作为原始测试集,豫东、豫西、豫南、豫北、豫中样本量分别为24 772、24 792、30 988、30 995、30 930条。
然后基于LASSO回归进行特征量的选择,每个区域输入的自变量特征共26个,利用原始训练集数据,通过LASSO回归训练,得到豫东、豫西、豫南、豫北、豫中26个特征要素与总辐照度的权重,根据权重的绝对值从高到低进行排列,对5个区域进行训练,得到河南省5个区域原始测试集中RMSE随特征量维度变化的曲线(图 2)。可以看出,当特征量维度到达一定数量时,RMSE不再显著降低,达到一个稳定的水平。通过对河南省5个区域特征量进行分析,最后选取时间、总辐照度、法向短波辐射、地表向下直接辐射、晴空地表向下直接辐射、地表向下长波辐射、10 m纬向风、10 m经向风、2 m温度、2 m比湿、地面气压、网格尺度累计降水量、地表反照率、边界层高度共14个特征量进行随机森林、XGBoost、LightGBM的训练,通过特征量的选择可以降低计算和所用的存储,减少模型训练时间。
![]() |
图 2 2022年原始测试集中河南省5个区域基于LASSO回归预测总辐照度RMSE随特征量维度的变化 Fig. 2 RMSE of total irradiance prediction varying with feature dimension based on LASSO regression in five regions of Henan Province in the original test set in 2022 |
根据LASSO回归筛选出的14个特征量,分别从原始训练集和原始测试集中提取对应的特征列,重新构建训练集和测试集。将训练集进行随机森林、XGBoost和LightGBM三种机器学习的模型训练,并在硬件环境和时间允许的范围内对三种机器学习方法中关键参数通过网格搜索寻找最优参数,得到每种机器学习方法的最优参数模型。使用最优参数模型对测试集进行订正,并对订正结果进行检验分析。
3 订正结果检验 3.1 分站点和区域评估统计三种机器学习方法订正后及CMA-WSP2.0预报的河南省23个辐射观测站总辐照度与观测总辐照度的MAE、R及RMSE,以及三种方法较CMA-WSP2.0预报总辐照度的改善效果(图 3,图 4)。由图 3a可见,CMA-WSP2.0预报MAE在45.88~ 61.79 W·m-2,嵩山、宝丰、西峡、栾川MAE较大,在60 W·m-2以上,河南东部地区的MAE较小,最小值为永城站(45.88 W·m-2),这可能与河南西高东低的地形分布有关,在地形复杂区域,模式偏差较大。经随机森林、XGBoost、LightGBM订正后的MAE范围分别为26.36~39.07、25.05~ 37.17、23.25~34.02 W·m-2。三种机器学习方法订正后的MAE明显降低,其中LightGBM方法订正效果最好,MAE相较于CMA-WSP2.0减小了18.32~ 32.91 W·m-2,减小比例在38%~56%,XGBoost订正效果次之,MAE减小比例在34%~53%,相较于XGBoost订正和LightGBM订正,随机森林订正效果最弱,但MAE减小比例也在32%~52%,三种机器学习方法均对CMA-WSP2.0的预报总辐照度进行了改善。
![]() |
图 3 2022年河南省各站点测试集中CMA-WSP2.0预报, 随机森林、XGBoost、LightGBM订正的总辐照度(a)MAE, (b)RMSE, (c)R Fig. 3 (a) MAE, (b) RMSE and (c) R of total irradiance predicted by CMA-WSP2.0 and corrected by random forest, XGBoost and LightGBM at each station in Henan Province in the test set in 2022 |
![]() |
图 4 2022年河南省各站点测试集中随机森林、XGBoost、LightGBM订正的总辐照度(a)MAE减小值, (b)MAE减小比例, (c)RMSE减小值, (d)RMSE减小比例 Fig. 4 Reduction values and (b) reduction proportion of MAE, and (c) reduction values and (d) reduction proportion of RMSE of total irradiance corrected by random forest, XGBoost and LightGBM at each station in Henan Province in the test set in 2022 |
从RMSE统计结果分析,经过三种机器学习方法订正后的RMSE显著降低,CMA-WSP2.0模式预报与观测值的RMSE为106.10~133.04 W·m-2,其中随机森林、XGBoost、LightGBM订正后的RMSE分别为62.52~92.65、58.25~86.44、53.88~ 81.25 W·m-2。LightGBM和XGBoost订正后的RMSE减小值和减小比例大于随机森林(图 4),LightGBM的RMSE减小比例最大,范围在36%~52%。23个辐射观测站CMA-WSP2.0预报与实测值的R为0.85~0.95,经过订正之后,三种方法R大多都在0.95以上。
A和Q是电网调度考核的重要指标,GB/T 40607—2021(国家市场监督管理总局和国家标准化管理委员会,2021)中对光伏预测性能指标要求光伏短期(24 h)功率预测A高于85%以上。图 5给出了河南省各站点总辐照度模式预报与订正后的24 h的A、Q检验结果,CMA-WSP2.0预报总辐照度24 h的A在81.2%~87.1%,经过随机森林订正后A在88.3%~91.5%,XGBoost订正后A在89.1%~92.0%,LightGBM订正后A在89.8%~92.5%,相较于CMA-WSP2.0,三种机器学习方法均显著提升了24 h的A,其中LightGBM最高,24 h的平均值较CMA-WSP2.0预报提升了7.3%。三种机器学习方法对24 h的Q也较CMA-WSP2.0预报有了明显的提升,LightGBM提升效果最好,24 h的平均值较CMA-WSP2.0预报提升了5.7%;XGBoost次之,提升了5.2%。从MAE、RMSE、24 h的A和Q及R等统计量分析结果而言,三种机器学习方法订正效果良好,相较于CMA-WSP2.0预报结果,MAE和RMSE显著降低,24 h的A、Q显著提升,其中LightGBM订正效果最好,XGBoost订正效果次之,随机森林订正效果最弱。
![]() |
图 5 2022年河南省各站点测试集中CMA-WSP2.0预报,随机森林、XGBoost、LightGBM订正的总辐照度24 h(a)A,(b)Q Fig. 5 (a) A and (b) Q in 24 h of total irradiance predicted by CMA-WSP2.0 and corrected by random forest, XGBoost and LightGBM at each station in Henan Province in the test set in 2022 |
为进一步探索不同机器学习方法订正效果,对河南省5个区域订正效果进行检验评估。表 2给出了河南省5个区域总辐照度CMA-WSP2.0预报及三种机器学习方法订正后的MAE和RMSE,CMA-WSP2.0预报的5个区域中, 豫西区域MAE和RMSE最大,分别为57.51 W·m-2、123.50 W·m-2;豫东区域最小,分别为47.71 W·m-2、108.04 W·m-2。豫西区域4个辐射观测站平均海拔高度为576.4 m,豫东区域4个辐射观测站平均海拔高度较低(52.3 m),CMA-WSP2.0对于地形复杂、海拔高度较高区域模拟结果差于地势平坦区域。三种订正方法均有效降低了MAE和RMSE,其中,随机森林订正后MAE和RMSE减小比例分别在38%~48%、31%~41%,LightGBM和XGBoost优于随机森林,LightGBM订正又优于XGBoost,LightGBM订正后MAE和RMSE减小比例分别在44%~ 53%、39%~48%。对于5个区域而言,豫西区域的订正效果最好(表 3)。
![]() |
表 2 2022年河南省5个区域测试集中CMA-WSP2.0预报,随机森林、XGBoost、LightGBM订正的总辐照度MAE和RMSE(单位:W·m-2) Table 2 The MAE and RMSE of total irradiance predicted by CMA-WSP2.0 and corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in 2022 (unit: W·m-2) |
![]() |
表 3 2022年河南省5个区域测试集中随机森林、XGBoost、LightGBM订正的总辐照度MAE和RMSE的减小比例(单位:%) Table 3 The reduction proportions of MAE and RMSE of the total irradiance corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in 2022 (unit: %) |
进一步分析预报值与实际观测值之间的偏差在整个数据集上的分布情况。由于夜晚总辐照度观测为零值,在数据中占比较大,为了更好地分析订正效果,去除了模拟和观测同时为零值的数据。图 6给出了河南省5个区域模式预报及三种机器学习订正后的总辐照度与观测总辐照度的偏差概率分布特征,结果显示,三种机器学习方法订正后的偏差概率分布更表现出正态分布的特征,而CMA-WSP2.0预报的偏差概率更多分布在正值,模式预报较观测数值偏大。经三种机器学习方法订正后的偏差出现在零值附近的概率更高,且偏差分布集中范围更窄,其中LightGBM订正效果更好。
![]() |
图 6 2022年河南省5个区域测试集中模式预报及三种机器学习方法订正的总辐照度与观测的偏差概率分布 Fig. 6 The probability distribution of the deviation between the total irradiance predicted by CMA-WSP2.0 and corrected by three machine learning methods and the observations in five regions of Henan Province in the test set in 2022 |
选取1月、4月、7月、10月分别代表冬、春、夏、秋,对河南省5个区域不同季节总辐照度的订正效果进行分析检验,从MAE和RMSE减小比例可知(图 7, 图 8),三种机器学习方法对河南省不同区域各季节的总辐照度模拟结果均有一定的提升效果。四季总辐照度的订正效果整体表现为冬季订正效果最好,秋季次之,对于夏季的订正效果最弱。在三种机器学习方法中,LightGBM和XGBoost订正优于随机森林,LightGBM订正又优于XGBoost。随机森林MAE和RMSE减小比例范围分别为25%~69%、26%~64%,而LightGBM则分别为32%~72%、33%~70%。
![]() |
图 7 2022年不同季节河南省5个区域测试集中随机森林、XGBoost、LightGBM订正的总辐照度MAE减小比例 Fig. 7 Reduction proportion of the MAE of total irradiance corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in different seasons in 2022 |
![]() |
图 8 2022年不同季节河南省5个区域测试集中随机森林、XGBoost、LightGBM订正的总辐照度RMSE减小比例 Fig. 8 Reduction proportion of the RMSE of total irradiance corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in different seasons in 2022 |
将地面观测总辐照度按数值大小划分为以下等级(0,100)、[100,200)、[200,300)、[300,400)、[400,500)、[500,600)、[600,700)、[700,800)、[800,+∞)(徐丽娜等,2021;杨宣等,2024),分析各区域CMA-WSP2.0预报及不同订正方法订正效果随总辐照度不同等级的分布特征。从MAE的分布可见(图 9),CMA-WSP2.0的MAE在58.2~ 191.0 W·m-2之间,在不同的总辐照度等级,MAE明显不同,当总辐照度<300 W·m-2时,MAE随总辐照度的增大而增大,之后MAE逐渐减小,在总辐照度700 W·m-2左右MAE又开始增大,各个区域CMA-WSP2.0预报在总辐照度[200,300)等级的MAE最大。经过三种机器学习方法订正后MAE明显减小,MAE减小比例随着总辐照度的增大总体呈减小趋势,LightGBM订正效果最好,MAE减小比例在12%~65%,当总辐照度<500 W·m-2时,MAE减小比例均在40%以上,而对于总辐照度在[800, +∞)等级则在10%左右(图略)。RMSE(图 10)显示出与MAE相似的规律,三种机器学习方法均有效改善了CMA-WSP2.0预报,对于不同的总辐照度等级,改善效果存在有差别;RMSE减小比例随着总辐照度的增大总体呈减小趋势(图略)。
![]() |
图 9 2022年河南省5个区域测试集中CMA-WSP2.0预报,随机森林、XGBoost、LightGBM订正的总辐照度在不同总辐照度等级下的MAE Fig. 9 MAE in different total irradiance levels of total irradiance predicted by CMA-WSP2.0 and corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in 2022 |
![]() |
图 10 2022年河南省5个区域测试集中CMA-WSP2.0预报,随机森林、XGBoost、LightGBM订正的总辐照度在不同总辐照度等级下的RMSE Fig. 10 RMSE in different total irradiance levels of total irradiance predicted by CMA-WSP2.0 and corrected by random forest, XGBoost and LightGBM in five regions of Henan Province in the test set in 2022 |
使用2022年河南省23个辐射观测站总辐照度数据和CMA-WSP2.0模式产品,通过LASSO回归方法选取特征变量,建立了训练数据集和测试数据集,采用机器学习方法(随机森林、XGBoost、LightGBM)对训练数据集进行模型训练,订正河南省CMA-WSP2.0预报总辐照度,并对订正结果分站点、分区域、分季节、总辐照度分级进行检验,主要得到以下结论:
(1) 河南省23个辐射观测站统计检验表明,随机森林、XGBoost、LightGBM订正后的总辐照度相比CMA-WSP2.0预报结果,与观测总辐照度的MAE和RMSE显著降低,24 h的准确率和合格率显著提升。其中LightGBM订正效果最优,MAE相较于CMA-WSP2.0预报减小18.32~32.91 W· m-2,减小比例在38%~56%,RMSE减小比例在36%~52%;24 h的平均准确率、合格率较CMA-WSP2.0提升了7.3%、5.7%。
(2) 区域统计与站点统计结果较为一致,三种订正方法均有效地降低了MAE和RMSE,其中,LightGBM订正后MAE和RMSE减小比例分别在44%~53%、39%~48%,LightGBM和XGBoost订正优于随机森林订正,LightGBM订正又优于XGBoost。对于5个区域而言,对于豫西区域订正效果最好。偏差的概率分布表明,三种机器学习方法订正后的偏差出现在零值附近的概率更高,且偏差分布集中范围更窄,其中LightGBM订正效果更为显著。
(3) 四个季节检验评估结果表明,冬季订正效果最好,秋季次之,夏季最弱。在三种机器学习方法中,LightGBM订正效果最好,MAE和RMSE减小比例分别在32%~72%、33%~ 70%。
(4) 对于不同的总辐照度等级,三种机器学习方法均有效改善了CMA-WSP2.0预报,随着总辐照度等级的增加,订正效果总体呈逐渐减弱的趋势。
由上述分析可知,本文运用的三种机器学习方法对CMA-WSP2.0总辐照度预报进行了较好的改善,未来将进一步研究生成总辐照度格点预报订正产品,从而达到更好的预报效果。
白永清, 陈正洪, 王明欢, 等, 2013. 关于WRF模式模拟到达地表短波辐射的统计订正[J]. 华中师范大学学报(自然科学版), 47(2): 292-296. |
Bai Y Q, Chen Z H, Wang M H, et al, 2013. Statistical correction on the surface shortwave radiation forecasted by WRF model[J]. J Huazhong Norm Univ (Nat Sci), 47(2): 292-296.
|
陈有龙, 宁雨珂, 唐荣年, 等, 2020. 基于时空独立的随机森林模型对海南热带气温数值预报的订正[J]. 海南大学学报(自然科学版), 38(4): 356-364. |
Chen Y L, Ning Y K, Tang R N, et al, 2020. Tropical temperature correction for numerical forecast in Hainan based on spatiotemporal independence random forest model[J]. Nat Sci J Hainan Univ, 38(4): 356-364.
|
陈昱文, 黄小猛, 李熠, 等, 2020. 基于ECMWF产品的站点气温预报集成学习误差订正[J]. 应用气象学报, 31(4): 494-503. |
Chen Y W, Huang X M, Li Y, et al, 2020. Ensemble learning for bias correction of station temperature forecast based on ECMWF products[J]. J Appl Meteor Sci, 31(4): 494-503.
|
方鸿斌, 王珊珊, 王晓玲, 等, 2024. 基于机器学习的格点气温预报订正方法[J]. 气象, 50(1): 103-114. DOI:10.7519/j.issn.1000-0526.2023.111701 |
Fang H B, Wang S S, Wang X L, et al, 2024. Gridded temperature forecast correction method based on machine learning[J]. Meteor Mon, 50(1): 103-114.
|
顾婷婷, 潘娅英, 张加易, 2022. 浙江省中尺度数值预报系统的地表太阳辐射预报订正方法[J]. 干旱气象, 40(2): 327-332. |
Gu T T, Pan Y Y, Zhang J Y, 2022. Correction method of surface solar radiation forecast based on ZJWARMS[J]. J Arid Meteor, 40(2): 327-332.
|
国家市场监督管理总局, 国家标准化管理委员会, 2021. 调度侧风电或光伏功率预测系统技术要求: GB/T 40607—2021[S]. 北京: 中国标准出版社.
|
State Administration for Market Regulation, National Standardization Administration, 2021. Technical requirements for dispatching side forecasting system of wind or photovoltaic power: GB/T 40607-2021[S]. Beijing: Standards Press of China(in Chinese).
|
李韬, 王磊, 李月英, 等, 2022. 基于随机森林的EC气温预报订正研究[J]. 农业灾害研究, 12(6): 95-97. |
Li T, Wang L, Li Y Y, et al, 2022. Study on EC temperature forecast revision based on random forest[J]. J Agricult Catastrophol, 12(6): 95-97.
|
李文娟, 郦敏杰, 马昊, 等, 2024. 基于XGBoost分类和数值模式"配料"的浙江强对流预报方法[J]. 气象, 50(11): 1343-1358. DOI:10.7519/j.issn.1000-0526.2024.081902 |
Li W J, Li M J, Ma H, et al, 2024. Severe convection prediction method based on XGBoost classified algorithm and numerical model ingredients[J]. Meteor Mon, 50(11): 1343-1358.
|
李遥, 李照荣, 王小勇, 等, 2020. 基于斜面辐射算法的短期光伏功率预测方法研究[J]. 干早气象, 38(5): 869-877. |
Li Y, Li Z R, Wang X Y, et al, 2020. Prediction methods of short-term photovoltaic power based on inclined plane solar radiation algorithm[J]. J Arid Meteor, 38(5): 869-877.
|
刘淑贤, 张立生, 刘扬, 等, 2024. 基于机器学习的热带气旋灾害等级评估模型构建及其活动特征分析[J]. 气象, 50(3): 331-343. DOI:10.7519/j.issn.1000-0526.2023.043001 |
Liu S X, Zhang L S, Liu Y, et al, 2024. Construction of tropical cyclone disaster grade assessment model based on machine learning and analysis of its activity characteristics[J]. Meteor Mon, 50(3): 331-343.
|
芦华, 谢旻, 吴钲, 等, 2020. 基于机器学习的成渝地区空气质量数值预报PM2.5订正方法研究[J]. 环境科学学报, 40(12): 4419-4431. |
Lu H, Xie M, Wu Z, et al, 2020. Adjusting PM2.5 prediction of the numerical air quality forecast model based on machine learning methods in Chengyu Region[J]. Acta Sci Circumst, 40(12): 4419-4431.
|
普智勇, 夏攀, 张璐, 等, 2023. 机器学习与统计方法在太阳能预报中的比较性分析[J]. 太阳能学报, 44(7): 162-167. |
Pu Z Y, Xia P, Zhang L, et al, 2023. Comparative analysis of machine learning and statistical methods in solar energy prediction[J]. Acta Energ Solaris Sin, 44(7): 162-167.
|
孙朋杰, 陈正洪, 成驰, 等, 2015. 一种改进的太阳辐射MOS预报模型研究[J]. 太阳能学报, 36(12): 3048-3053. |
Sun P J, Chen Z H, Cheng C, et al, 2015. Improved MOS model for solar radiation forecasting[J]. Acta Energiae Solaris Sin, 36(12): 3048-3053.
|
孙全德, 焦瑞莉, 夏江江, 等, 2019. 基于机器学习的数值天气预报风速订正研究[J]. 气象, 45(3): 426-436. DOI:10.7519/j.issn.1000-0526.2019.03.012 |
Sun Q D, Jiao R L, Xia J J, et al, 2019. Adjusting wind speed prediction of numerical weather forecast model based on machine learning methods[J]. Meteor Mon, 45(3): 426-436.
|
万超, 刘涛, 曾莉萍, 等, 2023. 基于CMA-WSP1.0的贵州短波辐射检验分析[J]. 科技创新与应用, 13(30): 104-107. |
Wan C, Liu T, Zeng L P, et al, 2023. Analysis of Guizhou shortwave radiation testing based on CMA-WSP1.0[J]. Technol Innov Appl, 13(30): 104-107.
|
王雪洁, 施国萍, 周子钦, 等, 2022. 基于随机森林算法对ERA5太阳辐射产品的订正[J]. 自然资源遥感, 34(2): 105-111. |
Wang X J, Shi G P, Zhou Z Q, et al, 2022. Revision of solar radiation product ERA5 based on random forest algorithm[J]. Remote Sens Nat Resour, 34(2): 105-111.
|
徐景峰, 宋林烨, 陈明轩, 等, 2023. 冬奥会复杂山地百米尺度10 m风速预报的机器学习订正对比试验[J]. 大气科学, 47(3): 805-824. |
Xu J F, Song L Y, Chen M X, et al, 2023. Comparative machine learning-based correction experiment for a 10 m wind speed forecast at a 100 m resolution in complex mountainous areas of the Winter Olympic Games[J]. Chin J Atmos Sci, 47(3): 805-824.
|
徐丽娜, 申彦波, 李忠, 等, 2021. 基于概率密度匹配方法的FY-4A地表入射太阳辐射订正[J]. 高原气象, 40(4): 932-942. |
Xu L N, Shen Y B, Li Z, et al, 2021. Correction of FY-4A surface solar irradiance based on probability density function matching method[J]. Plateau Meteor, 40(4): 932-942.
|
许立兵, 王安喜, 汪纯阳, 等, 2020. 基于机器学习的海洋环境预报订正方法研究[J]. 海洋通报, 39(6): 695-704. |
Xu L B, Wang A X, Wang C Y, et al, 2020. Research on correction method of marine environment prediction based on machine learning[J]. Mar Sci Bull, 39(6): 695-704.
|
杨宣, 魏璐, 马百胜, 等, 2024. FY-4A卫星地表太阳辐射产品在河南省适用性评估与订正方法研究[J]. 高原气象, 43(6): 1600-1613. |
Yang X, Wei L, Ma B S, et al, 2024. Assessment of the applicability and calibration methods of FY-4A satellite surface solar radiation products in Henan Province[J]. Plateau Meteor, 43(6): 1600-1613.
|
张敏, 袁心仪, 张顾, 等, 2024. CMA-WSP2.0在江苏地表太阳辐射预报中的检验评估[J]. 气象研究与应用, 45(1): 17-22. |
Zhang M, Yuan X Y, Zhang G, et al, 2024. Validation and evaluation of CMA-WSP2.0 in surface solar radiation forecasting in Jiangsu[J]. J Meteor Res Appl, 45(1): 17-22.
|
张凡, 程凯琪, 2024. 基于降雪识别的河南省降雪及降雪比率时空变化特征[J]. 气象与环境科学, 47(4): 13-22. |
Zhang F, Cheng K Q, 2024. Spatio-temporal variation characteristics of snowfall and snowfall ratio in Henan Province based on snowfall identification[J]. Meteor Environ Sci, 47(4): 13-22.
|
智协飞, 王田, 季焱, 2020. 基于深度学习的中国地面气温的多模式集成预报研究[J]. 大气科学学报, 43(3): 435-446. |
Zhi X F, Wang T, Ji Y, 2020. Multimodel ensemble forecasts of surface air temperature over China based on deep learning approach[J]. Trans Atmos Sci, 43(3): 435-446.
|
周康辉, 郑永光, 韩雷, 等, 2021. 机器学习在强对流监测预报中的应用进展[J]. 气象, 47(3): 274-289. DOI:10.7519/j.issn.1000-0526.2021.03.002 |
Zhou K H, Zheng Y G, Han L, et al, 2021. Advances in application of machine learning to severe convective weather monitoring and forecasting[J]. Meteor Mon, 47(3): 274-289.
|
Belmahdi B, el Bouardi A, 2024. Short-term solar radiation forecasting using machine learning models under different sky conditions: evaluations and comparisons[J]. Environ Sci Pollut Res, 31(1): 966-981.
|
Breiman L, 2001. Random forests[J]. Mach Learn, 45(1): 5-32.
|
Delannoy L, Longaretti P Y, Murphy D J, et al, 2021. Peak oil and the low-carbon energy transition: a net-energy perspective[J]. Appl Energ, 304: 117843.
|
Haupt S E, Kosovic B, 2017. Variable generation power forecasting as a big data problem[J]. IEEE Trans Sustain Energ, 8(2): 725-732.
|
Tibshirani R, 2011. Regression shrinkage and selection via the LASSO: a retrospective[J]. J Roy Stat Soc Ser B: Stat Methodol, 73(3): 273-282.
|
Zhang Y H, Ge T T, Tian W, et al, 2019. Debris flow susceptibility mapping using machine-learning techniques in Shigatse Area, China[J]. Remote Sens, 11(23): 2801.
|