第43卷 第3期2023年5月西安科技大学学报
JOURNALOFXI’ANUNIVERSITYOFSCIENCEANDTECHNOLOGY
Vol.43 No 3May2023
王清亮,代一凡,王旭东,等.基于ICEEMDAN LSTM BNN的短期光伏发电功率概率预测[J].西安科技大学学报,2023,43(3):593-602.
正则化参数的自适应估计WANGQingliang,DAIYifan,WANGXudong,etal.Probabilisticpredictionofshort termphotovoltaicpowerbasedonICEEMDAN LSTM BNN[J].JournalofXi’anUniversityofScienceandTechnology,2023,43(3):593-602.
收稿日期:2022-12-25
基金项目:国家自然科学基金项目(51804250);陕西省科技计划项目(2021JQ-572)通信作者:王清亮,女,山西永济人,博士,教授,E mail:738423403@qq.com
基于ICEEMDAN LSTM BNN的短期光伏
发电功率概率预测
王清亮,代一凡,王旭东,郝 帅
(西安科技大学电气与控制工程学院,陕西西安710054)
摘 要:针对短期光伏发电功率建立精准概率预测模型是提高电网安全稳定运行的重要手段。为了提高非晴空条件下光伏发电功率预测的精度和稳定性,选用具有优良正则化特性的贝叶斯神经网络模型作为基础算法。首先通过改进自适应噪声完备集合经验模态分解方法对多尺度多模态变化气象数据进行平稳化处理,简化映射关系建立步骤;其次引入长短期记忆神经网络来增强模型对光伏发电功率随机波动性和时序性的有效捕捉;进而结合各项算法提出基于ICEEMDAN LSTM BNN的短期光伏发电功率概率预测方法;最后以宁夏太阳山光伏电站实测数据为测试对象,对非晴空条件下的光伏发电功率进行预测,所提模型较之传统算法在非晴空条件下点预测和概率预测效果均显著改善,充分验证所提方法的有效性和可靠性。关键词:短期光伏发电功率;概率预测;非晴空;贝叶斯神经网络;长短期记忆神经网络中图分类号:TM615            文献标志码:A 文章编号:1672-9315(2023)03-0593-10DOI:10.13800/j.cnki.xakjdxxb.2023.0317
开放科学(资源服务)标识码(OSID):
Probabilisticpredictionofshort termphotovoltaic
powerbasedonICEEMDAN LSTM BNN
WANGQingliang,DAIYifan,WANGXudong,HAOShuai
(CollegeofElectricalandControlEngineering,Xi’anUniversityofScienceandTechnology,Xi’an710054,China)
Abstract:Toestablishaaccurateprobabilisticpredictionmodelforshort termphotovoltaicpowergen erationisanimportantmeanstoensureasafeandstableoperationofpowergrid.Inordertoimprovetheaccuracyandstabilityofphotovoltaicpowerpredictionundernon clearskyconditions,theBayesianneural
networkmodelwithexcellentregularizationcharacteristicsisselectedasthebasicalgorithminthispaper.Firstly,anImprovedCompleteEnsembleEMDwithAdaptiveNoisewasusedtoprocessthemeteorologicaldatawiththemulti scaleandmulti modeandsimplifythestepsofestablishingamap pingrelationship.Secondly,longandshorttermmemoryneuralnetworkwasintroducedtoenhancethemodeltocapturetherandomfluctuationandtimingofphotovoltaicpowereffectively.Combinedwithva riousalgorithms,anICEEMDAN LSTM BNNprobabilisticpowerpredictionmethodforshort termpho tovoltaicpowergenerationisproposed.Finally,themeasureddatawasexaminedofSolarMountainPho
tovoltaicPowerStationinNingxia,predictingthephotovolaicpowergenerationundernonclearskycon d
itions,andacomparisonwasmadewiththeresultsfromthetraditionalalgorithm.Itisfoundthattheproposedmodelcansignificantlyimprovethepointpredictionandprobabilitypredictioneffectundertheconditionofnon clearsky,whichindicatestheeffectivenessandreliabilityoftheproposedmethod.Keywords:short termphotovoltaicpowergeneration;probabilityprediction;non clearsky;bayesianneuralnetwork;long short termmemoryneuralnetwork
0 引 言
在大规模光伏并网的电力系统中,短期光伏发电功率的随机波动性是影响电力系统电源规划和安全调度的主要因素之一[1-4],通过对其进行概率预测可量化反映光伏功率的不确定性,能有效缓解弃光现象,减少由于备用容量不足而引发的电力系统安全事故。短期光伏发电功率概率预测按照采用模型的不同可分为物理建模法、统计分析法、人工智能法等[5]。物理建模法根据气象信息间接预测光伏发电功率,需要大量测量设备、建模复杂。统计分析法是从历史数据中挖掘光伏发电功率潜在变化规律,具有对测量设备要求不高的优点,但是其对数据质量要求较高,难以准确描述统计数据中蕴含的非线性
关系,非晴空条件下光伏发电功率预测精度不高。人工智能法处理非线性映射问题的能力强,能够描述光伏功率与各变量间复杂的映射关系,可用于挖掘非晴空条件下数据的非线性特征,因此,以神经网络为代表的人工智能方法在光伏功率概率预测领域得到广泛应用[6-8],但由于神经网络的模型复杂易产生过拟合现象,导致模型泛化能力不强,在非晴空条件下的预测精度不稳定,基于贝叶斯神经网络(Bayes ianNeuralNetwork,BNN)的人工智能方法是解决该问题的有效途径。BNN与传统采用固定权值的神经网络不同,它将概率思想与人工智能法相结合,利用贝叶斯方法将神经网络权值改变为服从后验概率分布的随机数,在保证较强非线性映射能力的同时,通过正则化方法降低模型过拟合风险,提高模型的泛化能力,在风电功率、电力负荷预测领域取得较好的预测精度[9-10],同样被广泛应用于光伏发电功率预测领域[11]。但在气象条件短时间内变化较快的非晴空条件下尤其是雨天时,其光伏发电功率预测结果波动大,预测精度极不平稳,导致平均误差在7.3%~12.7%之间波动[12-13]。
上述研究表明BNN可用于短期光伏发电功率概率预测,但该模型是通过降低模型复杂度来减小预测误差,其实质是损失部分非线性映射能力来加强学习能力,气象特征的强波动性和无序性严重影响模型输入输出映射关系的建立,因而并没有从根本上解决非晴空条件下预测精度和稳定性不高的问题[14]。针对上述提及BNN存在的一系列问题,决定首先从改善预测数据质量的角度切入,提升模型综合性能。此外,光伏发电功率预测模型的输入数据包括天气数据和光伏功率的历史运行数据,这两类数
据的特性差异较大。天气数据的特点主要表现为在同一时间断面上的快速波动和多模态变化,而光伏功率历史运行数据则具备极强的时序特性[15]。BNN虽有较强的非线性映射能力但对不同特性数据的敏感度差异较大,反映数据时序性的能力不强。鉴于上述提及的两类问题以及解决方案,首先采用改进自适应噪声完备集合经验(ImprovedCompleteEnsembleEMDwithAdaptiveNoise,ICEEMDAN)分解法对非晴空的气象数据进行平稳化处理,从而降低BNN模型的复杂度,简化映射模型建立的过程,从输入数据入手提高BNN的泛化能力;其次,通过引入长短期记忆(Long Short TermMemory,LSTM)神经网络增强BNN模型对时间粒度的敏感性,加强预测模型对光伏功率时序特征的提取能力,更好地获取到光伏功率历史运行数据所蕴含的时序特性。
综上,提出一种基于ICEEMDAN LSTM BNN的短期光伏发电功率预测方法,能提高非晴空条件下短期光伏发电功率概率预测的精度和稳定性,点预测值平均误差仅为4.71%~8.59%;同时针对概率预测结果进行分析,以80%~90%置信水平为例,所提模型较之BNN算法,在多云和雨天情况下,其区间预测平均误差仅为5.66%~7 27%。仿真结果充分验证所提模型在非晴空条件下的良好性能和可靠性。
1 BNN预测模型
BNN是反向传播神经网络模型与概率模型的
5         西安科技大学学报        2023年第43卷 
第3期王清亮,等:基于ICEEMDAN LSTM BNN的短期光伏发电功率概率预测结合,它通过正则化算法自动调节网络权、阀值的大小及规模,把影响较小的输入量的权值降得很低,在降低模型过拟合的同时也保证模型具有一定的泛化能力,
BNN的权值是一个随机变量,对于回归问题,通常假设其服从正态分布[16],由给定的
光伏数据来调整权值的后验概率分布,使其达到概率最大化,并将求出的均值作为网络权值,其结构如图1所示。
图1 BNN结构Fig.1 BNNstructurediagram
图1中,X=[x1,x2,…,xn
]为输入向量;Y=[y1,y2,…,yn]为输出向量;S={s1,s2,…,sn}为隐藏层向量;ωi为输入层与隐藏层之间的层间权重;ωj为输出层与隐藏层之间的层间权重。
则B
NN模型可视为条件分布模型P(Y|X,ω
)。利用BNN进行光伏功率预测时首先设置权重参数ω为正态分布N(μ,σ2
),通过历史光伏功率数据集对模型进行训练时,需要调整的值为ω的期望μ和方差σ2
为了提高模型的泛化性能,BNN在常规神经网络误差函数的基础上,利用正则化系数增加网络权及阀值的均方差对误差的影响,即
E=βEd+αEav
(1)
式中 E为改进后的误差函数;α,β为正则化系数;Eav为网络所有权值平方和的平均值;Ed为常规神经网络的误差函数。
采用贝叶斯方法在网络训练过程中自适应地
调节正则化参数的大小,并使其达到最优[17]
BNN虽然具有良好的非线性映射能力和一定的泛化性能,但挖掘预测数据的时序能力不强,还需要通过提高学习能力来实现。
2 光伏功率时序特性挖掘
为了增强BNN的时序学习性能,将LSTM神经网络引入到模型中,来捕捉非晴空条件下短期光伏发电功率的时序规律,以进一步提高BNN的预测效果。
传统的神经网络欠缺对光伏发电功率随时间变化这一特性的考量,仅仅关注当前时刻的信息处理。然而
光伏发电功率在时间上存在一定的关系,因此传统的神经网络会弱化光伏发电功率预测效果。LSTM神经网络与传统神经网络结构有所不同,其拥有的特殊记忆单元可以将上一时刻
的信息应用于当前时刻的信息处理,可以进一步挖掘光伏发电功率随时间变化的本质特征,适合处理和预测时间序列中间隔和延迟较长的问题,
得到广泛应用[18-19]
目前门控循环单元(GatedRecurrentUnit,GRU)与Transformer类算法也常用于处理时间序列问题。G
RU较之LSTM的改进初衷是减少参数,加快收敛过程,提高训练效率,虽然在一定程度上简化了模型结果,但是GRU不能像LSTM那样有效地控制数据流,序列过长时存在梯度消失
和梯度爆炸问题[20]。同时在应对数据集较大的情况下,LSTM的性能还是优于GRU[21]。
Transformer类算法为避免过拟合需要大量数据来进行自身的训练,在中期和长期预测任务
上都有不错的性能表现。但该类模型过度依赖寻时序数据的周期特性,不适合对周期性较弱的数据集训练;亦不适合执行短期训练任务。
LSTM神经网络是将循环神经网络的隐含层神经元替换成记忆单元,通过门结构来选择记住或者遗忘信息,
3种调节信息流的门结构分别为遗忘门、输入门和输出门[22]
,LSTM神经网络结构如
图2所示。
图2中,Ct为当前单元状态;ht
为当前隐藏层状态;ht-1为上一隐藏层状态;Ct-1为上一单元状态;at为当前输入量;ft为遗忘门;it为输入门;ot为输出门;Lt为添加到当前单元状态的Ct候选值;δ为sigmoid函数;g为tanh激励函数; 为逐点相乘; 为逐点相加。
遗忘门决定对前一个阶段状态信息的遗忘程度。
ft=δ(Wfaat+Wfhht-1+WfcCt-1+bf
)(2)5
95     
图2 LSTM神经网络结构
Fig.2 StructureofLSTMneuralnetwork
输入门的作用是往当前的状态中添加新信息。it=δ(Wiaat+Wihht-1+WicCt-1+bi
)(3)Lt=g(Wcaat+Wchht-1+bc
)(4)Ct=Ct-1ft+Ltit
(5)
式中 Wia,Wfa,Wca为连接输入信息at的权值矩阵;Wic,Wfc为连接神经元激活函数输出值Ct和门函数的对角矩阵;Wih,Wfh,Wch为连接隐含层输出信号ht的权值矩阵;bi,bf,bc为输入门、遗忘门、候选值Lt对应的偏置。Ct-1ft为确定有多少信息将从Ct-1中遗忘;Ltit为确定有多少信息添加到新单元状态Ct
。通过输出门sigmoid层的信息与通过tanh层的记忆细胞中的信息相乘得到模型最后的输出。
3 气象数据的模态分解
将模态分解思想引入BNN,通过对气象数据进行模态分解,从而降低预测对模型复杂度的高需求,以解决非晴空条件下气象数据的多尺度多模态短期变化对预测模型的影响。
ICEEMDAN模态分解法[
23]
作为一种自适应性时频分析法,通过在分解过程中添加高斯白噪声,较之传统的经验模态分解法和集成经验模态分解
法能够更有效地解决模态混叠问题[
24-25]
。文中采用的气象数据包括太阳总辐射强度、组件温度、环境温度、气压、相对湿度。其中太阳总辐射强度定义为太阳的辐射经过地球大气层的反射、吸收、散射等光学作用后,最终到达地球表面上单位面积时间内的太阳辐射能量;组件温度定义为光伏电池板周围的地表温度;环境温度指光伏电站所处的外界环境温度;气压指大气压强;相对湿度是用来描述空气湿润程度的物理量。
气象数据经I
CEEMDAN分解后可突出气象序列在不同时间尺度下的局部特性,反映出原始气
象序列的波动性、周期性和趋势变化,算法分解步骤如下。
1)构造M个含可控噪声的信号。
Z(m)1=z+q1Q1
(v(m)
,(m=1,2,…,M)(6)式中 z为原始信号;v
(m)
为第m个0均值单位方差的高斯白噪声;q1为第1次分解时信号的期望
信噪比,其值为q1=ε1 (z)/ (Q1(v(m)
));Q1
(·)为计算信号的第1个IMF的算子;ε1为设定的白噪声幅值;
(·)为计算数学期望的算子。2)计算各个Z(m)
与其第1个IMF的差并求平均,得到第1次分解的残差r1
。r1=〈Z(m)1-Q1
(Z(m)
1)〉(7)
式中 〈·〉为计算M个信号平均的算子。
3)对于k≥2时,构造第k组M个含可控噪声的信号。
Z(m)k=rk-1+qkQk
(v(m)
),(m=1,2,…,M)(8)式中 qk为第k次分解时信号的期望信噪比,其值为qk=εk (rk-1);Qk(·)为生成第k个IMF的算子。
4)计算各个Z(m)
与其第1个IMF的差并求平均,得到第k次分解的残差rk
。rk=〈Z(m)k-Q1
(Z(m)
k)〉(9)
5)令k=k+1,返回步骤(3)计算下一k值,直至残差满足迭代终止条件。
4 ICEEMDAN LSTM BNN预测模型
基于上述对BNN泛化和学习能力的增强思路,形成基于ICEEMDAN LSTM BNN的短期光伏发电功率概率预测方法。采用ICEEMDAN对气象数据进行自适应抗噪声模态分解,LSTM神经网络对光伏功率数据的时序规律进行挖掘,以达到提升BNN模型对非晴空条件下短期光伏发电功率的概率预测效果,ICEEMDAN LSTM BNN结构如图3所示。
图3中,输入特征量分别为气象数据和光伏功率数据。气象数据由ICEEMDAN模态分解法进行平稳化处理,光伏功率数据经LSTM神经网络处理后时序特性更加显著,然后将两类特征量作为BNN模型的输入。所提模型输入与输出的具体表示可参见表1
;此外,模型的各层结构见表2。695         西安科技大学学报        2023年第43卷 
第3期王清亮,等:基于ICEEMDAN LSTM BNN的短期光伏发电功率概率预测
图3 ICEEMDAN LSTM BNN算法的结构Fig.3 StructureofICEEMDAN LSTM BNNalgorithm表1 ICEEMDAN LSTM BNN输入量与输出量Table1 ImprovedBNNinputandoutputimproved
BNNinputandoutput
输入量/输出量变量名称
I′f1~I′fn待预测日的n个太阳总辐射强度数据
T′z1~T′zn待预测日的n个组件温度数据T′h1~T′hn待预测日的n个环境温度数据A′1~A′n待预测日的n个气压数据H′1~H′n待预测日的n个相对湿度数据P′1~P′n
待预测日的n个光伏功率数据
表2 ICEEMDAN LSTM BNN网络各层规模Table2 ScalesofalllayersoftheBNNnetwork
层数
维数输入层1(n×96)×5LSTM隐藏层6[32,32,32,32,32,32]BNN输入层11(n×96)×∑i
1≤i≤5
li
(i∈z)BNN输入层21(n×96)×5
BNN概率层132输出层
(n×96)×1
  表2中n为训练集天数;li为第i个输入特征的分解分量个数,BNN输入层1的输入是分解后的各气象特征分量,BNN输入层2的输入是LSTM神经网络的输出结果。
文中将天气类型划分为晴天、多云、雨天,其中多云和雨天属于非晴空天气。利用ICEEMDAN LSTM BNN进行短期光伏发电功率概率预测时,首先对光伏发电原始数据进行归一化处理,然后采用k
-means聚类方法对历史功率样本进行不同类型天气的相似日筛选[26]
文中以一定置信水平下光伏发电功率的波动
区间做为BNN的输出。训练好的BNN模型其权
值具有最优的期望μi和方差σ2i,根据σ2
i可以计
算短期光伏发电功率预测区间。
在给定的置信水平(1-β)下,BNN的光伏发电功率的预测区间可以表示为
[Ta,Tb]=yi+σizβ/2槡/N,yi-σizβ/2槡[]/N(10)
式中 Ta为预测区间上界;Tb为预测区间下界;
zβ
/2为正态分布的双侧分位点。5 实验分析
为了验证文中方法的预测效果,采用总装机容量为100MW的宁夏太阳山光伏电站2020年实际运行数据进行实验,原始数据包括历史光伏发电功率数据及气象数据:太阳总辐射强度、组件温度、环境温度、气压、相对湿度,数据时间分辨率为15min,每天总计96个样本点。将5×96维的气象数据作为输入变量,输出变量为1×96维的光伏发电功率数据。
采用聚类方法作为定量评价相似气象日期的依据,以太阳总辐照强度、环境温度和组件温度这3个与光
伏发电功率呈强相关性的特征作为聚类方法输入,进而根据k-means聚类方法对历史功率样本进行划分,对比不同类型实际曲线的差异,以此来判断每一类天气的情况归属从而进行相似日的筛选。将原始92天数据划分为晴天、多云、雨天3个子样本集,再将每个子样本集划分为训练集和测试集2个部分:相似日的历史气象及光伏发电功率数据作为训练集,待测日气象及光伏发电功率数据作为测试集,对待测日00:00~24:00时段进行提前24h光伏功率概率预测。5.1 预测效果量化指标
光伏发电功率概率预测是在点预测的基础上进行,为方便定量分析和评价文中方法的预测效果,引入均方根误差(RootMeanSquareError,
RMSE)、R2
(R-squared)、预测区间平均宽度(Pre
dictionIntervalNormalizedAverageWidth,PINAW)、预测区间覆盖率(PredictionIntervalCoverageProb ability,PICP)以及区间综合评价指标WC共5个评价指标对实验结果进行量化分析。
采用RMSE、R2
对短期光伏发电功率点预测结
果进行分析,其中R
MSE表征预测值同实际值之间7
95     

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。