赵杰辉,葛少云,刘自发
(天津大学电气与自动化工程学院,天津300072)
APPLICATIONOFRADIALBASICFUNCTIONNETWORKbaseDONPRINCIPALCOMPONENTANALYSISINLOADFORECASTING
ZHAOJie-hui,GEShao-yun,LIUZi-fa
(SchoolofElectricalEngineeringandAutomation,TianjinUniversity,Tianjin300072,China)
ABSTRACT:Whenradialbasicfunction(RBF)isappliedtopowerloadforecasting,iftheinputspaceisheavilyself-correlatedandtheinputnumbersaretoomany,inthatcasetoomuchcentresoftheneuronswillbeoverlapped,finallytheaccuracyofloadforecastingbyRBFnetworkwillbedescendent.Tosolvethisproblemtheoriginalinputspaceisreconstructedbyprincipalcomponentanalysisandthestructureofthenetworkisdeterminedaccordingtothecontributionsfromtheprincipalcomponentsrespectively,thus,theabovementionedproblemiseffectivelysolved.Theeffectivenessoftheproposedalgorithmisverifiedbythepracticaldataofacertainprovincialpowernetwork.
KEYWORDS:Principalcomponentanalysis;Radialbasicfunction(RBF);Artificialneuralnetwork(ANN);Loadforecasting;Powersystem
径向基函数(RBF)神经网络应用于电力系统负荷预测时,如果输入空间严重自相关及网络维数较高时,RBF神经网络的预测精度会下降。针对这一问题,文中提出了一种应用于电力负荷预测的改进RBF神经网络新方法。具体是利用主成分分析(PCA)方法对原输入空间进行重构,并根据各主成分的贡献率来确定网络结构,从而有效地解决了预测精度下降的问题。最后通过某省的实际算例验证了该方法的有效性。
关键词:主成分分析;径向基函数;人工神经网络;负荷预测;电力系统
1引言
径向基函数网络(RadialbasedFunctionNetwork,RBFN)是20世纪90年代提出的一种具有全局收敛特性的线性学习算法的前馈网络。它学习速度快,广泛应用于数据的分类和时间序列的预测等方面[1]。但是,径向基函数(RBF)神经网络的基函数,仅在特定区域才能响应。这种局域性网络要求网络的神经元中心能够完全覆盖样本输入区域,并且只有保持适当重叠时,才能使每个神经元做出相应响应。实际的电力负荷受经济、政策、气象及社会等因素影响,而这些因素往往相关性比较强,直接运用RBF神经网络的预测结果难以令人满意。因为当网络维数较高时,通过控制神经元的分布以覆盖整个输入空间是比较困难的,即使在神经元能够覆盖整个输入空间的情况下,控制神经元之间的重叠程度也很困难。这就不可避免地会造成一定的误差。很多研究中构造了电力系统负荷预测的RBFN模型。这些模型很多是将待考虑的相关量及电量序列形成多维输入空间以训练网络,但当有多个相关量时,网络的高维数和各相关量之间的自相关性会使网络的内插性和外推性变差。国内外对这一问题已有很多研究,其基本思想多是根据一定的方法找出相关性较大的一些相关量来代替所有相关量的空间,舍弃相关性较小的相关量。这样在损失一些相关量信息的基础上,一定程度上克服了输入空间的自相关性,并降低了网络维数。
本文通过采用主成分分析(PrincipalComponentAnalysis,PCA)方法来分析输入空间的主成分的贡献率并以此来确定网络的输入空间,最终通过原输入空间各矢量的线性组合表示原输入空间。由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度。
2主成分分析
主成分,在代数上是p个随机变量X1、X2、…、Xp的线性组合,其几何意义是对原空间用新的坐标系重新表示。新坐标系的坐标轴代表数据变异性最大的方向,并提供一个对协方差结构较为简单但更为精炼的刻画。
(3)αi的取值使得Var(Yi)尽可能的大。
通过数学推导,随机样本主成分分析阐述如下:
设R为随机矢量X=(X1,X2,...,Xp)T的协方差矩阵。它具有特征值特征矢量对(λ1,e1),(λ2,e2),...(λp,ep),其中λ1>λ2>...>λp>0,则第i主成分为
所以,特征值λ1反映了与之相关的主成分所包含的新信息的比重,即样本在这一方向上的变异程度。所以当特征值接近于零时,与之相关的主成分已经不包含新的信息,引入其将会增大空间的自相关性。
本文中通过主成分的累计贡献率确定网络输入空间。第i主成分的累计贡献率定义为
若且当βs>α时,则Y1,Y2,...,YS称为样本X1,X2,...Xp的显著性水平为α的主成分。其中βs为第s个主成分累计贡献率。本文中以Y1,Y2,...,YS来代替样本X1,X2,...Xp进行网络训练,既降低了网络维数又消除了原样本空间的自相关性,提高了预测精度。
3RBF神经网络及学习算法
3.1RBF神经网络
RBF神经网络是应用多变量插值的径向基函数设计而成的神经网络[4,5]。已经证明,RBF神经网络可以在任意精度下逼近任意的非线性函数。它的典型结构是一3层的前向网络,如图1所示。常用的RBF神经网络方法阐述如下[4]:
中间层神经元实现对输入层特征提取的非线性变换。本文将中间层神经元的转换函数取为高斯泛函数,第个神经元的转换函数为
式中Xk,j为第K个样本经过第i个神经元的输出值;Pk为第K个样本矢量;Tj为第i个中间层神经元的中心;为控制神经元相互间重叠程度的参
[1][2]下一页