一种基于LSTM神经网络的短期用电负荷预测方法
0 引言
当今社会中,随着传感器技术、实时监测与数据存储技术的飞速发展,电力数据量和复杂度也呈指数增长,这一现象在用户侧尤为突出。如何发掘用户侧海量数据的价值,对大量数据进行高效合理的应用成为当今智能电网时代下亟待解决的问题[1]。
负荷预测基于电力负荷历史数据,旨在通过研究负荷数据自身的相关性及变化情况,社会条件以及其他自然情况(如温度)之间的内在联系,探索出负荷的发展规律,从而对未来某一时间段的负荷数据进行预测的方法。电力系统由电网和电力用户组成,电网的作用即为各类用户提供满足要求的电能,由于电能的不可储存性,如何合理地实现供电负荷分配,进而保证稳定性和经济性成为电网部门面临的重要问题。负荷预测在解决上述问题的过程中扮演了重要角色,英国的研究结果表明,短期负荷预测的误差每增加1%将导致每年运行成本增加约1 770万英镑。在挪威,每增加1%的短期负荷预测误差将导致455万~910万欧元的附加运行成本[2];对于电网而言,准确地负荷预测可对发电厂的出力要求提出预告,合理地安排本网内各发电机组的启停,使系统始终运行在要求的安全范围内。
根据预测结果分类,负荷预测可分为短期负荷预测和中长期负荷预测。对于短期负荷预测,国内外研究方法主要可以概括为以下2类:一类是以时间序列法为代表的传统方法;另一类是以人工神经网络法为代表的新型人工智能方法。前者主要有时间序列法、多元线性回归法及傅立叶展开法等[3],这些方法多以纯数学理论为根基,难以适应日新月异的电网发展和用户侧日益提高的需求而被逐渐淘汰。而在新型人工智能方法中,运用最为典型的是神经网络法。文献[2,4]运用了神经网络中最为普遍的BP神经网络,采用Levenberg-Marquardt算法进行训练,该方法预测效果受到BP网络结构简单、学习能力较差的限制,达不到很高的精度。随着研究的进展,单一的神经网络方法逐渐显露出了它的局限性,将神经网络与其他算法相结合的思想为越来越多的研究人员所采用。文献[5]提出了一种基于粒子群算法的神经网络方法进行短期负荷预测,通过粒子群算法优化网络初始值以及每个阶段网络的参数。除了代表性的神经网络算法以外,信息时代的发展也使得负荷预测的方法越来越多元化,文献[6]提出了基于小波聚类的方法对配变负荷进行预测研究;文献[7]采用了随机森林算法进行负荷预测。
短期负荷主要用于预测未来几天的负荷数据。而对于日负荷数据而言,具有很强的周期性,具体体现在以下几点[3]:不同日的日负荷曲线其整体规律相似;同一星期类型日负荷规律相似;工作日、休息日负荷规律各自相似;不同年度法定节假日的规律相似。
针对日负荷数据周期性很强这一特点,本文提出了一种基于LSTM神经网络的负荷预测方法。LSTM神经网络是基于循环神经网络(Recurrent Neural Networks,RNN)改进的一种人工智能算法,对于处理时间序列相关的数据有很好的效果。而后以负荷数据自身为训练数据和输出标签,通过迭代训练的方法建立负荷预测模型,该方法可充分利用负荷数据之间的相关性,从而提高负荷预测的精度,同时降低所需历史数据的维度大小。最后通过实际数据进行仿真实验,并与传统的负荷预测方法进行对比,证明该方法具有更高的精确度和更快的收敛速度。
1 基于LSTM神经网络的模型建立
1.1 LSTM神经网络原理
LSTM神经网络最早由Hochreiter等提出[8],并由Graves进行改进[9],是基于RNN的一种完善,解决RNN 中易出现的梯度消亡问题。
RNN相比于与普通的神经网络,最大的区别就是各个隐藏层单元并不是相互独立的,各个隐藏层之间不仅相互联系,还与此隐藏层单元所接受时刻之前的时序输入有关,这个特性对于处理与时序相关的数据有极大的帮助。单个RNN隐藏层单元展开图如
如图所示,U,V,W分别为输入到隐含层、隐含层到隐含层、隐含层到输出的权重,x为神经网络的输入,O为神经网络的输出,S为隐含层当前的时刻状态。在传统神经网络中,每一个网络层的参数是不共享的。而在RNN中,每输入一步,每一层都各自共享参数U,V,W。这反映出RNN中的每一步都在做相同的事情,只是输入不同,这样的训练方式大大降低了网络中需要学习的参数,在保证精度的前提下极大地缩短了训练时间。
但RNN存在这样一个问题[8]:对于标准的RNN架构来说,在实践中可联系的“上下文”十分有限,较远时刻的“记忆”对于输出的影响要么衰减的很小,要么呈指数爆炸增长,这个问题通常被称为“梯度消亡问题”。
而LSTM则是一种用于解决梯度消亡现象的改进型RNN。LSTM单元结构[9]如
1.2 基于LSTM网络的负荷预测模型建立
1.2.1 输入数据的预处理
由于在数据采集过程中,存在人为操作不当、设备老化等情况的影响,造成坏数据的产生,极大地影响预测模型的准确度,因此在输入训练数据前需要对样本中的坏数据进行识别与处理。
本文基于负荷数据的周期性,假定短时间内数据横向相似,即不会有突变,采用横向比较法进行坏数据的识别处理[10],利用样本统计指标与设定阈值判断是否有非正常数据,因传感器采样频率为每30 min一个点,故所采集的数据为n天48个单位的矩阵,处理具体步骤如下:
1)首先基于式(1)、(2)计算序列的均值与方差。
2)再通过式(3)进行3σ原理的非正常数判断,其中ε为阈值,通常取1~1.5。
其中 为Xn,i附近2个横向负荷点,
经过归一化之后变为矩阵:
这里 为变量的极差,经过式(6)变换后,所得负荷数据值均在0~1之间,完成了归一化。
1.2.2 输入输出量的选择
在对输入数据进行预处理之后,如何选择合适的输入量及标签来使用神经网络进行训练,是建立负荷预测模型中最为关键的一步。
本文主要是预测未来某几天24 h的负荷值,
由3图对比可以看出,负荷数据按工作日和休息日每周呈周期性变化,周末时用电负荷与工作日相比有所下降,为了更好地利用这一特性,本文采用迭代预测的方式,如要预测12月28号的24 h负荷值,以11月1~7号的历史负荷数据作为输入,11月8号的历史负荷数据作为标签输出进行第一次训练,而后以11月2~8号的历史负荷数据作为输入,9号的历史负荷数据作为标签输出进行第二次训练,以此种方式进行迭代预测直到得到12月28号的负荷预测值,同时,本文将历史数据采用one-hot编码后再作为训练样本[11],可更好地利用历史负荷数据的周期性规律。
在时间序列模型阶数的选择上,本文采用了如下方法[11],电力负荷属于随机过程,在随机过程研究中,自相关系数能够显示随机过程是否平稳以及选择合适的模型阶数[12],训练数据的自相关系数如
1.2.3 LSTM神经网络结构的确定
确定了输入输出量之后,下一步关键工作是确定一个合适的网络结构,网络结构中,最核心的步骤是先确定输入输出节点个数。
1)多模型单变量预测:使用24个不同的神经网络预测模型分别对应一天中的24 h,此种方法优点是单个网络结构较为小、参数易收敛;缺点是过程冗杂,同时单个网络易过拟合,多变量单模型示意如
2)单模型多变量预测:用24个输出节点代表一天的24 h,同时预测一天各小时的负荷数,在传统方法中若采用此种结构的网络,网络的结构将会极为复杂,会有上千个参数需要训练更新,极大地影响网络的运算速度和预测精度。单变量多模型示意如
本文采用多变量单模型方法构建网络,本文引言中有提到。由于LSTM网络权重共享方式上与传统神经网络的不同,当采用24个输出节点时,LSTM所需要学习的参数相比于传统神经网络大为减少,极
责任编辑:售电衡衡
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网
-
新基建助推 数据中心建设将迎爆发期
2020-06-16数据中心,能源互联网,电力新基建 -
泛在电力物联网建设下看电网企业数据变现之路
2019-11-12泛在电力物联网 -
泛在电力物联网建设典型实践案例
2019-10-15泛在电力物联网案例
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
能源革命和电改政策红利将长期助力储能行业发展
-
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网 -
5G新基建助力智能电网发展
2020-06-125G,智能电网,配电网 -
从智能电网到智能城市