一种基于LSTM神经网络的短期用电负荷预测方法

2018-03-28 21:39:23 《电力信息与通信技术》微信公众号　点击量：评论 (0)

随着智能电网时代的发展,电力用户侧数据量呈指数增长,传统的负荷预测方法难以应付更大的数据量和更强的随机性。针对该问题,文章提出一种基于长短期记忆（Long Short-Term Memory,LSTM）神经网络的数据驱动的负荷预测方法,通过LSTM网络对时间序列建模能力强的特点,有效地减小负荷预测模型需

0 引言

当今社会中,随着传感器技术、实时监测与数据存储技术的飞速发展,电力数据量和复杂度也呈指数增长,这一现象在用户侧尤为突出。如何发掘用户侧海量数据的价值,对大量数据进行高效合理的应用成为当今智能电网时代下亟待解决的问题^[1]。

负荷预测基于电力负荷历史数据,旨在通过研究负荷数据自身的相关性及变化情况,社会条件以及其他自然情况（如温度）之间的内在联系,探索出负荷的发展规律,从而对未来某一时间段的负荷数据进行预测的方法。电力系统由电网和电力用户组成,电网的作用即为各类用户提供满足要求的电能,由于电能的不可储存性,如何合理地实现供电负荷分配,进而保证稳定性和经济性成为电网部门面临的重要问题。负荷预测在解决上述问题的过程中扮演了重要角色,英国的研究结果表明,短期负荷预测的误差每增加1%将导致每年运行成本增加约1 770万英镑。在挪威,每增加1%的短期负荷预测误差将导致455万~910万欧元的附加运行成本^[2];对于电网而言,准确地负荷预测可对发电厂的出力要求提出预告,合理地安排本网内各发电机组的启停,使系统始终运行在要求的安全范围内。

根据预测结果分类,负荷预测可分为短期负荷预测和中长期负荷预测。对于短期负荷预测,国内外研究方法主要可以概括为以下2类：一类是以时间序列法为代表的传统方法;另一类是以人工神经网络法为代表的新型人工智能方法。前者主要有时间序列法、多元线性回归法及傅立叶展开法等^[3],这些方法多以纯数学理论为根基,难以适应日新月异的电网发展和用户侧日益提高的需求而被逐渐淘汰。而在新型人工智能方法中,运用最为典型的是神经网络法。文献[2,4]运用了神经网络中最为普遍的BP神经网络,采用Levenberg-Marquardt算法进行训练,该方法预测效果受到BP网络结构简单、学习能力较差的限制,达不到很高的精度。随着研究的进展,单一的神经网络方法逐渐显露出了它的局限性,将神经网络与其他算法相结合的思想为越来越多的研究人员所采用。文献[5]提出了一种基于粒子群算法的神经网络方法进行短期负荷预测,通过粒子群算法优化网络初始值以及每个阶段网络的参数。除了代表性的神经网络算法以外,信息时代的发展也使得负荷预测的方法越来越多元化,文献[6]提出了基于小波聚类的方法对配变负荷进行预测研究;文献[7]采用了随机森林算法进行负荷预测。

短期负荷主要用于预测未来几天的负荷数据。而对于日负荷数据而言,具有很强的周期性,具体体现在以下几点^[3]：不同日的日负荷曲线其整体规律相似;同一星期类型日负荷规律相似;工作日、休息日负荷规律各自相似;不同年度法定节假日的规律相似。

针对日负荷数据周期性很强这一特点,本文提出了一种基于LSTM神经网络的负荷预测方法。LSTM神经网络是基于循环神经网络（Recurrent Neural Networks,RNN）改进的一种人工智能算法,对于处理时间序列相关的数据有很好的效果。而后以负荷数据自身为训练数据和输出标签,通过迭代训练的方法建立负荷预测模型,该方法可充分利用负荷数据之间的相关性,从而提高负荷预测的精度,同时降低所需历史数据的维度大小。最后通过实际数据进行仿真实验,并与传统的负荷预测方法进行对比,证明该方法具有更高的精确度和更快的收敛速度。

1 基于LSTM神经网络的模型建立

1.1 LSTM神经网络原理

LSTM神经网络最早由Hochreiter等提出^[8],并由Graves进行改进^[9],是基于RNN的一种完善,解决RNN 中易出现的梯度消亡问题。

RNN相比于与普通的神经网络,最大的区别就是各个隐藏层单元并不是相互独立的,各个隐藏层之间不仅相互联系,还与此隐藏层单元所接受时刻之前的时序输入有关,这个特性对于处理与时序相关的数据有极大的帮助。单个RNN隐藏层单元展开图如图1所示。

图1 单个RNN隐藏层单元展开图Fig.1 Unfolding of single RNN hidden layer unit

如图所示,U,V,W分别为输入到隐含层、隐含层到隐含层、隐含层到输出的权重,x为神经网络的输入,O为神经网络的输出,S为隐含层当前的时刻状态。在传统神经网络中,每一个网络层的参数是不共享的。而在RNN中,每输入一步,每一层都各自共享参数U,V,W。这反映出RNN中的每一步都在做相同的事情,只是输入不同,这样的训练方式大大降低了网络中需要学习的参数,在保证精度的前提下极大地缩短了训练时间。

但RNN存在这样一个问题^[8]：对于标准的RNN架构来说,在实践中可联系的“上下文”十分有限,较远时刻的“记忆”对于输出的影响要么衰减的很小,要么呈指数爆炸增长,这个问题通常被称为“梯度消亡问题”。

图2 LSTM单元结构Fig.2 Structure of LSTM unit

而LSTM则是一种用于解决梯度消亡现象的改进型RNN。LSTM单元结构^[9]如图2所示。1个LSTM单元中存在1个或多个细胞核（Cell）,用于描述LSTM单元的当前状态,图1中存在3个控制门,分别是Input Gate,Output Gate和Forget Gate,3个门的输出分别连接到1个乘法单元上,从而分别控制网络的输入、输出以及Cell单元的状态,处理完第一时刻输入O₁后,只要保持Input Gate处于关闭状态（相当于乘法系数是0）,Forget Gate处于打开状态（相当于乘法系数是1）,网络的输出就持续受到O₁的影响。

1.2 基于LSTM网络的负荷预测模型建立

1.2.1 输入数据的预处理

由于在数据采集过程中,存在人为操作不当、设备老化等情况的影响,造成坏数据的产生,极大地影响预测模型的准确度,因此在输入训练数据前需要对样本中的坏数据进行识别与处理。

本文基于负荷数据的周期性,假定短时间内数据横向相似,即不会有突变,采用横向比较法进行坏数据的识别处理^[10],利用样本统计指标与设定阈值判断是否有非正常数据,因传感器采样频率为每30 min一个点,故所采集的数据为n天48个单位的矩阵,处理具体步骤如下：

1）首先基于式（1）、（2）计算序列的均值与方差。

（2）

2）再通过式（3）进行3σ原理的非正常数判断,其中ε为阈值,通常取1~1.5。

（4）

其中为X_n,i附近2个横向负荷点, （5）

经过归一化之后变为矩阵：

这里为变量的极差,经过式（6）变换后,所得负荷数据值均在0~1之间,完成了归一化。

1.2.2 输入输出量的选择

在对输入数据进行预处理之后,如何选择合适的输入量及标签来使用神经网络进行训练,是建立负荷预测模型中最为关键的一步。

本文主要是预测未来某几天24 h的负荷值,图3为一年中随机抽取某2周的负荷数据随时间变化的曲线,横轴为时间,每24 h为一天,纵轴为负荷数据。

图3 某2周负荷数据随时间变化曲线Fig.3 Curves of load data variation with time in a given two week period

由3图对比可以看出,负荷数据按工作日和休息日每周呈周期性变化,周末时用电负荷与工作日相比有所下降,为了更好地利用这一特性,本文采用迭代预测的方式,如要预测12月28号的24 h负荷值,以11月1~7号的历史负荷数据作为输入,11月8号的历史负荷数据作为标签输出进行第一次训练,而后以11月2~8号的历史负荷数据作为输入,9号的历史负荷数据作为标签输出进行第二次训练,以此种方式进行迭代预测直到得到12月28号的负荷预测值,同时,本文将历史数据采用one-hot编码后再作为训练样本^[11],可更好地利用历史负荷数据的周期性规律。

在时间序列模型阶数的选择上,本文采用了如下方法^[11],电力负荷属于随机过程,在随机过程研究中,自相关系数能够显示随机过程是否平稳以及选择合适的模型阶数^[12],训练数据的自相关系数如图4所示,由图峰值可取阶数为7,即用前7天的历史负荷数据作为特征向量滚动预测。通过仅使用单维度数据建立模型的方法,证明该模型具有更强的适用性。

图4 训练数据的自相关系数Fig.4 Autocorrelation coefficients of training data