基于神经网络算法的用户窃电行为检测模型研究

2018-03-21 13:13:32 电力信息与通信技术  点击量: 评论 (0)
为了检测存在窃电行为的用电用户,减少电力企业经济效益损失,文章采用湖州市真实用户用电数据,基于机器学习BP神经网络算法,构建低压用户与专变用户用电行为特征,建立窃电风险等级模型。模型采用6折交叉验证方法,平均AUC值达到0 85,验证集中窃电用户命中率达到0 75,比以往人为排查的方

0 引言

近些年,窃电行为屡禁不止,窃电手法也趋向智能化、隐蔽化。除了在供电设施上擅自接线用电,绕越用电计量装置用电,伪造或者开启加封的用电计量装置封印用电,故意损坏用电计量装置,还会使用倒表器、移相方式、有线远方控制和无线遥控等智能型窃电[1]。而反窃电工作仍然以人为经验为主,反窃电采用的方法包括逐相检查法、力矩法、钳形表法等,反窃电技术装备有待提高。被动式查证易疏漏,渗透率低;主动巡查命中率低,效率低下,反窃电技术亟待取得突破[2]

窃电检测和分析需要提高信息化程度,充分利用用电大数据[3],挖掘用户用电习惯,基于机器学习算法,结合鉴别经验规则,构建大数据反窃电模型,并逐步建立用户窃电行为检测和分析系统,分析窃电用户特征,准确识别高窃电嫌疑的用户[4-7],从而为电力企业提供智能化的分析策略,为反窃电管理的完善提供有效的技术支持[8-9]。进一步,维护正常的供用电秩序,保证用电安全,保障正常用电用户和电力企业的利益。

本文主要贡献在于利用用电数据和相关电力数据集,构建窃电风险等级模型,设计用户窃电行为检测系统。首先,介绍所采用的神经网络框架及模型构建方法;其次,介绍特征工程和数据预处理采用的方法;最后,在真实数据集上验证模型的有效性以及完善其可扩展性。

 1 神经网络

神经网络是深度学习的基础,作为经典的机器学习框架,已在诸多领域的大数据应用中取得了广泛应用[10]

1.1 神经元与多层网络

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,能够模拟生物神经系统的交互和学习过程。

元神经网络中的功能神经元,接收到来自其他神经元的输入信号xi(i=1,2,…n),通过带权重wi(i=1,2,…n)的连接进行传递,神经接收到的总输入值将与其阈值θ比较,然后通过“激活函数”(Sigmoid函数、logistic 函数等)处理以产生输出y。

权重和阈值可以通过学习得到。功能神经元模型如图1所示。

图1 功能神经元模型Fig.1 Functional neuron model

要解决非线性可分问题,需叠加单层感知器,常见的神经网络结构为“多层前馈神经网络”,包含输入层、输出层以及之间的一层或多层的隐藏层[11]

1.2 误差逆传播算法

误差逆传播(error Back Paopagation,BP)算法是训练神经网络的迭代学习算法,采用随机梯度下降进行参数寻优,其算法如下。

 

则网络在此样本上的均方误差为:

 

单隐藏层前馈神经网络结构示意如图2所示。

图2 单隐藏层前馈神经网络结构示意Fig.2 Single hidden layer feedforward neural network structure

 2 窃电风险等级模型

2.1 数据输入与特征提取

模型初始训练的数据集来自于湖州部分地区2016年第四季度的用户用电数据,采集于21 623个低压用户户号和17 779个专变用户户号,其中包含646个已查验确认的低压窃电用户。

根据窃电特点及其受窃电行为影响的计量指标,专变用户主要从瞬时电压、瞬时电流、三相不平衡、日用电量、月最大需量等方面提取模型特征,低压用户主要从日用电量、用电量变化、尖峰平谷时期用电量、所在台区线损、线损变化等方面提取模型基本特征,从而全面刻画用户用电模式和规律,及其对电网产生的影响[13]

主要特征和对输入数据的预处理如下:

1)用电量时间序列:一阶差分观测期内的电表读数,获取日用电总量和尖峰平谷各时间段用电量的时间序列数据。图3是该时间序列数据的可视化,绿色代表的是正常用户,红色代表窃电用户,可以看到窃电用户和正常用户用电时段的差异性。

2)平均电表读数:对观测期内用户电表读数统计值取均值,作为用电基数输入。

3)月最大需量:观测期内各月用户电量最大需量。另外,提取月最大需量与实际用电量差异值
特征。

4)所在台区线损:用户所在台区的线损率、台区用户数、台区用电量,反映所在台区线损程度和窃电用户分布的比例。

5)电压三相不平衡:根据IEEE Std 12-2004的定义,由三相相电压值VaVbVc及其均值Vpavg计算三相电压不平衡度[10]

 

数据清洗过程中,对超过20%用电量数据存在异常值的用户进行剔除。用均值填充剩余数据集中用电量缺失值,对于异常值点以临近处均值拟合。

根据均值µ和方差σ对特征值进行z-Score的标准化:

 

Sigmoid函数具备求导的很好的性质计算梯度,

图4Fig.4 ROC graph of MLP model " style="box-sizing: border-box; color: rgb(43, 43, 43); text-decoration-line: none;">图4 MLP模型ROC曲线Fig.4 ROC graph of MLP model

ROC空间将伪阳性率(False Positive Rate,FPR)定义为X轴,真阳性率(True Positive Rate,TPR)定义为Y轴,因此曲线距离左上角越近,证明分类器效果越好。同样,AUC(Area under the Curve of ROC)也用来对模型的效果进行评估,其值为ROC曲线所覆盖的区域面积,AUC越大,模型整体性能越好。该窃电用户检测模型平均AUC达到0.85,反映了其良好的分类效果和健壮性。

对模型的输出进行变换,按窃电嫌疑(用户被分类为窃电用户的可能性)划分窃电风险等级。窃电嫌疑值高于0.8的为高可疑用户,作为排查重点,0.6~0.8为中度可疑用户,0.6以下为低可疑用户,其中的高可疑用户是重点关注和排查的对象。

利用湖州部分地区2017年第二季度的来自
34 520个用户的真实用电数据,输入模型查询高嫌疑值的窃电用户。经过实际检查,模型返回的高可疑窃电用户命中率达到0.75,验证了检测模型的有效性。

通过现场操作人员的确认和分析,对未命中用户的误判异常指标记录,结合正向反馈的数据,对模型进行增量训练。

2.4 模型的应用

基于机器学习的算法和历史用电数据训练窃电风险等级模型,作为窃电用户识别系统的计算核心支撑,构成用户窃电行为检测系统的核心模块。用户窃电行为检测系统架构如图5所示。窃电用户识别系统提供Web查询界面给窃电排查人员,基于最新电力数据返回预测结果。人为排查和判定的反馈结果以及偷窃电指标,触发模型的增量训练和自学习过程,定时更新模型[15-17]

图5 用户窃电行为检测系统架构Fig.5 Electric filching detection system architecture

 3 展望

现阶段基于神经网络的用户窃电检测与分析,模型的分类能力和准确率、召回率均有待提高,下一步将加入随机森林、梯度提升树等算法模型模块,利用模型集成提升学习能力[18]。数据集的连续有效保障用户窃电等级模型的泛化能力和精准程度。数据仓库正在构建,数据存储和查找的效率需要进一步提高。对窃电用户的查处和标记需要增加各项指标的记录,如窃电起止时间、窃电方式、窃电量等,数据质量的提高将进一步促进模型的优化。

 4 结语

传统的反窃电技术工作量大、渗透率低,本文基于用户用电数据和相关电力数据提取特征指标,利用BP神经网络算法实现窃电风险等级监测模型,模型在湖州市真实数据实例验证上展现了高准确率和命中率,较以往随机排查、经验规则,以更高的科学性和实用性提升了反窃电技术的信息化和智
能化。

大云网官方微信售电那点事儿

责任编辑:售电衡衡

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞