新一代智能变电站变电设备状态评估大数据分析应用展望
3 新一代智能变电站变电设备状态监测大数据预处理
随着新一代智能变电站自动化和一体化的发展,设备状态监测数据的呈现多了许多特点:数据海量化,数据规模增长迅速,呈几何倍数扩大;数据多元化,数据来源广泛,不仅包括各种实时在线监测数据,还包括设备台账信息、带电检测、试验数据、故障数据等离线信息;数据结构和种类更加丰富,包括各类结构化、半结构化数据以及非结构化的数据,且各类数据查询与处理的频度以及对性能的要求也各不相同;数据在不同平台间互通变得困难,交互性较差 [15]。
目前,众多专家学者在融合变电设备状态监测数据多源异构问题方面进行了有益的探索。针对输变电设备全景信息多源、异构特性不利于数据的高效整合和深度挖掘利用的问题,文献[16]提出一种基于改进混合本体的多源异构数据聚合方法(见图4),通过构建数据源的局部本体以及全局本体,利用本体的语义特性解决数据聚合中关键性的语义异构问题;采用网络本体语言和语义网络规则语言相结合的方式建立全局本体和局部本体之间的映射,实现映射的重用和共享[16]。
图4 输变电设备全景信息的多源异构数据聚合方法
Fig.4 Heterogeneous data transmission equipment panoramic information aggregation method
目前,电网业务系统种类多、数据量大,为了有效整合数据资源,建立多源异构融合型的电网大数据库,文献[17]对数据获取、数据预处理、数据清洗、数据质量评价、数据转换等模块进行了设计,研究开发了面向多源电网业务系统的数据获取及转换装置,其面向多源异构电网大数据的获取与转换架构及实现方法在多个典型电网业务中进行了验证。为了减少继电保护信息系统数据上传和数据处理的规模,文献[18]提出了一种继电保护状态评估数据精简的思路,构建精简数据指标集对继电保护系统状态的特征进行表征,并提出利用该精简指标数据对继电保护进行在线状态评价的方法。
对于新一代智能变电站变电设备状态监测大数据的清洗工作,文献[19]将设备状态信息等效成各状态量的时间序列,通过对时间序列中的异常数据进行分类并分析不同类别异常值对时间序列模型的影响,提出了一种基于时间序列分析的双循环迭代检验法。文献[20]则提出一种基于时间序列分析和无监督学习等大数据分析技术的异常检测方法,从数据演化过程、数据关联的全新角度实现异常检测。
4 智能变电站变电设备状态监测与评估大数据应用展望
4.1 智能变电站变电设备异常知识库的建立
4.1.1 智能变电站变电设备关键特征状态参量的提取
新一代智能变电站变电设备状态种类多而繁杂,如何在其中甄选出最能反映设备状态的数据是非常关键的工作。通过收集新一代智能变电站变电设备状态数据,可以建立基本的大数据挖掘设备状态数据库。通过一定的预处理方式,可以按时间序列将设备状态与多而繁杂的各基础状态参量进行向量化,之后通过一定的相关关系计算便可得到最能体现新一代智能变电站变电设备状态的关键特征状态参量。例如,可通过计算状态监测参量和设备状态间的欧氏距离来对相关程度进行度量。
对于任意2个长度为d的向量xi=(xi1, xi2,…, xid)及xj=(xj1, xj2,…, xjd),其欧几里得距离为:
欧氏距离越小,代表状态监测参量与设备状态的相关程度越高。通过设定一定的关键特征状态参量最大提取距离值作为提取标准,即可建立设备关键特征状态参量体系。
4.1.2 智能变电站变电设备缺陷数据分析
文献[21]中采用相关分析探索了缺陷类型之间、缺陷类型与投运年限之间的关系,可以增进对缺陷发生原因的理解。缺陷主题河如图5所示。
图5 缺陷主题河
Fig.5 Defect theme river
在图5中,正相关关系用蓝色表示,负相关关系用粉色表示,颜色越深代表相关性越强,通过对缺陷的相关性分析,可得到一系列有益的结果。
4.2 应用大数据技术的新一代智能变电站变电设备状态评估
国家电网公司于2010年颁布了一系列关于变电设备状态评价的企业标准[22]。截至目前,包括国家电网公司内的国内电网公司对变电设备状态评估主要采用专家打分的方法。专家打分制的优势在于结构简单、便于执行,但其对各状态量扣分权重的确定由于掺入较多的专家经验和主观因素,导致难以客观反映该状态量的实际影响的大小。
文献[23]认为,基于设备缺陷/故障记录统计情况,考虑到设备缺陷/故障的影响程度及其后果的严重性,以及状态参量能够表征设备缺陷/故障类型的程度,并根据历史监测与评估数据,考虑所用监测手段所获取状态监测量的准确及有效程度,结合大数据挖掘技术,可以较为准确地设定设备状态参量的权重。文献[24]则利用挖掘到的设备状态参量和故障的关联规则知识,计算单项状态参量的常权重系数;同时提出具备均衡函数的变权综合模式,以此为基础,综合各单项状态参量的常权重系数计算设备综合状态量的变权重系数。
在充分收集大量状态监测评估案例后,在大量状态信息分析的基础上,基于历史评估数据与事后验证数据,可利用多元回归分析和大数据分析技术手段,研究建立反映电力设备状态变化、缺陷和故障发展过程的趋势分析模型,实现对主要故障模式的诊断和危急度评估。
5 结语
在新一代智能变电站快速发展的背景下,本文以新一代智能变电站变电设备状态为研究对象,深入研究了大数据挖掘技术在变电设备状态监测和评估领域中的应用前景。针对新一代智能变电站变电设备,提出了数据监测源体系和手段,并分析了适用于新一代智能变电站变电设备状态监测与评估的大数据预处理方法,最后从建立设备异常知识库和状态评估2个方面展望了大数据技术在新一代智能变电站变电设备状态监测与评估工作中的应用前景,具体应用方面的相关研究将是本文后续工作的重点。
作者简介:
陈翔宇(1991-),男,北京人,硕士,从事电力系统一次设计、电网大数据挖掘分析工作;罗怿(1987-),男,四川成都人,博士后,从事电网大数据平台以及数据挖掘算法研究工作;
胡军(1976-),男,浙江宁波人,博士,副教授,从事输变电技术、电力大数据挖掘等方面的研究工作;
傅守强(1986-),男,辽宁喀左人,硕士,从事柔性直流输电研究工作;
徐毅(1983-),男,山西太原人,博士,从事变电设计工作;
张立斌(1981-),男,河北廊坊人,高级工程师,从事变电设计管理、电气一次设计工作;
李红建(1972-),男,河南孟州人,高级工程师,从事电力设计工作;
段炼(1989-),男,上海人,博士研究生,从事输变电技术、接地计算和电网大数据方面的研究。
责任编辑:电朵云