从数据整合谈公共信息平台的建设思路与前景
外平台汇集了来自于内平台的电网监控运行数据以及外网的所有管理类数据。在面向生产管理系统,提供完整的调度生产数据服务的同时,面向不同层次的终端用户,包括管理人员及各层领导,为其提供数据的查询、分析功能;外平台力求数据的“全面”以及服务的“
1、数据抽取、沉淀和数据仓库
外平台对外部数据的采集、抽取与整合、沉淀,是以III、IV区各应用系统或数据存储介质为数据源,通过数据采集、抽取及加工等一系列功能模块,并根据数据源的颗粒度大小、与数据平台其他数据关联情况、外部应用对相关数据的要求等,在抽取与沉淀任务之后继续添加合理的后续处理任务项,使抽取沉淀得到的结果数据能得到进一步提炼、扩展、综合,形成数据仓库,更好地满足外部应用对数据的使用需求,为进一步的数据挖掘、决策支持创造条件。
2、数据的展示、查询和分析
通过提供丰富的综合数据表现,对数据平台中的数据进行多种角度地分析和展示,实现对调度生产运行数据的多角度多层面的可视化服务,帮助用户全面清晰地了解整个电网的生产运行状态、变化发展趋势以及潜在问题。包括面向对象的多种交互式数据表现、综合查询与统计分析、数据自助服务、综合报表、数据校验与告警、权限控制机制、数据上报、数据维护等。
2.3 公共信息平台的基本要求
2.3.1 IEC 61970标准
公共信息平台需要与各个应用系统进行交互,并通过接口获取和提供数据,因此,接口的开放性尤其重要。IEC 61970标准系列是应用层标准,是公共信息平台进行数据整合的基础和关键技术。虽然,IEC 61970仅仅是用于规范接口的“外”标准,但从减少数据模式转换的角度,从内到外都遵循CIM和CIS无疑是公共信息平台的目标[2][3]。
2.3.2新技术的应用
公共信息平台是一项技术密集的综合性项目,需要依托计算机、通信、数据挖掘、人工智能等领域的新技术和新思想,如分布式对象CORBA技术、多代理技术、SVG、软件开发规范化的思想、数据仓库、数据挖掘等。合理采用这些技术,以满足系统在开放性、安全性、可靠性等方面的要求。
2.3.3 统一编码原则
由于历史的原因,调度中心内部的各应用系统缺乏统一设计,特别是缺少对电网运行设备的标准编码管理,故各应用对此类设备的编码标准各不相同,而采用标准的设备编码管理体系是建立数据平台的前提。公共信息平台中的数据应该是消除了冗余和不一致,并采用标准和统一的表达形式。在数据整合中需要建立统一的数据字典,以规范各种信息的存储结构、数据类型以及表现形式。此标准的制定需要对原有各应用系统充分调研和分析,并结合调度中心相关规定以及使用惯例来确定。
公共信息平台的数据字典和各个应用系统数据字典之间存在一个映射关系,该映射关系可建立在公共信息平台中,成为整个数据仓库元数据的一个重要组成部分。映射关系实际是特定应用系统中的数据和公共信息平台中相同数据的各个属性之间的转换规则,是数据整合的重要基础。
3.公共信息平台的设计思路
调度数据平台的建设目前主要有三种思路。
1)无实体方式——数据代理方式
该方法中公共信息平台实质上是数据代理,本身没有数据实体,仅提供一套获取公共数据信息的数据接口,应用系统可以通过该接口采用标准或非标准化的调度数据平台获取数据,而这些数据是由位于公共信息平台的数据代理从相应的系统中获得。
该方法特点是采用简单的接口集成,建设资金投入较低,见效较快;但是,由于采用数据代理方式,需要交换的数据实际上存储在各个应用系统,信息交换时势必会对各个应用系统有干扰,会对应用系统稳定运行造成隐患,并增大应用系统的运行负担;另外,由于没有数据的存储实体,对各个应用系统的数据整合无从谈起。同时,随着调度中心内部应用系统的增加以及接口需求的不断增加,需要厂商不断地修改和增加接口,维护工作量巨大,无法满足应用系统间公共信息交换的需求。
2)实体方式
保留调度中心内各应用系统的独立性,在分析调度