介绍了数据仓库技术,并结合继电保护信息管理系统,论述了数据仓库技术在电力系统中的应用,针对电力系统提出了一整套设计思路。最后举出电网规划辅助决策系统的应用实例,阐述了数据挖掘的应用。关键词:继电保护;管理信息系统;数据仓库;方法库;数据挖掘;元数据 电力企业网建设规模日趋扩大,如何从海量的数据中快速准确地提取用于电力企业科学决策的信息,是一项有别于已建立的MIS等系统的重点工作。此类系统亦称之为业务智能化系统,它应满足:(1)对原来提出的任务或查询作出响应,并可以进行深层次的分析及探讨;(2)从所提及的较为简单或单一的问题中,得到更大范围的结果。上述是变化的电力市场动态环境所涉及的,为此所使用的信息化工具必须突破传统的简单的数据库表模式应用,建立更为贴近决策者思维过程的支持,代替决策者的复杂数据与信息的处理,及时提供正确决策所需全部信息。1数据仓库技术能够提供决策全过程集成的支持工具主要有:(1)数据仓库/数据集市。本质上讲,数据仓库完成将数据转换为信息,并及时提供给用户以实现决策支持的任务。从实际讲,数据仓库由可操作的外部数据源、一个或多个DB和数据分析工具组成。(2)智能化决策支持工具。涉及到多项应用的信息分析决策系统:收集与整理数据,并启动相关知识进程,自动引导用户交互信息,进行决策。通常智能化决策支持系统可分层调用,如取出联机事务处理(OLTP)数据进行数据仓库格式化处理,从而进行各类智能化分析,再进一步实施数据挖掘。数据挖掘(datamining)技术,又称为数据开采或数据库中的知识发现(KDD:knowLEDgediscoverindata)。数据挖掘是从大量数据中产生可信的、新颖的、有效的并能被人理解的模式的处理过程。数据挖掘具有以下能力:(1)趋势和行为自动进行预测。数据挖掘在数据库中自动地发现预测性的信息。对于有些以前必须通过人工分析才能得到答案的问题,现在只需直接对数据进行分析。(2)自动发现以前未知的模式。数据挖掘工具扫描数据库,发现以前隐藏着的模式。数据挖掘与OLAP的区别在于挖掘的层次不同。OLAP是利用现有数据库的查询/检索、报表功能与多维分析、统计方法相结合,得到可供决策参考的统计分析数据。数据控掘则从数据库中发现隐含的知识,两者所能回答的问题有所不同。数据挖掘一般分为以下几种:聚类(clustering)规则挖掘;分类(classification)规则挖掘;关联(association)规则挖掘;总结(summarization)规则挖掘;特征(characterization)规则挖掘;趋势(trend)分析;偏差(deviation)分析;模式(pattern)分析。对电网数据库的数据挖掘可以发觉有关电力规划专家所忽略的一些知识。综上所述,数据仓库/数据集市的应用要求有功能强大的桌面分析工具来支持,通常称之为联机分析处理(OLAP),是用于给分析人员以灵活、可用和及时的方式来构造、处理和表示综合数据的技术。OLTP数据库在查找业务具体数据上很有效,每天处理成千上万的事务,而为决策者提供总结性数据则无效。如电力公司需要查看去年所管辖的各公司的电力销售数据。OLTP数据库中需用大量时间用一个查询语句去检索4个季度每个月的销售数据,而OLAP技术则可在20s内完成。因为支持OLAP的数据仓库中的数据已被转换成一种更有效的存储结构,允许用户在大量数据上完成复杂的数据分析。随着微机保护装置的应用普及,继电保护二次系统的自动化水平得到不断提高。许多当前由人工处理的模拟信息转化为大量的数字信息,而技术管理人员也有许多用计算机实现的资料和试验记录文档。信息的数字化使得我们可以将不同的数据源有机地结合起来,形成一个专业化的计算机应用系统。通过综合分析数据,对设备实际运行状况加强了解,消除故障隐患,进一步保障电力系统的安全运行。
2数据仓库系统的体系结构2.1系统的体系结构一个完整的数据仓库系统是由3部分数据和5部分组件集成起来的,图1为其体系结构。
2.2各部分的内容和功能2.2.1操作型数据和外部数据操作型数据是面向应用的,主要是支持日常的业务操作,是当前企业数据库的主体。外部数据主要指企业为了进行决策,从企业数据库外获取的数据,比如其它企业的信息等。
2.2.2数据仓库整个数据仓库系统的核心部分,是按照数据仓库的思想组织起来的数据的集合。可以包括一个庞大的中心数据仓库和一系列较小的数据集市。2.2.3元数据元数据是关于数据的数据,是数据仓库系统实现其功能所不可缺少的。元数据可分为技术元数据(Technicalmetadata)和业务元数据(Businessmetadata)。技术元数据为系统开发人员提供了有关数据仓库准确和详细的信息,主要包括数据仓库逻辑和物理模型,数据仓库的表名、关键字、索引,字段名、长度、属性,源数据的相关信息,源数据与数据仓库数据的对应关系等等。业务元数据为管理人员提供了从数据仓库中获取信息的指南,主要包括从业务角度考虑的数据结构,表或属性的业务名称,向下挖掘的规则等等。2.2.4数据接口组件数据接口组件的功能主要是实现同构或异构数据库之间透明的数据传送,当从源数据向数据仓库导入数据,或分析决策工具要从数据仓库读取数据时,这个组件是必不可少的。
2.2.5数据处理组件数据处理组件在数据仓库提取数据的过程中,完成对元数据的选择、编辑、运算、组合等功能。是保证一个规范化的、能够真正被用户所接受的数据仓库所必不可少的。2.2.6决策分析组件决策分析组件包括最终用户进行分析决策所使用的OLAP、DSS等工具,以及生成报表、图表等的工具。决策分析组件是实现由数据到信息的非常重要的工具。2.2.7元数据目录组件元数据目录主要用来提供元数据的管理和访问等功能,是元数据发挥其作用所不可缺少的。2.2.8系统管理组件涉及到前面几个部分,包括任务的调度,数据库的优化,维护用户权限等功能。当把各个部分集成到一个完整的数据仓库系统中时,有一点是非常关键的,就是系统要具有开放的结构。这是因为整个数据仓库系统实际上是不同软件的集成,这些软件可能是不同的厂商或不同的人开发的,而且系统所选用的软件也可能是在变化的,因而一个开放的结构对于一个成功的系统[1][2]下一页