大数据挖掘技术在电网状态监测与诊断中的应用
吴振扬
( 国网吉林省电力有限公司 , 吉林 长春 130000)
[ 摘要 ] 大数据是目 前国内外各个领域的一个研究应用热点。 本文基于大数据技术, 阐述了 大数据技术对于电网发展的重要意义,
大数据挖掘技术的发展状况; 分析了 大数据挖掘技术的几种算法特点, 并通过比较选择聚类方法作为在电网状态监测与诊断中应
用的方法; 运用聚类算法展望将大数据挖掘技术应用于电网状态监测中的可能。
[ 关键词 ] 大数据; 电网; 挖掘; 数据; 监测; 预警; 诊断
[ 中图分类号 ] S222.5+5 [ 文献标识码 ] C [ 文章编号 ] 2096-1995(2018)04-0032-01
作者简介: 吴振扬( 1987.08-) , 男, 吉林市人, 汉, 研究生, 工程师 , 特高压与电网调度。
电网状态检修可及时解决并消除安全隐患, 对于查找故障原因, 不断完善此项工作, 可提高电网的运行安全 , 以及降低故障发生频率。 当前的电网状态监测与诊断主要仍侧重于个别重点设备的数据监测, 对于采集的信息无法完成区域外的共享,不同设备间的运行状况以及参数的改变仍无法进行统筹考虑,可能会影响分析判断的数据不能及时辨别, 无法满足未来智能电网对全系统状态信息监测的要求[1] 。 而智能电网运行状态的数据量远远超过传统电网状态监测的数据, 其中包括了一次、二次设备的运行工况; 重要设备的实时在线状态数据; 设备的基本信息、 试验数据、 运行数据、 缺陷数据、 巡检记录等的收集。 面对这些海量的、 分布式的、 异构的状态数据, 常规的数据存储与分析方法会遇到极大的困难。 而大数据的云计算技术使得解决上述问题成为可能[2] 。 下面, 通过介绍大数据挖掘技术的发展情况, 大数据挖掘技术的研究状况, 通过分析设备之前的历史运行情况, 对比现在出现的数据信息, 使设备故障状态能提前预警, 提前被监测到故障点, 找到故障原因。
1 大数据挖掘技术的发展情况
通常, 这些算法必须要以最快的速度处理海量的数据, 以满足需要, 从而在所提取的最有用的信息中找到问题的关键点,及时解决[3] 。 在电力领域, 生产控制系统产生的数据周期都是秒级甚至毫秒级的, 数据量大, 互相联系非常紧密, 要求的处理时间尽可能短[4] 。 要想通过数据挖掘, 攫取这些生产数据的核心价值, 首先要选取合适算法。
2 大数据挖掘技术的研究
电力生产领域的数据大都是时序数据, 将大数据分析技术与设备状态在线监测技术相结合, 分析其历史数据, 通过比较差别, 找出运行中的潜在问题, 从而对其规律进行深入研究。数据挖掘有多种算法, 对于每一种算法均有其自身的特点[5] 。
2.1 回归分析
是把数据的属性用数学函数的形式表征, 对数据之间的联系以公式的形式清晰的表示出来, 这是对数据时序序列的预测及相关关系的研究, 可以从中确定数据之间的属性关系。
2.2 神经网络方法
非常适用于一些表征不完整, 数据需要模糊处理的分析方法, 它具有非线性的特点, 可以分布存储相关数据信息, 优化处理数据的广度。
2.3 关联规则
对于数据采用推导的方法, 通过判断所需数据出现的概率得出各个数据之间的关联程度。 数据判断分两个阶段, 首先是从原始数据之中检测出频率出现较高的数据组, 然后对于这些数据组从中找出相互之间的关联。
2.4 聚类
通过对大数据进行相关大类的区分, 将数据之间的差别分别统计到不同类别中, 再分析各个类别中的数据差别, 对于同类别中的差别较大数据进行分析, 找出原因。 同类别差异较小的或者不同类别间的数据可以忽略, 从而加快数据分析的速度和有效性。
2.5 分类
将海量数据一一找出相应的特征, 给予合理的表征描述,将这些特点根据不同的分类方式归结在不同的模块中, 当需要调取相关信息时, 从模块中提取数据, 主要应用于信息分类和趋势预测。
电力设备状态监测的实时性与复杂性, 决定了其数据挖掘必须以快速处理并实时筛选为先决条件。 回归分析运用的数学函数无法表征电力设备中的异构体状态数据; 神经网络法属于非线性处理技术, 对于电力实时数据无法做到连续读取; 关联规则是从高频数据中找出相互关联, 对于分散的电力设备无法做到全局性监测; 分类方法作为一种趋势预测, 对于电力设备的精准性要求不够。 从而选择了聚类方法, 将不同设备发出的数据进行整合, 归为不同大类, 根据重要程度在不同窗口展示于运行人员。
3 大数据挖掘技术的应用展望
(1) 基于数据挖掘技术可以将自动发现的不正常数据分类,将不同类别对应不同等级, 从而暴露设备异常变化的严重程度,协助调度人员预测电网状态 ;
(2) 基于数据挖掘技术的决策支持和控制, 其定性模糊分析能力, 可以从大量数据中去除冗余数据, 将故障特征分类提取, 加快设备状态判别 ;
(3) 基于数据挖掘技术的电力设备状态检修, 将缺陷数据与历史运行数据比对分析, 得到的信息与设备当前运行情况比较,可快速判断当前运行状态异常情况。
总之, 大数据技术是电网发展的方向, 而电力企业积累了大量的时序型历史数据, 将这些数据充分快速利用是电力运行人员应该发掘的区域。 本文通过比较大数据挖掘技术的不同算法, 找到合适的算法应用在设备状态在线监测与预警诊断领域,探索出设备海量数据应用的新模式。 通过介绍数据挖掘技术的几种常用算法, 并通过分析各种算法, 得出大数据技术应用于电力设备的算法是聚类方法; 并运用聚类方法, 将大数据挖掘技术应用于电网中, 对几种应用技术做了前景展望。
【参考文献】
[1] 白红伟, 马志伟, 朱永利 . 基于云计算的绝缘子状态监测数据的处理 [J]. 电磁避雷器 , 2011 (4) : 19-22.
[2] 李振元, 李宝聚, 王泽一 . 大数据技术对我国电网未来发展的影响研究 [J]. 吉林电力 , 2014, 42 (2): 10-13.
[3] 苏剑飞, 赵捍东. 神经网络在旋转机械故障诊断中的应用 [J].微计算机息. 2007 (130: 221-225)