第48卷第7期电力系统保护与控制Vol.48No.7 2020年4月1日Power System Protection and Control Apr.1,2020
DOI:10.19783/jki.pspc.200107
基于长短期记忆网络的PMU不良数据检测方法
杨智伟,刘灏,毕天姝,杨奇逊
(华北电力大学新能源电力系统国家重点实验室,北京102206)
摘要:同步相量测量单元(Phasor Measurement Units,PMUs)因其同步性、快速性和准确性,已成为复杂电力系统状态感知的最有效工具之一。但是,现场的复杂环境导致PMU数据存在数据丢失、数据损坏、同步异常、噪声影响等质量问题,严重影响其在系统中的各类应用,甚至威胁电网安全稳定运行。提出了一种基于长短期记忆(Long Short-Term Memory,LSTM)网络的PMU不良数据检测方法。首先分析了LSTM在不良数据检测中的优势。然后基于LSTM网络对时间序列选择记忆的特性,构造了一种双层LSTM网络架构,提出了对原始数据的分解重构方法。在此基础上,定义了两种目标函数,以获得不同的误差特征。提出了一种基于决策树的不良数据阈值确定方法,实现了不良数据的有效检测。通过大量仿真与实测数据验证了该方法的可行性和准确性,可提高PMU数据质量,使其更好地应用于电力系统的各个方面。
关键词:同步相量测量单元;数据质量;不良数据检测;长短期记忆网络;决策树
PMU bad data detection method based on long short-term memory network
YANG Zhiwei,LIU Hao,BI Tianshu,YANG Qixun
(State Key Lab of Alternate Electric Power System with Renewable Energy Sources,North China Electric
Power University,Beijing102206,China)
Abstract:Phasor Measurement Units(PMUs)have become one of the most effective tools for state awareness of complex power systems due to their synchronization,speed and accuracy.However,the complex on-site environment causes data loss,data corruption,synchronization anomaly,noise and other quality problems of the PMU data,which seriously affects various applications in the power system and even threatens the safe and stable operation of the grid.This paper proposes a PMU bad data detection method based on Long Short-Term Memory(LSTM)network.First,the advantages of LSTM in bad data detection are analyzed.Based on the characteristics of time sequence selection and memory of the LSTM network,a two-layer LSTM network architecture is constructed,and the decompo
sition and reconstruction method of original data is proposed.On this basis,two objective functions are defined to obtain different error characteristics.A method for determining the threshold of bad data based on decision tree is proposed,which realizes the effective detection of bad data.The feasibility and accuracy of the proposed method are verified by a large number of simulations and field data.The quality of PMU data is improved,which makes it better applied to all aspects of the power system.
This work is supported by National Key Research and Development Program of China(No.2017YFB0902900and No.2017YFB0902901).
Key words:phasor measurement units(PMUs);data quality;bad data detection;long short-term memory(LSTM) network;decision tree
0引言
状态感知作为电力系统万物互联的重要环节,对基金项目:国家重点研发计划项目资助(2017YFB0902900,2017YFB0902901)
保障电力系统安全稳定运行具有重要意义[1-3]。同步相量测量单元(Phasor Measurement Units,PMUs)因其快速性、同步性和准确性,可为状态感知提供数据基础[4-6]。同时,PMU数据也广泛应用于系统振
-
2-电力系统保护与控制
荡检测、事故分析、闭环控制等方面[7-10]。目前,我国已安装投运了7500余台PMU,覆盖重要的220kV及以上变电站、主力发电厂和新能源并网汇集站。与此同时,随着大规模分布式电源、储能等不断增长,配电网的同步相量测量技术也在快速发展[11]。
然而,由于现场环境复杂,PMU量测数据易受到多种因素影响,存在不同程度的数据质量问题。PMU不良数据主要包括量测数据丢失、同步信号丢失、量测偏差过大等[12-13]。据统计,2013年我国约有20%~30%的PMU数据存在质量问题[14],严重影响系统中的各类应用,导致可观性降低,影响状态估计和参数辨识,甚至威胁电网安全稳定运行[15]。因此,PMU不良数据检测在提高数据质量和保证准确状态感知方面发挥着重要作用。
针对不同类型的不良数据检测,国内外学者提出了多种应对方法。量测数据和同步信号丢失可采用基于通信协议中数据帧结构[16]是否异常的方法进行检测。针对量测偏差过大问题,可分为基于系统拓扑模型的状态估计方法和基于数据驱动的检测方法。文献[17]提出了一种基于相量量测的状态估计方法,利用增广状态向量校正相角偏差和量测误差,同时借助冗余量测估计线路参数。文献[18]将时序预测模型与卡尔曼滤波、平滑算法相结合,清洗PMU量测中的不良数据。基于状态估计和卡尔曼滤波的不良数据检测方法均需要多台PMU量测数据、系统拓扑和线路参数,虽然检测结果精确,但运行速度较慢,当系
统拓扑或线路参数存在错误时,易造成误判。同时当系统拓扑未知时,不少学者提出了基于数据驱动的检测方法。文献[19]提出了一种基于逻辑判断的检测方法,一旦量测数据超出阈值,则判定为不良数据。而当系统动态时,量测数据变化复杂,固定阈值无法准确判断不良数据。文献[14]利用多台PMU量测数据,提出了一种基于时空相似性的检测方法。然而在某些PMU布点较少的地区,多台PMU量测数据难以获取,仅依靠单台PMU量测数据,该种方法难以较好地应用。对此,仅利用单台量测信息,文献[20]提出了一种基于密度聚类的检测方法。文献[21]将三种简易分类器通过集成学习结合,再对不良数据进行检测。文献[22]利用主成分分析法将信号分成低维特征分量和高维噪声分量进行不良数据检测。上述三种方法均利用单台量测信息,在系统准稳态条件下,对不良数据的检测效果较好;但动态条件下,正常数据与不良数据的差异较小,聚类和集成学习的方法易造成漏检,主成分分析法则由于不良数据的影响,不能很好地分解信号特征,难以较好地检测不良数据。因此,本文主要解决系统动态条件下基于单台PMU量测信息的不良数据检测问题。
本文提出了一种仅利用单台PMU量测信息,且适用于系统多种状态的PMU不良数据检测方法。本文分析了长短期记忆(Long Short-Term Memory, LSTM)网络对PMU量测数据学习并记忆序列信息的优势,提出了一种序列分解重构的双层LSTM网络架构,并通过设置两种目标函数获取不同误差特征。在此基础上,为避免主观性,提出了一种基于决策树的不良数据阈值确定方法。最后,通过大量仿真与实测数据验证该方法的可行性与准确性,对提高PMU数据质量具有重要意义。
1LSTM网络在不良数据检测中的应用分析
电力系统发生故障等扰动时会导致电气量发生较大波动,易被识别为不良数据。本文作者提出了一种扰动事件识别方法,在不良数据检测之前应用,可防止将扰动事件数据识别为不良数据。由于该内容不是本文重点,因此未在此提及。
图1(a)为电力系统准稳态下PMU量测数据,t1时刻存在不良数据,图1(b)为电力系统动态下PMU 量测数据,t4时刻存在不良数据。基于聚类和集成学习的不良数据检测方法对图1(a)中准稳态下不良数据具有良好的检测能力,但对图1(b)中动态下不良数据易造成误判。这是由于准稳态下不良数据与正常数据偏差较大,二者联系较弱,聚类和集成学习的方法易于区分不良数据;而动态下不良数据处于振荡的波峰与波谷之间,与正常数据差异较小,基于聚类和集成学习的方法不易区分不良数据。基于主成分分析的不良数据检测方法可有效分解信号的各成分,通过重构后的数据与原始数据对比,检测出不良数据。当不良数据较少时,该方法可适用于准稳态和动态;但当不良数据较多时,易对分解
过程产生影响,导致重构数据不准确,造成误判。
杨智伟,等基于长短期记忆网络的PMU 不良数据检测方法-3-
图1准稳态和动态下PMU 量测数据
Fig.1Quasi-steady state and dynamic PMU measurement
LSTM 网络作为一种循环神经网络(Recurrent Neural Network,RNN)的特殊变体,由于其独特的循环结构对时间序列具有强大学习能力,可将时序中不良信息筛选并选择遗忘,减小不良数据对数据重构的影响[23]。同时由于传统BP 神经网络是输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。因此传统神经网络无法获得某一序列当前输出与前面信息的关系。而LSTM 网络通过其内部的遗忘门、输入门、输出门和自身的循环结构可对前面的信息进行选择记忆并应用于当前输出,即隐藏层之间的节点是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。因此,考虑长短期记忆网络特有的循环结构,选用其作为所提方法的主体结构处理PMU 量测中的不良数据。图2为LSTM 网络时序结构。图中:x t 为当前时刻单元输入;c t 为当前时刻单元记忆状态,负责存储长期记忆特征;h t 为当前时刻单元输出,负责短期记忆特征。可以看出,在LSTM 网络中,当前输出h t 由上一时刻的状态c t -1、上一时刻的输出h t -1和当前输入x t
共同决定。
图2LSTM 网络时序结构Fig.2LSTM network timing structure
LSTM 网络单元具体结构如图3所示。图中
LSTM 网络通过遗忘门t f 、输入门t i 和输出门t o 控制各时刻信息的输入,因此,LSTM 网络对历史信息
具有更好的选择性,可实现对不良数据的有效筛选。
图3LSTM 网络单元结构Fig.3LSTM network unit structure
遗忘门t f 会根据每一时刻的输入t x 和上一时刻的输出h t -1决定上一时刻的单元记忆状态c t -1中某些长期记忆特征是否需要被遗忘。遗忘门t f 计算如式(1)所示。
1([,])t f t t f σ-=+f W h x b (1)式中:h t -1包含上一时刻量测数据的特征;W f 为遗
忘门权重矩阵;b f 为遗忘门偏置项;当f t 中表示t 时刻数据特征的维度取值接近0时,该特征从长期记忆状态c t -1中被剔除,若取值接近1则会被保留;σ为激活函数。
1
()1e x
x σ-=+(2)
以图1(b)为例进行说明。当t 5时刻数据输入时,遗忘门5t f 中表示t 4时刻不良数据特征的维度取值会接近0,该特征从长期记忆状态4t c 中被剔除。LSTM 网络t 5时刻在长期记忆中遗忘不良数据的特征后,还需在长期记忆中加入新的特征。输入门5
t
i 根据x 5和4t h 决定哪些信息加入长期记忆状态4t c 中生成新状态5t c 。输入门和新状态的计算为
1([,])t i t t i σ-=+i W h x b (3)11tanh([,])t c t t c t t t t t --=+=+    c
W h x b c f c i c
(4)
式中: t c
为t 时刻输入的单元记忆状态;W i 、W c 分别为输入门、状态权重矩阵;b i 、b c 分别为输入门、状态偏置项;tanh 为激活函数,如式(5)所示。
e e tanh()e e x x
x x
x ---=+(5)
输入门在t 5时刻,消除了t 4时刻对数据序列的影响,将整体振荡状态的特征保留在5
t c 中。LSTM
网络得到新的记忆状态5
t c 后,还需产生t 5时刻输
出,即此时序列的短期特征5t h 。输出门5
t o 根据新
状态5
t c 、上一时刻输出4t h 和当前的输入x 5来决定
该时刻的输出5t h 。其计算公式为
o 1o ([,])
t t t σ-=+o W h x b (6)
tanh()t t t = h o c (7)
式中:W o 为输出门权重矩阵;b o 为输出门偏置项。
2
PMU 不良数据检测
2.1PMU 数据分解重构方法
对PMU 数据分析与重构是不良数据检测的基础。电力系统准稳态和动态下PMU 数据特性差别较大,本文拟分别对准稳态和动态下PMU 数据进
-4-电力系统保护与控制
行分解重构。因此,首先需对PMU 数据进行准稳态和动态的辨识,该方法在文献[24]中有详细论述,并非本文重点,在此不进行介绍。
假设某时间T 内的PMU 量测幅值数据D =X 1,X 2, ,X nk ,数据量N =nk ,其中未包含不良数据,如图4
所示。
图4PMU 正常量测数据示意图Fig.4PMU normal measurement data diagram
图4中,橘方框表示正常数据x i ,每k 个数据分为一组,作为独立训练样本,共有n 组。PMU 数据分解重构网络框架如图5所示。首先利用单层网络可多输入单输出的特点,构造网络LSTM-d 对正常量测数据分解,得到原始数据的特征向量d k h 。再利用单层网络可单输入多输出的特点,构造网络LSTM-r 将上层网络的输出向量d k h 作为本层的初始化输入,对正常量测数据重构。从图5可知,序列分解重构过程中,需对LSTM-d 、LSTM-r 网络进行训练,对两层网络中遗忘门f t 、输入门i t 、输出门o t 的各参数W f 、b f 、W i 、b i 、W c 、b c 、W o 、b o 不断优化,使重构数据与原始数据尽量一致。以第一个样本中的PMU 幅值数据12, ,, k x x x  为例,将其作为第一层LSTM-d 网络的输入。每一时刻的x i 和上一时刻的输出1d i -h 一同决定该时刻的输出d i h 。第二层网络LSTM-r 将上层网络的向量输出d k h 作为
其初始输入,逆序重构。这使得原始数据中大部分信息均可用于重构,保证了重构的准确性,重构序列为
r r r r
i i i i =+x W h B (8)
式中,r
i W 、r i
B 分别为LSTM-r 网络中待训练的权
重矩阵和偏置项。
图5PMU 数据分解重构框架
Fig.5PMU data decomposition and reconstruction framework
另外,为保证所得模型更加准确,训练时,LSTM-r 网络中每一时刻的r i h 由上一时刻的输出+1r i h 和原始序列的x i 共同决定。测试时,LSTM-r 网
络中每一时刻的r i h 由上一时刻的输出+1r i h 和重构序列的r i x 共同决定。通过大量数据训练,可得重构序列r i x ,则误差为
r i i i e x x =-(9)
训练目标分别设为如下函数的最小值,
M =(10)
1
1min N
i i G e N ==∑(11)
将原序列的n 个样本依次输入图5所示的网络结构中进行训练,由两个目标函数可得到两个参数
不同的网络模型。重构序列r i x 均对应重构误差e iM 和e iG 。若重构误差较大,则判定为不良数据;较小则为正常数据。因此,误差阈值的设置是实现不良数据检测的关键。人为设置误差阈值,主观性较强,可能存在部分不良数据漏判,基于决策树的不良数据阈值设置方法可避免这一现象。2.2PMU 不良数据阈值确定
将相同PMU 另一时间T '内的量测数据作为测试数据D ',其中包含不良数据,如图6
所示。
图6测试数据示意图Fig.6Test data diagram
图6中,灰方框表示不良数据。正常数据和不良数据的标签分别设置为0和1。将测试数据分别输入上述训练得到的两个网络,可得各数据的重构误差分别为e iM 、e iG 。利用C4.5决策树对误差阈值进行判定[25-26],从而实现不良数据的检测。将e M 、e G 作为特征属性,数据类型作为类别属性,具体步骤如下。
1)将80%的测试数据用于训练决策树,剩余数据用于验证检测精度。
2)计算样本的信息熵,如式(12)所示。
2
21()log i i
i E D p p ='=-∑(12)
式中:p 1表示正常数据在样本中的比例;p 2表示不
杨智伟,等基于长短期记忆网络的PMU 不良数据检测方法-5-
良数据的比例。
3)计算两类误差特征的信息增益和增益率。假设特征e M 作为划分特征,其存在v 个从小到大排列
的取值{}12,,,v M M M e e e  ,将各区间)1
,i i M M e e +⎡⎣
的中位点1
2
i i M M e e ++作为候选划分点,即有v -1个候选
划分点。
1
{|11}
2
i i M M i e e Q q i v ++==≤≤-(13)各候选划分点的信息增益为
++(,,)()()()i i i i q q
M i q q
D D Z D e q
E D E D E D D D --
''''''=--''(14)式中:D '表示训练的样本个数;/i q
D D -''表示i M i e q ≤个数所占比例;+/i q
D D ''表示i M i e q >个数所占比例。
4)选择所有候选划分点中信息增益最大的作为误差特征e M 的信息增益,由于信息增益偏重可取值数目较多的特征,需计算增益率作为最终划分标准,计算公式如为
(,,)
(,,)()
M i M i M Z D e q R D e q I e ''=(15)
{}
2
,()log i i q q M D D I e D D βββ
∈-+''=-
'
'
∑(16)
式中,I (e M )为特征e M 的固有属性,其可能取值个数
v 越多,则I (e M )通常越大。
5)重复上述步骤3)、4)即可构造如图7所示决
策树。
图7决策树示意图Fig.7Decision tree diagram
图7中:叶子节点表示划分结果为正常或不良数据,其中橘框中为正常数据,灰框中为不良数据;中间节点表示训练样本中对应的误差特征划
分,其中紫圈为不同阶段对特征的划分。首先,
选择两类误差特征e M 、e G 中较大的信息增益率与给定阈值比较,如黄框所示。若小于,则停止计算,所有数据均为正常或不良数据,该树为单节点树;
若大于,则进行划分。假设1
M e q 作为划分点时信息字符串长度过长
增益率最大,如第一阶段紫圈所示,特征1
M
M e e q >为一类,剩余为一类。依次递归重复,直至划分出的数据均属于同一类别,如图7中叶子节点所示。
最后,将剩余测试数据的误差e iM 、e iG 依次输入决策树,即可实现不良数据检测,并验证模型准确性。结果在算例分析中给出。2.3算法流程
综上,本文提出的PMU 不良数据检测方法如图8
所示。
图8算法流程示意图Fig.8Flow chart of algorithm
首先对待测数据进行准稳态和动态辨识;将准稳态和动态数据分别输入训练好的稳态和动态LSTM 网络模型中,可得准稳态数据的重构误差e sM 、e sG 和动态数据的重构误差e dM 、e dG ;最后,利用决策树模型对重构误差进行判断,即可有效检测PMU 不良数据。
需特别指出,当发生瞬时性故障时,PMU 测量数据会出现少量突变的数据,与不良数据行为极为类似。为减少误判,本文利用瞬时故障时电压与电流的关系,在利用本文方法识别出坏数据后额外加一个判据。即若电压幅值减小的同时电流幅值增大,则有发生了瞬时故障的可能,需对识别结果进行标注,再通过其他测量装置的数据进行验证,确定是否为不良数据。若不满足上述条件,则直接判断为不良数据。
3仿真与实际数据验证

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。