核密度估计在电网电压质量分析与研究中的应用
摘要:电力系统的运行状况主要通过稳定控制及优化调度实现,其中电网电压质量是最为关键的参数之一。但随着电力系统的发展,其规模和结构的复杂性不断提高,致使其数据呈现出海量、多源、异构的特点,这一变化使得传统电压质量分析方法不再适用。本文考虑电网电压质量提出核密度估计分析模型,并运用R语言开发了电网分析软件,最后通过在杭州某典型变电站的实际应用验证了核密度估计分析模型在分析电网电压质量的准确性有效性。 关键词:电压质量分析;电力大数据样本;核密度估计理论;软件设计与应用
0 引言
随着电网规模和结构的日益复杂,电力系统数据呈现出容量大、来源多样以及质量参差不齐等特征[1]。传统电压质量分析方法和软件在处理海量、多源、异构数据时已显得力不从心[2]。面对这一问题有待进一步提高电压质量分析方法的合理性和完善性,并开发新的电压质量分析工具,从而达到优化电力系统稳定性,实现电压管理智能化的目的[3-5]
目前国内外学者针对电压质量分析方法已经进行了大量的研究并取得了许多成果。其中文献[6]
在逐步剔除法的基础上引入了残差灵敏度矩阵和分支定界法,有效的实现了对配电网电压质量的高效、准确分析。文献[7]借助随机森林在处理分类问题上的高度准确性优势,建立了基于随机森林的电压质量综合评估模型,实现了对电压质量所属等级的划分。文献[8]分别介绍Huber型、平方型、方均根型等多种形式的电压质量分析方法,并针对目前已有的多种电压质量分析方法的应用领域和使用条件进行了总结。但上述文献所提的电压质量分析方法普遍面临2个问题:1)在面对海量、多源、异构大数据样本时存在计算时间长,强相关不良数据辨识能力弱等缺点;2)存在对其相应的测量值只能做出“非好即坏”的判定问题。与此同时,国内在电压质量分析软件方面多采用Matlab、LabVIEW等工具,文献[9]提出了基于Matlab GUI的电压质量分析系统设计与实现;文献[10]开发了基于LabVIEW的电压质量分析系统。但随着电力系统数据量的日益庞大,数据逐渐呈现海量、多源、异构的特性,传统分析软件的运算时间较长、统计功能存在漏洞以及数据可读性差等问题逐渐显现出来。但反观R语言作为一款专业的统计分析语言,其强大的统计分析能力在处理海量、多源、异构大数据样本上的优势已经在其他行业中成功展现出来。文献[11]运用R语言对股票市场收益进行分析;文献[12]将R语言运用于刑事犯罪方面的研究。目前R语言在电力领域中的应用还未见报道,亟待开展相关研究。针对传统分析方法与软件的缺陷,本文将自适应核密度估计理论引入到电
网电压质量分析中,采用R语言对电压质量进行分析的软件能够提高处理电力大数据样本上的准确性与有效性。
1 电网电压质量分析现状
电力系统电压质量分析主要是针对电力系统中的各类影响电压运行水平的大数据样本,通过辨识/剔除不良数据,提取高维统计特征,以获知电力系统运行过程中存在的问题。
目前常用的电压质量分析方法主要有:逐步剔除法、基于抗差估计辨识算法、基于核密度估计理论的电压质量分析方法。其中逐步剔除法运用残差灵敏度矩阵对残差进行正则化,其认为实际量测数据中大于最大正则化的数据即为不良数据加以剔除,反复迭代直至所有的不良数据全部被剔除为止[13]。该方法虽能有效辨识不良数据,但却存在计算时间长,无法辨识强相关不良数据。基于抗差估计辨识算法在目标函数的计算过程中迭代获取测残差值的不同权重,剔除不良数据,但该算法却存在对量测数据只能做出“非好即坏”判定的弊端[14]
随着电力系统数据日益海量化和异构化,致使传统估计方法不再适用,故本文采用了基于核密度估计理论的方法,针对电力样本的概率分布提出全空间可微的核函数,在迭代计算的过
程中,逐渐降低进而消除不良数据所占份额,从而辨识并剔除不良数据[15]。经过验证表明在计算速度和不良数据辨识上相较与传统方法有了较大的改进,能有效的处理电力大数据样本。
2 考虑电压质量的核密度估计分析模型
设区域 空间上的d维立方体,其体积为V 为立方体边长,即 。对于任意的点 ,其中 表示x的第j个分量,x的核函数 为:
(1)
对于nx的样本 ,其中第i个样本为 ,若样本 落在超立方体 中,那么 (参数为宽度);否则 。因而落入x的邻域的样本数 为:
(2)
x的概率密度 的估计值 为:
(3)
概率密度估计值 最大的x即为它的估计,记为 。相应地,求取 的数学模型为:
(4)
式中, 为第正则化参数的自适应估计i个样本的权重; 为核函数; 为核函数带宽。
核函数宽度 的选择主要分为三类:一维核密度估计,多维核密度估计和自适应核密度估计[16]。考虑到电力系统样本的多样化和复杂化[17],因此将自适应核密度估计模型引入到电力系统电压质量分析中,相应的数学模型为:
(5)
式中,i为量测序号; 为第i个量测的权重; 为第i个量测的量测值; 为第i个量测的估计值; 为第i个量测的量测残差;x为系统状态变量,表示节点电压幅值、相角向量; 为零注入节点功率约束方程;n为量测数量; 为第i个量测所对应的核函数带宽。本文采用如下的量测权重 公式:
(6)
式中, 为一很小的正数; 为第i个量测标准差;s为全部量测标准差的几何平均值。该量测权重公式因拥有与核函数 类似的指数函数表达式而能够恰当地反应量测标准差 对目标函数的影响,避免由于 的值显著大过(或小于) 而使得核函数在目标函数中的作用过小或过大。
3 核密度估计应用软件结构设计
在构建基于核密度估计理论的电压质量分析模型的基础上对软件架构进行了设计。其中软件整体架构和人机交互界面设计采用C#,数据处理与图像生成采用具有强大统计分析与图形可视化功能的R语言,软件结构分为3个部分:数据处理层、图形展示层、辅助功能层,软件功能框图如下图1所示。
3.1 数据处理层
数据处理层为整个系统提供了数据处理的基础支持。通过R与数据库构建连接,对海量、异
构的大数据样本进行读取、筛选、重构与转换并对预处理后的数据进行自适应核密度分析。经过自适应核密度分析后能够有效地避免传统方法易产生的不良数据漏辨识与正常数据误辨识等问题。
3.2 图形展示层
图形展示层是电压质量分析软件的核心。在基础绘图框架中,除了常规的电力系统图形和表格外,还专门应对电压质量分析添加了三个新指标:平均值与标准偏差、概率密度分布和小提琴分布并且在视图展示框架中涵盖了视图注释、视图缩放和标签显示等辅助功能。
(1)平均值与标准偏差模块
将平均值和标准偏差指标添加到传统电压质量分析中,通过对其分析可以掌握该站电压整体水平与波动情况,对于波动情况严重的不稳定时间段可以进行有效地局部分析,大大简化了数据量,可显著提高数据分析人员的工作效率。
(2)概率密度分布模块

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。