您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 风电场输出功率异常数据识别与重构方法研究
第43卷第3期电力系统保护与控制Vol.43No.32015年2月1日PowerSystemProtectionandControlFeb.1,2015风电场输出功率异常数据识别与重构方法研究朱倩雯1,叶林1,赵永宁1,郎燕生2,宋旭日2(1.中国农业大学信息与电气工程学院,北京100083;2.中国电力科学研究院,北京100192)摘要:电力大数据是电力发展的重要资源,数据来源于电力生产和电能使用的各个环节。风电运行数据是电力大数据的重要组成部分,随着风电穿透功率的增大,风电数据的采集、处理、分析对风电场运行、控制与并网研究有重要意义。然而,从风电场收集到的大量数据中通常包含异常数据点,这样的异常点给风电功率波动特性、风电功率预测等方面研究带来负面影响。分析了风电场历史运行数据中存在的异常数据的主要来源,并针对该实际问题,采用基于四分位算法的数学模型对异常数据进行识别。在数据缺失的情况下,以可用历史数据为基础,采用基于临近风电场出力模式性的方法和多点三次样条插值方法重构出完整的时间序列。算例分析给出了两种重构方法的重构效果以及各自的适应性,结果表明采用所提出的方法能够有效识别、剔除异常数据并重构缺失数据,对不同风电场有较强的通用性,具有一定的工程实用价值。关键词:风电场;风电运行数据;电力大数据;异常数据;重构MethodsforeliminationandreconstructionofabnormalpowerdatainwindfarmsZHUQianwen1,YELin1,ZHAOYongning1,LANGYansheng2,SONGXuri2(1.CollegeofInformationandElectricalEngineering,ChinaAgriculturalUniversity,Beijing100083,China;2.ChinaElectricPowerResearchInstitute,Beijing100192,China)Abstract:Electricpowerbigdataisanimportantresourceforelectricpowerdevelopmentandcomesfromtheproceduresofelectricityproductionandenergyutilization.Windpoweroperatingdataisthemajorpartofelectricpowerbigdata.Withthedramaticincreaseofwindpowerpenetration,itisofgreatsignificanceforwindfarmoperation,controlandintegrationresearchbycollection,processingandanalysisofrealhistoricaloperatingdatafromwindfarms.However,amountsofdatacollectedfromwindfarmsusuallycontainabnormaldata,whichhaveadverseimpactonthestudyoffluctuationcharacteristicsofwindpower,windpowerprediction,etc.Themainsourceofabnormaldataexistedinwindfarmhistoricaloperationdataisanalyzedandamodelforeliminatingabnormaldatabasedonquartilemethodispresented.Inthecasesofmissingdata,methodsbasedonpatternsofsimilaritybetweenneighboringwindfarmsoutputsandmulti-pointcubicsplineareusedonthebasisofhistoricaldatatoreconstructthediscontinuoustimeseriesrespectively.Thecasestudyindicatesthatthepresentedmodelsareefficientforeliminatingabnormaldataandreconstructingmissingdata,whichcanbeappliedinpracticalengineering.ThisworkissupportedbyNationalNaturalScienceFoundationofChina(No.51477174andNo.51077126).Keywords:windfarm;windpoweroperatingdata;bigdata;abnormaldata;reconstruction中图分类号:TM619文献标识码:A文章编号:1674-3415(2015)03-0038-080引言随着电力大数据时代的到来,电力大数据在应用过程中存在着对行业内外能源数据、天气数据等多类型数据的大量关联分析需求,而这些都直接导基金项目:国家自然科学基金项目(51477174,51077126)致了电力数据类型的增加,从而极大地增加了电力大数据的复杂度。电力行业对大数据的需求,其迫切性将大大超越其他基础能源行业。电力大数据将贯穿未来电力工业生产及管理等各个环节,起到独特而巨大的作用。在电力生产环节,风光储等新能源的大量接入,打破了传统相对“静态”的电力生产,使得电力生产的计量和管理变得日趋复杂[1]。朱倩雯,等风电场输出功率异常数据识别与重构方法研究-39-风电运行数据是电力大数据的重要组成部分。当前,风力发电是可再生能源开发利用中技术最成熟、最具开发规模和商业化发展前景的发电形式。随着风力发电技术的不断发展,由于风电功率所呈现的随机性、波动性和间歇性,风电大规模并网对电力系统的影响也越来越明显,研究风电对系统的影响并在此基础上提出相关技术解决措施已成为当前的研究热点和重要课题。风电历史运行数据是研究风电功率波动特性、风电功率预测[2-4]、风电功率对电网影响评估及控制策略[5-6]、风电功率曲线的计算、测试以及修正[7]的基础,因此,对风电场历史运行数据的记录就尤为重要。对于风力发电运营管理方,通过实测风速和风电功率得到的功率曲线是衡量风电机组和风电场经济技术水平的最佳标尺[8],可以用于评估风机和风电场的性能和运行状况、预测风机和风电场的年发电量等;对于预测服务商,历史实测风速和风电功率数据作为预测系统的基础输入数据,对预测精度有显著影响。然而,从风电场收集到的大量数据中通常包含异常数据点,这样的异常点表现出数据缺失,越限,功率波动梯度过大等特征。通过对风电场的运行经验和统计结果的分析,异常数据点的主要来源有[9]:风机叶片受污垢和冰等环境因素的影响形成异常点体现在风电场功率曲线上;维修或弃风限电造成的风电场停机;传感器故障等控制系统问题;由表计测量误差导致的异常观测值等。因此,有必要对风电历史运行数据中的异常数据点进行识别剔除和还原重构。文献[9]建立了基于逻辑函数的风电功率曲线非线性模型,并通过进化策略算法对模型参数进行求解。这个模型通过残值法和控制图对异常值进行识别、剔除。但是模型的建立需要大量的正常数据样本,且进化策略算法对大样本数据的多参数寻优过程速度较慢,具有较大局限性。文献[10]在数据预处理阶段通过简单的数据范围检查和一致性检验对异常数据进行剔除,在功率曲线建模过程中忽略缺失数据,然后根据互相关函数去除风速和功率时间序列之间的延时特征,从而得到一个静态的(无延时)功率曲线模型。文献[11]采用基于小波模极大值的方法对风速数据中的奇异点进行辨识,该方法将阈值判断与李氏指数相结合,判断出风速信号中的奇异性及发生时刻,剔除其中的奇异数据,并采用ARMA模型对奇异点进行修正。但该方法仅针对时间序列的奇异点辨识,并没有考虑到风速-功率的对应关系,在奇异点修正过程中采用单一的ARMA模型修正效果并不理想。文献[12]针对弃风情况下风电场历史运行数据存在的异常数据的实际问题,自定义了在有功功率时间序列中异常数据所应遵循的时序变化特性,并根据这些特性识别异常数据。但实际上由于风电所固有的较强波动性和随机性,很难从时序变化特性上完全区分正常数据和异常数据,尤其是在弃风现象不明显时,其识别过程具有很大的局限性。文献[13]通过简单的数据范围检查和一致性检验对异常数据进行剔除,并不适用于处理大量分散型异常数据。本文分析了风电场历史运行数据中存在的异常数据的主要来源,并针对该实际问题,采用基于四分位算法的数学模型对异常数据进行识别;并在此基础上通过实际算例对比分析了采用基于临近风电场出力模式性和多点三次样条插值方法对风电场输出功率异常数据进行重构的效果,从而为研究风电功率波动特性、风电功率预测等风电相关问题提供有效的数据集。1异常数据的识别与剔除1.1异常数据分析文献[14]对德国和丹麦风电场的研究表明,导致风机故障的主要原因是电气控制或系统部件(电网或电气系统,偏航系统以及机械或变浆控制系统)而不是机械组件,比如变速箱。风电功率的异常数据主要是由上述故障和风机特性的不稳定造成的。大量的异常数据并不容易识别,这些异常数据的存在严重影响了研究建模和风资源评估的结果。检验建模所用数据质量对于建模是十分重要的,风电功率数据集中存在大量异常数据,因此对该类问题的自动识别与剔除方法的研究是很有必要的。考虑到难以从单一的风电功率时序变化特性中自识别分散型异常数据,本文借助风速-功率散点图分析,体现在v-p散点图上存在大量分散型异常数据点和堆积型异常数据簇。异常数据的检验识别首先是要剔除风速-功率数据组中的连续数据以及越限数据,这些异常数据通常是由表计读数错误引起的。但是仅对这部分数据进行剔除并不足以为功率曲线建模、风电功率预测提供真实可靠的数据组。风电出力数据存在很多异常值,这是因为风速的随机性和波动性导致了两个参量之间相关关系的时变性。图1是国内某风电场70m测风塔风速与实测功率散点箱线图,该风电场的切入风速vci=4m/s,切出风速vco=20m/s,额定风速vr=13m/s,额定功率Pr=49.5MW。由图中显而易见的是风电功率数据集中存在大量异常数据,表现在箱线图中,-40-电力系统保护与控制数据整体分布不集中,离群值数量大且分布不规律,对风电功率预测、风电功率曲线的计算、测试以及修正等方面研究带来负面影响。就风电出力而言,如果功率值是每15min风机出力的平均值,必须保证这台风机在这15min内正常工作,否则,这些数据并不能代表风机的正常运行状态。图1风电场风速-风电功率散点箱线图Fig.1Windspeed-powerscatterbox-plotofawindfarm1.2识别与剔除异常数据的原理与过程基于正态分布的3σ法则或Z分数方法是以假定数据服从正态分布为前提的,但实际数据往往并不严格服从正态分布。它们判断异常值的标准是样本数据的均值和标准差,而均值和标准差的耐抗性极小,异常值本身会对它们产生较大影响,这样产生的异常值个数不会多于总数0.7%。显然,将这种方法应用于非正态分布数据的异常值识别,其有效性是有限的。箱线图的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,它真实直观地表现数据形状的本来面貌;另一方面,箱线图判断异常值的标准以四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,因此箱线图识别异常值的结果比较客观,具有一定的优越性。通过对体现在v-p散点图上的大量分散型异常数据点和堆积型异常数据簇的分析,根据异常数据在v-p散点图中的随机分布特性,本文采用基于四分位原理[15-16]的数学模型对风电场异常数据进行识别与剔除。其异常数据识别和剔除过程如下:(
本文标题:风电场输出功率异常数据识别与重构方法研究
链接地址:https://www.777doc.com/doc-5920886 .html