新能源功率预测是提高新能源场站控制保障高比率新能源发电接入电网宁静稳定运行的关键技术。现在由于通信故障、设备异常、人为限电等不确定性问题导致新能源场站的实测数据中含有高比例异常数据进而降低了功率预测的精度。有效的数据清洗可以提高数据质量使新能源功率预测效果越发准确。
福州大学电气工程与自动化学院、福建省电器智能化工程技术研究中心、福建省莆田供电公司、福建莆田荔源团体的研究人员武佳卉、邵振国、杨少华、肖颂勇、吴国昌在2020年第11期《电气技术》杂志上撰文首先概述了数据清洗的主流方法;然后对异常数据举行详细分类从异常值剔除和缺失值重构两个方面重点论述和分析了现有数据清洗方法的基本思路、应用条件以及优缺点;最后指出了未来数据清洗中值得关注的问题和偏向。
接纳统计量分析的方法重点在于对变量做形貌性统计从而检察哪些数据是不合理的。常用的方法为使用最大值和最小值判断新能源功率和预测变量的取值是否超出规模。若检测到功率小于即是零的数据则举行剔除实现数据的清洗整定。
统计量分析方法可以简朴有效地完成对新能源数据的检查适合处置惩罚不在有效数据规模内的聚集型数据可是不适用于处置惩罚大量的疏散型异常数据。
功率曲线是新能源发电的预测变量与被预丈量之间的关系曲线。学者们凭据异常数据的漫衍特征把泛起频率高的异常数据类型分成了4类。
以风速-风机功率散点图为例接纳比恩法绘制风电功率曲线图4类异常数据的漫衍如图2所示。
图3 风速-功率散点图
K最近邻(K-nearest neighbor, KNN)算法在分类上凭据最相近的一个或几个数据的种别决议该数据的种别。借助距离参数表征数据的偏离水平可以对异常数据举行检测并剔除。
常用的距离有欧氏距离和马氏距离。当某数据点与其他数据点的距离都大于一个阈值时就被判断为异常数据。
该方法简朴易懂可是在训练历史数据构建数学模型时学习速度较慢泛化能力较差且需要大量的数据举行训练否则训练误差会较大。
4 展望
基于统计学的重构方法有均值重构法、多项式拟正当、级比生成法、三次样条插值法和递推式非邻均值补全法等。
其中最常用的为三次样条插值法。
随着全球经济的快速生长能源的需求量逐年递增。
面临不行再生能源枯竭和全球情况污染问题新能源以其宁静性、环保性和可再生性等优势在世界规模内获得了高度重视和广泛应用并出现出良好的生长前景。
以福建某风电场为例该风电场有24台额定功率为2MW的风电机组。风电机组的切入风速为3m/s额定风速为15m/s切出风速为25m/s。风电场风速收罗时间距离为10min收罗时间为2015年2月1日00:00至2015年7月31日24:00。
风速-功率散点图如图3所示。其中原始数据中有12%的异常数据。
3)现有文献中对新能源的数据清洗和接下来功率预测的建模都举行了分散未来可以思量融合这两个环节形成清洗-建模-清洗的闭环结构。
图1 数据清洗方法分类
由于现在有关风电数据重构的研究较少且缺失数据重构的评定方法没有一个量化的尺度本次研究将差池缺失值的重构方法举行仿真分析。用于判断重构数据的乐成率和准确率的评定技术有待进一步研究。
2.1 功率曲线中异常数据的分类
6)K最近邻聚类算法
新能源功率预测时所用到的数据有数值天气预报(numerical weather prediction, NWP)数据、新能源运行实测数据和新能源地理信息数据等。
以。
本文来源:爱游戏app下载ios-www.huaxinfoods.com