基于二次EEMD的工业电能需量多步预测
何峰 钟婷 谭貌
摘 要:电力大用户最大需量控制是降低电网峰值负荷、节约用户电费成本的重要技术手段。面向强波动性和冲击性工业电能需量控制,研究了超短期需量负荷的多步预测问题。基于集成经验模态分解(EEMD)方法,通过二次分解有效分离时间序列中不同频率的信号,采用长短期记忆网络(LSTM)对各信号子序列进行独立预测,最后组合预测结果。实验结果表明,本方法能很好的预测工业需量负荷变化,MAPE/MAE/NRMSE精度指标基本控制在2%以内,明显优于多种现行主流时序预测模型和最新文献方法,且消除了多步预测的传递误差,预测模型精度和稳定性满足需量控制要求。
关键词:负荷预测;电能需量;EEMD;LSTM
Abstract:The maximum demand control of large power users is an important technical means to reduce the peak load of power grid and save the cost of power users. Aiming to control the industrial power demand characterized by strong fluctuation and impact, this paper studies the multi-step forecasting problem of ultra-short term demand load. Based on the integrated empirical mode decomposition method, the signals with different frequencies are effectively separated by twice decomposition. Then, the long short memory neural network is used to independently predict different signal subsequences, and finally the subsequence prediction results are combined. The experimental results show that the proposed method can well predict the industrial demand load, and the indices of prediction accuracy, such as MAPE, MAE, and NRMSE, are all controlled within 2%, and are significantly better than several classical time series prediction model, as well as the latest literature algorithms. The transfer error is also eliminated in the method, which represents good prediction accuracy and stability to meet the demand of demand control.
Key words:load forecasting; electricity demand; EEMD; LSTM
峰值負荷是影响电网运行稳定性的重要因素,负荷在时间上的不均衡将产生巨大的峰谷差,威胁电网的安全运行和降低电网运行经济性。因此,针对大型电力用户,目前普遍实现两部制电价[1],即由需量电费和电度电费构成总体用电成本,大电力用户可以通过有效的需量预测和控制技术降低峰值负荷,从而节约需量电费成本,并促进电网安全经济运行。针对工业电力大用户的需量预测问题开展研究。在实际生产场景中,工厂能源网络结构复杂,电能需量负荷受多种设备共同影响,超短期的冲击性波动负荷往往难以预测。同时由于需量计费模式的特点,往往对未来一段时间内的需量进行连续多步预测以实现负荷的有效控制,进一步加大了预测的难度。
需量负荷预测实际上是经典的时间序列预测问题。从不同预测周期的长短进行划分,电力负荷预测通常划分为长期、中期和短期/超短期问题[2-4]。与长期、中期负荷相比,短期/超短期负荷具有非平稳非线性特征,通常不具周期性。其中,短期负荷容易受到包括重大活动、天气变化等各种外部因素的影响[5],而超短期负荷更多受自身内在规律控制,受外部因素影响较小。
因良好的非线性逼近和自适应学习能力,人工神经网络、支持向量机、极限学习机等机器学习方法在短期/超短期负荷预测上得到了广泛应用[6-8]。目前最常用的时间序列分析机器学习模型主要是循环神经网络(RNN)及其改进版本长短期记忆网络(LSTM),这主要得益于该类模型良好的时间上下文关联分析能力。传统机器学习模型参数的选取对经验依赖高,由于参数对模型性能有着至关重要的影响,很多学者尝试引入参数优化方法改善模型。文献[9-11]分别采用蚁群优化、粒子群优化等群体智能算法对参数进行优化,文献[12]利用受限玻尔兹曼机对深度神经网络参数预训练,以上方法在电力负荷预测中均取得了比经验参数模型更好的效果。
图1 最大电能需量控制流程考虑原始负荷序列包含多种信号的交叠,采用原始数据序列预测难以有效区分交叠子信号中的隐含特征,对原始数据序列采用信号分解方法得到不同模式的子序列,成为提高预测精度的另一方法。经验模态分解、变分模态分解、小波分解等信号处理方法均被用于负荷预测中[13-16],通过将负荷数据序列分解为不同评率特征的子序列,对子序列进行独立预测和结果组合,可以实现预测精度提升,表明了信号分解对复杂时间序列预测的有效性。近年来随着深度学习人工智能的发展,深度学习在负荷预测中得到了较好应用 [17-19],其优势在于挖掘数据隐含的深层特征。信号分解加深度学习可以实现特征分离和特征挖掘的良好互补,在负荷预测领域展现出巨大潜力[20-21]。
考虑的电能需量是一种频繁波动和冲击性短时负荷,实现生产环境中所需的高精度预测模型存在难度。针对工业电力大用户的超短期电能需量多步预测问题,本文将重点研究基于EEMD的信号分解方法,通过二次分解有效分离不同频率的信号,在此基础上采用深度时序神经网络对不同信号子序列进行独立预测及预测结果组合,提高预测精度和模型稳定性。
1 问题描述
电能需量是一种特殊的电力负荷,是按一定时间间隔计算的功率平均值,实际应用中的时间间隔一般为15分钟,是一种典型的超短期分钟级负荷。为保障用电平稳,售电部门针对电力大用户实施两部制电价,根据结算周期的最大需量值单独计算电力用户的需量电费。该种模式下,短时峰值需量将导致整个结算周期的高昂需量电费,为此电力大用户通常实施最大需量控制来降低电费成本。
对工业电力大用户而言,其能源网络结构复杂,由于影响因素多,计算周期短,需量负荷经常呈现瞬时冲击特性,准确预测困难。当需量预测值比实际值大时,容易造成最大需量的误报,影响用户的用电体验;当预测值比实际值小时,容易造成最大需量的漏报,使得实际最大需量超过预设限定值,增加需量电费成本。为实现有效的最大需量控制,首先要保证需量预测模型的精度及稳定性。
此外,工业电力负荷按设备和工艺特点,存在多种负荷类型,为实施最优需量控制,需要考虑各类负荷的特点,综合采用多种策略调节负荷实现需量负荷避峰。为保证各类负荷调节的反应时间,需量预测需要给出未来多个连续间隔周期内的需量负荷值,即基于历史负荷序列{xi-n+1,…,xi-1,xi},预测未来负荷序列{xi+1,xi+2,xi+m,其中,xi为第i个时间间隔的需量负荷值,n和m分别负荷预测的输入和输出步长。如图1描述了本文研究中所需的预测1/3/5分钟提前期的需量负荷。
2 基于二次EEMD的需量预测方法
2.1 集成经验模式分解(EEMD)
经验模态分解(EMD)是一种用于非平稳信号分析的数据处理方法,它能将复杂信号分解成拥有物理意义的多个本征模态函数(IMF)和一个残差序列,IMF可以作为后续分析方法的输入,以完成复杂的工作。任意时刻t的原始信号x(t)与IMF分量的关系可以表示为
与快速傅里叶变换、小波分解等常用信号分解手段相比,EMD可以根据信号本身特征进行分解,不用事先确定基函数,分解过程简单直观。但是受原始序列时间尺度特征影响,EMD存在着模态混叠问题,影响了分解的质量及其应用。针对EMD分解方法的模态混叠问题,噪声辅助分析方法集成到EMD中,提出了EEMD方法,其流程是:
(1)在原始序列中加入给定振幅的噪声序列;
(2)将加入噪声后的时间序列进行EMD分解得到该时间序列的固有模态函数子序列;
(3)按设定迭代次数重复(1)和(2)操作;
(4)將所有迭代次数中得到的固有模态函数子序列求集合平均,作为最终的固有模态函数子序列分解结果;
(5)将原始时间序列减去所有最终的固有模态函数子序列之和,得到残差序列。
本文噪声采用振幅标准差为0.05的高斯噪声,迭代次数设为100。由于EEMD有效处理了模态混叠问题,可以得到更好好的IMF分量,因此EEMD得到了比EMD更广泛的应用,已有研究表明基于EEMD信号分解可以显著提高时间序列预测精度。
2.2 基于二次EEMD的需量预测方法
经验分析表明,EEMD分解得到的低频子序列虽然变化较为平缓,但是振幅大,代表了时间序列的整体变化趋势;高频子序列振幅不大,体现了时间序列中的随机信息。在对IMF子序列进行预测时,低频子序列通常能够较好拟合,而高频子序列拟合比较困难,若能对高频子序列更好预测,模型精度有望进一步提高。为此,考虑对高频子序列叠加后进行二次分解,并提出一种基于二次EEMD的需量预测方法T-EEMD-LSTM,具体步骤如下:
步骤一,收集历史负荷数据构建负荷时间序列;
步骤二,对时间序列中的数据进行清理和归一化等预处理操作;
步骤三,一次EEMD分解:利用EEMD信号分解算法将原始时间序列分解成若干个IMF子序列和残差序列,其中IMF子序列按频率分为高频子序列、低频子序列;
步骤四,二次EEMD分解:对步骤三中得到的高频子序列相加求和合成新的序列,归一化后利用EEMD分解算法对新的序列再次分解,得到分解后的若干个IMF子序列和残差序列r,具体流程如下:
以上所提出的T-EEMD-LSTM预测方法的总体流程框架如图2所示。
2.3 LSTM神经网络模型设计
本文所提出的预测方法中,对各个IMF分量和残差序列采用长短期记忆网络LSTM进行预测。LSTM将RNN的每个循环单元转变为更复杂的模拟计算机单元,适于进行反向传播和梯度下降所需的偏微积分计算,克服了梯度消失问题,能有效减少模型训练时间并提高学习长期依赖信息的能力。图3描述了LSTM循环单元基本结构,引入细胞状态c代表需要沿时序传递的信息,并通过遗忘门、输入门和输出门三个门来保护和控制c。图中xt为t时刻输入,ht为t时刻输出,ft为遗忘门的输出,it为输入门的输出,ct为t时刻细胞状态,ot为输出门的输出。
图4 LSTM网络分层结构本文方法中的LSTM网络采用如图4所示的多层结构:第一层为Input输入层,输入特征矩阵;第二和第四层为LSTM长短期记忆网络层;第三和第五层为Dropout层;第六层为Dense全连接层,采用线性激活函数根据输出维度输出结果。在构建本文实例模型时,两层LSTM网络分别设置为50个和100个隐层单元,激活函数为sigmod和tanh函数,输入数据被构造为(None, 10, 1)形状的张量结构给输入层,输出层对应(None, 5)形状的矩阵结构,LSTM层后的Dropout层丢弃率为0.2。为保证超参数选择的鲁棒性,采用Adam算法作为模型优化器的优化算法。
LSTM网络模型采用多输入多输出方式,模型的输入数据为由参数<批量大小,输入步长,输入维度>决定的张量形式,其中批量大小对应一次输入给模型的样本个数,本文取值为512,输入步长即取预测时刻前多少个时间步长的序列值,取值为10,对应LSTM网络中循环单元的循环次数。输出数据为由<批量大小,输出步长>构造的矩阵,其中输出步长表示需要预测未来多少个时刻的序列值,本文取值为5。
3 案例及实验结果分析
针对某钢铁厂实际环境,使用所提出的模型进行超短期需量负荷预测,预判未来1/3/5分钟后的计算周期内是否需量超限。如图5所示,该钢铁厂能源网络结构复杂,各类负载设备具有不同的负载特性和生产节奏。利用智能电表对电力需量负荷进行采集,间隔时间为30秒。从采集到的原始数据中随机抽取数据划分训练集和测试集,构建的4个测试集TS1~TS4分别包含867、940、930、977个数据样本。为分析时间序列特征,对4个测试集数据作时序图,如图6所示。该图中横坐标单位为分钟,纵坐标是归一化后的需量负荷值。从时序图可以发现,该需量负荷数据具有强烈波动性和局部冲击性,同时没有明显周期性,鲜明体现了超短期电能需量负荷的特征。通过时序图可以判断该需量负荷时间序列是非线性非平稳的,不存在明显的周期性,为提高预测精度有必要实施信号分解。
3.1 EEMD信号分解与分量预测
原始需量负荷序列经过EEMD分解后,转化为IMF子序列和残差序列。对数据集TS1进行分解,图7给出了部分IMF分量和残差分量及其一分钟提前期预测的拟合效果图。从图中可以看出:IMF1和IMF4频率高,基本在零值附近波动,主要反映原始负荷的随机信息和可能未完全抵消的白噪声。IMF7到IMF10存在周期性趋势,代表原始序列的周期分量,在所有分量中占比最大,是预测的核心基础数据。IMF13、IMF16呈现原始负荷序列的长期趋势,频率低波动缓,易于预测。
3.2 总体预测结果及分析
对个分量预测结果按公式(3)和(4)方法进行组合,得到如图8所示的整体预测拟合曲线图。图中从上往下依次是未来1/3/5分钟的需量负荷曲线图,绿色表示需量负荷真实值,红色为模型预测值。可以看出,基于二次分解的模型预测效果更好,基本和真实曲线重合,并且消除了一次分解预测出现的局部抖动问题。
采用时间序列分析中常用的平均绝对百分误差 MAPE、平均绝对误差MAE、标准均方根误差NRMSE作为预测精度指标,基于多次预测的统计指标值评估模型的整体性能。将本文方法与多种其他模型进行性能对比,包括文献[12]中的EEMD和LSTM融合模型EEMD-LSTM,文献[18]中的LSTM集成模型BSB-LSTM,以及文献[18]中采用的系列主流经典时序模型,得到如表1所示的4组测试集上的指标平均值衡量模型性能。
可以看出, LSTM和Seq2Seq具有较优异的预测精度,其预测误差明显小于一般机器学习模型SVR和DBN,RFR和XGBoost等树学习模型具有与LSTM、Seq2Seq相近的性能。文献[18]方法具有总体较好的精度和稳定性等性能优势,但是与前述模型一样都存在一个共同的问题,即多步预测中的传递误差,其1/3/5分钟的MAPE指标逐渐增大。与上述模型相比,EEMD-LSTM在降低传递误差方面有明显改善,并且MAPE、NRMSE、MAE指标均维持在较低水平,这主要得益于信号分解得到的子序列实现了周期性、趋势性以及随机信号、噪声信号的分离,面向子序列的独立预测模型在不同特征信号的处理上各具优势。最终我们可以发现,本文模型显著提高了预测模型的精度,MAPE、NRMSE、MAE各项误差指标值基本控制在1%~2%之间,与采用一次分解的EEMD-LSTM相比降低了大约50%,在所有对比算法中具有突出的性能优势,且消除了多步预测的传递误差。本文模型的较优性能,一方面是利用EEMD二次分解可以提高高频子序列的预测精度,进而提高总体预测的效果;另一方面,从EEMD分解重构理论上来说,EEMD分解只要经过足够迭代次数就能够消除噪声对原始序列的影响,在实验过程中,对一次分解得到的子序列进行重构还原,利用模型评价指标和原始数据进行对比发现存在误差,然而继续增加迭代次數消耗的时间对于降低误差而言,性价比并不是很高,而对高频子序列再次分解后得到的所有子序列进行重构还原,在相同的迭代次数下原始数据误差却大大减少。因此,高频子序列二次分解降低了随机信号和噪声对子序列重构的影响,提高了预测模型的精度。
以上结果和分析表明,提出的预测模型具有较高精度和稳定的多步预测结果,可以较好的满足生产环境中最大需量控制对需量预测的要求。
4 结 论
(1) 提出了一种基于二次EEMD的超短期工业电能需量预测方法,通过复杂时间序列的二次分解和独立预测,实现了较高的预测精度和模型稳定性,可以为需量控制应用提供支撑;
(2) 针对非线性非平稳原始时间序列的多步预测,一般机器学习模型存在传递误差的问题,通过信号分解实现特征分离,可以降低传递误差,保证较高的多步预测精度;
(3) 高频子序列二次分解减轻了EEMD分解算法中随机和噪声信号对分解得到的子序列重构产生的影响,使得对于高频子序列可以获得更好的预测效果,最终提高模型预测整体精度。
参考文献
[1] 张粒子, 张伊美, 叶红豆, 等. 可选择两部制电价定价模型及其方法[J].电力系统自动化, 2016, 40(3):
59-65.
[2] 王丽, 朱文广, 杨为群, 等. 基于灰色神经网络与灰色关联度的中长期日负荷曲线预测[J]. 武汉大学学报(工学版), 2019, 52(1):
58-64.
[3] 刘雨竹, 徐楠. 基于混沌时间序列的IGA-WLSSVR短期负荷预测模型[J/OL]. 控制工程, 2019, 1-6, DOI:
10.14107/j.cnki.kzgc.20190495.
[4] 李国庆, 刘钊, 金国彬, 等. 基于随机分布式嵌入框架及BP神经网络的超短期电力负荷预测[J]. 电网技术, 2020, 44(2):
437-445.
[5] 牛东晓, 李媛媛, 乞建勋, 等. 基于经验模式分解与因素影响的负荷分析方法[J]. 中国电机工程学报, 2008, 28(16):96-102.
[6] 许梁, 孙涛, 徐箭, 等. 基于函数型非参数回归模型的中长期日负荷曲线预测[J]. 电力自动化设备, 2015, 35(7):
89-94.
[7] 蒋建东, 石洋涛, 燕跃豪, 等. 基于改进烟花算法的极限学习机超短期负荷预测[J/OL]. 郑州大学学报(理学版), 2020, 1-6, DOI:
10.13705/j.issn.1671-6841.2020028.
[8] 龙文, 梁昔明, 龙祖强, 等. 基于改进蚁群算法优化参数的LSSVM短期负荷预测[J].中南大學学报(自然科学版), 2011, 42(11):
3408-3414.
[9] LIU N, TANG Q, ZHANG J, et al. A hybrid forecasting model with parameter optimization for short-term load forecasting of micro-grids[J]. Applied Energy, 2014, 129:
336-345.
[10]马小津, 朱博, 戴琳, 等. 基于改进PSO-LSSVM的短期电力负荷预测[J]. 自动化技术与应用, 2016, 35(3):
5-9, 19.
[11]RYU S, NOH J, KIM H. Deep neural network based demand side short term load forecasting[J]. Energies, 2016, 10(1):
1-20.
[12]马梦冬, 彭道刚, 王丹豪. 基于EEMD-LSTM的区域能源短期负荷预测[J]. 浙江电力, 2020, 39(4):
29-35.
[13]徐军华, 刘天琪. 基于小波分解和人工神经网络的短期负荷预测[J]. 电网技术, 2004(8):
30-33.
[14]孔祥玉, 李闯, 郑锋, 等. 基于经验模态分解与特征相关分析的短期负荷预测方法[J]. 电力系统自动化, 2019, 43(5):
46-56.
[15]张淑清, 宿新爽, 陈荣飞, 等. 基于变分模态分解和FABP的短期电力负荷预测[J]. 仪器仪表学报, 2018, 39(4):
67-73.
[16]QIU X, REN Y, SUGANTHAN P N, et al. Empirical mode decomposition based ensemble deep learning for load demand time series forecasting[J]. Applied Soft Computing, 2017, 54:
246-255
[17]SHI H, XU M, LI R. Deep learning for household load forecasting-a novel pooling deep RNN[J]. IEEE Transactions on Smart Grid, 2018, 9(5):
5271-5280.
[18]TAN M, YUAN S, LI S, et al. Ultra-short-term industrial power demand forecasting using LSTM based hybrid ensemble learning[J]. IEEE Transactions on Power Systems, 2019, DOI:
10.1109/TPWRS.2019.2963109
[19]张林, 刘继春. 基于EEMD-SE和PSO-KELM的短期负荷区间预测方法[J/OL].中国电力, 2020, 1-10,
[20]邓带雨, 李坚, 张真源, 等. 基于EEMD-GRU-MLR的短期电力负荷预测[J]. 电网技术, 2020, 44(2):
593-60.