基于数据挖掘的SVM短期负荷预测方法研究


第 26 卷 第 l8 期 2006 年 9 月 中 国 电 机 工 程 学 报 P ro ceed ing s of the C S E E V o 1.26 N o .18 S ep .200 6 0 2006 C h in .So c .fo r E lec.E ng 文章编号 :0258—80 13 (2006) 18一O0O6—07 中图分类号:TM 74 文献标识码 :A 学科分类号 :470·40 基于数据挖掘 的 S V M 短期负荷预测方法研究 牛东晓,谷志红,邢 棉,王会青 (华北 电力大学工商管理学院,河北省 保定市 071003 ) S tu d y o n F o re ca stin g A p p ro a ch to S h o r t-term L o a d o f S V M B a sed o n D a ta M in in g N IU D o n g —x ia o ,G U Z h i—h o n g ,X IN G M ian ,W A N G H u i—q in g ( S ch oo l o f B u siness A d m inistratio n ,N orth C h in a E lec tri c Po w er U niv ersity ,B aod in g 07 100 3 ,H eb ei P rov in ce,C h in a) A B S T R A C T : T h e sup p ort vecto r m ach in e (s v M ) h as been successfully applied to the load forecasting area,but it has so m e d isadv an tag es of v ery lar ge d ata am o un t an d slo w pro cessin g sp eed . U sin g ad van tag es o f th e data mi n in g techn olog y in p rocessing lar g e da ta an d e limi na tin g red un d an t inform ation ,a S V M forecasting sy stem b ase d o n data mi ning p reproc ess w as p ropo sed to sear ch th e h isto ric al d aily lo ad w ith th e sanqe m e teoro lo gical categ ory as th e fo recastin g d ay an d to com po se da ta sequ ence w ith h ighly simi lar m eteo rolog ical fe ature s.T ak in g th e new data seq u en ce as th e tra in ing d ata o f S V M ,th e d ata am ou n t w as d ec reased an d th e p rocessing speed w as im p rov ed .T his app roach has achieved grea ter fo reca sting accurac y com p arin g w ith th e m eth o d o f sin g le S V M an d B P n eural netw o rk . K E Y W O R D S : po w e r sy stem :d ata mi n ing : m eteorolo g ical factor: sup po rt v ecto r m ach in es: sho rt —term lo ad forec asting 摘要 :支持 向量机方法 已成功地应用在 负荷预测领域 ,但它 在训练数据时存在数据处理量 太大、处理速 度慢 等缺 点。为 此提 出了一种基于数据挖掘预处理的支持 向量机预测系统 , 引用在处理大数据量 、消除冗余信息等方面具有独特优势 的 数据挖掘 技术,寻找与预测 日同等气象类 型的多个历史短期 负荷 ,由此组成具有 高度相似气象特征 的数据序列 ,将此数 据序 列作为支持 向量机 的训练数据 ,可减少数据量 ,从而提 高预测 的速度和精度 ,克服支持 向量机 的上述缺 点。将 该系 统应用于短期负荷预测 中,与单纯 的 SV M 方法和 B P 神经网 络法相 比,得到了较 高的预测 精度 。 关键 词:电力系统 ;数据挖掘 ;气象 因素;支持 向量机;短 期负荷预测 0 引言 在 96 点短期负荷预测工作中,影响预测精度提 基金项 目:国家自然科学基金项 目(50077007);河北省 自然科学 基 金项 目 (G 2005000584)。 Project Supported by N ational N atural Science F oundation of C hina ( 50 0 7 70 0 7 ). 高的最大困难就是短期负荷受到多种随机干扰因 素的影响和需要多种不同的预测模型拟合。其中, 对短期负荷 曲线变化影响最大 的干扰因素是气象 因素 ,如果不考虑气象 因素,无论采用何种技术建 立预测模型,均会导致预测失败 ,且误差较大,影 响电网的稳定运行 。目前 ,其他研究人员一般情况 下采用人工神经网络模型、遗传算法模型和小波分 析模型IJ4 进行短期负荷预测,其中人工神经 网络模 型应用最为广泛。但普通神经网络模型[5-6]大多不考 虑气象 因素影响,并且出现了一些新的问题 。例如, B P网络学习算法实际上是利用梯度下降法调节权 值使 目标函数达到极小 ,而 目标函数仅为各给定输 入和相应输出差的平方和,导致了B P 网络过分强调 克服学习错误而泛化性能不强;隐单元的数 目难以 确定,网络的最终权值受初始值影响大等 。 最近 ,由贝尔实验室的 Vapnik 等提 出了一种被 称为支持向量机(Support V ector M achines,SV M )的 机器学习算法 】,它与传统的神经 网络学习方法不 同,实现 了结构风险最小化原~ (SR M ),它同时最 小化经 验风 险,对未来样本有较好 的泛化性 能。 SV M 的另一优点是它的训练等价于解决一个线性 约束的二次规划问题,存在唯一解。 目前 SV M 已 经扩展为解决非线性回归估计 问题,而且与神经网 络方法相比,有着显著的优越性 。但是,经典的 SV M 算法在处理大数据量的模式分类和时间序列预测 等方面存在速度慢、时间长的缺点 。 基于以上分析,在此提 出了一种提高负荷预测 精度的新观点,认为提高负荷预测精度的关键在于 历史数据的预处理方式和预测模型 的改进,并提出 了基于数据挖掘的支持 向量机 短期负荷预测新方 维普资讯 http://www.cqvip.com 第 18 期 牛东晓等 : 基 于数据挖 掘的 SV M 短期 负荷预测 方法研 究 7 法 :先通过天气预报了解预测 日的整 日气象特征, 再利用数据挖掘技术寻找 与预测 日同等气象类 型 的多个历史短期负荷,组成具有高度相似气象特征 的数据序列,从而减少 SV M 的训练数据;据此再 构建支持 向量机预测模型。将该系统应用于某地区 短期负荷预测 中,与 B P 神经网络及标准 SV M 方法 相 比,得到了较高的预测精度,计算速度也得以提高, 从而表 明了 以数 据挖 掘 技术 作 为信 息预 处理 的 SV M 学习系统的优越性。 1 数据挖掘 与 S V M 简介 1.1 数 据挖掘 数据挖掘就是使用模式识别技术、统计和数学 技术,在大量的数据中发现有意义的新关系、模式 和趋势的过程,也就是从海量数据中挖掘 出可能有 潜在价值的信息技术 ⋯ 。它可实现以下功能: (1) 分类 。按分析对象的属性 、特征 ,建立 不同的组类来描述事物,用于预测事件所属的类别。 (2 ) 聚类 。识别 出数据分析 内在的规则 ,按 照这些规则把对象分成若干类 。 (3) 关联。发现有联系的事件或记录,由此 推断事件间潜在的关联,识别可能重复发生的模式。 (4 ) 预测。分析掌握对象的发展规律 ,对未 来的趋势做 出预见。 1.2 SV M 方法 SV M 方法是统计学习理论(SLT )的一种成功实 现,它建立在SLT 的V C (vapnik chervonenkis)~ 论和 结构风险最小化(structural risk m inim ization.SR M ) 原理基础上,根据有 限样本信息在模型的复杂性(对 特定训练样本的学习精度)和学习能力(无错误地识 别任意样本的能力)之间寻求最佳折衷 ,以期获得更 好的泛化能力【l卜 J。它有如下特点: (1) 实现 了SV M 原则,它能最小化泛化误差 的上界,而不是最小化训练误差,因此具有更好的 泛化性能。 (2 ) 与神经 网络方法相 比,SV M 有更少的 自 由参数。在SV M 算法中仅有3个 自由参数,而神经 网络却有大量的 自由参数,需要凭经验主观选择。 (3 ) 神经网络不一定能收敛到全局最优解,容 易陷入局部最优解 。而在SV M 算法 中,训练SV M 就 等价于解一个具有线性约束的二次凸规划 问题,因 而它的解是唯一的、全局的和最优的。 SV M 的缺点是不能确定数据 中哪些知识是冗 余的,哪些是有用的,哪些作用大,哪些作用小。但 由于SV M 具有 良好 的泛化性能,目前 已经成功地推 广应用到了模式识别、函数逼近 、信息融合、时间 序列预测等领域。 2 基于数 据挖掘 的 S V M 预测方法 2.1 数据挖掘预处理 根据数据挖掘的基本概念和功能,本文将模糊 分类器和灰色关联技术联合起来,设计 了一种具有 分类和关联功能的数据挖掘技术,步骤如下: (1) 短期负荷气象影响模糊分类器。 对负荷影响较大且天气预报可 以给 出的因素 有 日最高温度、日最低温度、日平均温度和 日降雨 量,如果条件具备 ,还可以增加其它因素。以本文 实例所用 电网为例 ,为了得到气象因素与负荷变化 之间的关系 ,做散点图如图1。从图1可以看出:电 力负荷随着最低温度的变化成非线性规律变化 ,即 最低温度对 电力负荷有 明显的影响。同样的道理, 可以作其他气象因素与历史负荷值散点图。从中可 以得出结论:最高气温 、最低气温、天气状况、湿 度对每 日负荷有较明显的影响。 现对这 4 类 因素进行模糊赋值分类 ,对这 4 类 气象因素的模糊性描述语言用数值 向量表示出来, 分类情况用向量 (Z 】, , ,Z4) 表示。Z 】、Z2、 Z3 分别代表 日最高温度 、日最 低温度和 日平均温 度 ,由于各地气温的低、中、高标准不同,并且 日 最高温度是低、中或高也有不同的标准,因此可按 本地区的实际情况确定一定的模糊化标准,将三者 分类为低、中、高,分别取值 1、2、3; Z4代表 日 降雨量 ,雨量的小、中、大标准各地也不同,也可 按地区特点设定,或采用模糊聚类分析方法确定, 可将其分类 为无雨、小雨、中雨、大雨 ,分别取值 为 0 、1、2、3,则可将每 日的历史负荷分类如下 : (Z 1,Z 2,Z 3,Z 4)= Z 1 = 1,2 ,3 Z 2 = 1,2 ,3 Z 3 = 1,2 ,3 乙 = 0 ,1,2 ,3 每 日将历史短期负荷 曲线 96 点输入数据库 ,同时 输入每 日的气象影响因素的模糊分类标记,例如 : 昨日最高温度中等,平均温度 中等 ,最低温度高等 , 有 中雨,则昨 日的气象模糊分类类别是 (2,2,3, 2 ),这样,每 日都有一个气象模糊分类标记。 如果根据气象预报知道预测 日气象类别是 (2, 2,3 ,2),则从历史负荷库中反向抽取具有 (2,2, 3,2 ) 类别特征的历史负荷 日,将具有这一气象特 维普资讯 http://www.cqvip.com 8 中 国 电 机 工 程 学 报 第 26 卷 征的所有负荷 日抽出,形成一个气象模糊分类库, 这个库中的所有负荷 日都具有 (2 ,2,3,2 ) 这一 气象特征。 (2 ) 根据灰色关联分析方法选定预测所需负 荷 日数据 。 第 (1) 步所建的 同一类别气象模糊分类库 中 的负荷 日只是挖掘 出了粗糙相似 的气象特征,为了 提高预测精度 ,再运用灰色关联分析理论 ,在分类 库 中进一步抽取与预测 日具有高度关联 的若干历 史负荷 日,以这些负荷 日作为下一步预测建模的历 史数据。这些历史负荷 日通过联合数据挖掘技术中 的分类和关联,达到了在气象特征上与预测 日气象 特征的高度一致,用此来建模,无疑将较大地提高 负荷预测的精度。 1) 灰色关联分析理论 。 关联分析是灰色系统理论提 出的一种分析系 统中各因素关联程度的方法 ,其基本思想是根据 曲 线问相似程度来判断关联程度 。计算步骤如下: ①构造序列矩阵。在通过模糊分类器对历史负 荷进行 了初步分类挖掘并形成 了与预测 日具有相 似气象特征的历史数据分类库后,进一步进行关联 排序分析。参考序列(又称预测 日气象特征)用 表 示,若预测 日气象预报为最高气温 40℃,平均气温 3O℃,最低气温 2O℃,雨量 15m m ,则 :[To(1), To(2),To(3), (4)】:(40 ,30 ,20, 15)。 同理 用 已 得分类库中的每 日气象数据组成比较序列,以 , , ⋯ , 表示,这 n+ 1 个序列构成序列矩阵如下: l To(1) (1) ⋯ (1) J (ro, ⋯ ., ):l I I I I l (1) l (,,z) (,,z) ⋯ T (,,z)j ②无量纲化 。为消除量纲,用初值化方法进行 数据处理 。采用式(2)得无量纲矩阵如式(3)所示: T/(k): (k)/T~(1),i:0,1,2⋯ ., ;k:1,2⋯ .,m (2) 『.To(1) ,(1)⋯ (1)] ( , :, ⋯ ., )=l l l l I1 (3) 【-To(m) ,(,,z)⋯ Tg(m)j ③计算关联系数 。 (k ) : ㈣ I . ( )一 ( )I+ m m I. ( )一 ( )I 式中,i:O,1,2⋯ ., ; k :1,2⋯ .,m ,p e [O ,1】,P 为分辨系数 ,通常取 =o.5 ,得关联系数矩阵为 I (1) ⋯ (1) l I I I I I (5) I 。(,,z) ⋯ (,,z)l ④计算关联度 。 ro 一 ) , i- 1,一,.2 ⋯ (6) 2) 确定预测建模所需历史负荷序列。 本文 以预测 日的气象 因素指标 向量 为参考序 列 ,通过模糊分类器所得气象分类库中提供的历 史数据 中每一 日的气 象因素指标 向量为 比较序列 , 计算 与 之间的关联度 。设定一阈值 取关联度 rf≥ 负荷 日,或给定一 n 值,一般 n 取 5^7 即可够建模使用,按关联度从大到小的顺序 取前 n 个负荷 日,然后将这些负荷 日按时间先后排 序作为新的历史数据序列 ,这样就完成 了挖掘提取 工作 。 最 小温度 /℃ 图 1 最小温度与高峰负荷关联散点图 F ig .1 D ia g ra m of relation sca tte rs po ints b etw een th e m in u test tem p eratu re a n d pe a k -lo ad 2 .2 S V M 预 测原 理 用 SV M 算法估计回归函数时,其基本思想是 通过一个非线性映射 把输入空间的数据 X 映射 到一个高维特征空间中去,然后在这一高维空问中 作线性回归 钔。 给定一数据点集如下 : G : ,d 式中:X 为输入向量; 为望值;n 为数据点的总数 。 SV M 采用下式来估计函数 : Y = 厂( )= 岔 ( )+ 易 (7) 式 中: 为从输入空问到高维特征空间的非线性 映射;系数 b 通过最 小化下式来估计 。 Ⅷ (c):c n i= 1 [d , ( 6]+111,~1 (8) 式(8)中,采用 Vapnik 的坏 敏感损失函数为 : 其 目的是用稀疏数据点来表现 由式(7)给 出的决策 函数 。在式(8)给 出的正则化风险泛函中,第 1 部分 维普资讯 http://www.cqvip.com 第 l8 期 牛东晓等: 基于数据挖掘 的 SV M 短 期负荷预 测方法研 究 9 c ∑ [ ,Y 是经验风险,它们由坏 敏感损失函 ” f= l 数来度量。第2 部分l l /2 是正则化部分,c是正 常数,它决定着经验风险与正则化部分之间的平衡。 为了寻找系数 b,需要引入松驰变量 毒和 ,使下式成立 : (minimize Rs (∞, ’)=去II刮I2+c∑(毒+ ) l 1 _《s-t. ( )+bi—d ≤ + ≥ 0 (9) I di一 ( )- bi≤ + ≥ 0 最后,依靠引入拉格 朗日乘子 和 OC*,由式(7)给 出的决策函数就变成下面的精确形式: Y= f(x, , ):∑( 一 )^=( ,Xf)+易 (10) i= 1 对任 何 f- l,⋯ ,n 都有 等式 ×ai --0, ≥ 0, ≥ 0 成立。要使式(9)成立,在 引入拉格朗 日乘子 后,就可以把这一 凸优化 问题简化为对一个二次优 化 问题寻找向量 问题,在这种情况下 ,要找到 所求的向量: 国=∑( 一 ) (11) J‘一、 ‘ I l 、 i= 1 此时必须找到参数 和 ,i= 1⋯ .,n,使下式成立: m a x im iz e R(ai, )=一 ∑( + )+∑d ( 一 )一 i= 1 i= l 寺∑( 一 )( 一oej)K(x , 』) (12) 厶 f,j= 1 s.t.∑OCi= ∑ai ,0≤ ≤ c,0≤ ≤ c i= 1 i= 1 通过在二次优化方法中控制 C 和 参数,就可 以控S U(~IJ使在高维空间中)SV M 的泛化能力 。根据 二次规划中的库恩— — 塔克条件,在式(12)中系数 (a i 一ag)只有一部分数 目是非零值,它们所对应的 数据点就是支撑向量 。这些数据 点位于决策函数的 界上或在边界外 。在方程(12)中,由于其它数据 点的系数 ( 一 )都等于零,从而证实了在所有的 数据点中只有支撑向量能够决定决策函数 。 一 般说来 , 值越大,支撑 向量数 目就越少, 因而解的表达就越稀疏 。然而,大的 值也能降低 数据点的逼近精度,从这一意义上讲, 也是解的 表达的稀疏程度与数据点的密度之间的平衡因子。 在式(12)中,K (x X )称为核 函数,核函数的值等于 2 个 向量 X 和 X 在 其特 征 空 间 中 的像 ( ) 和 ( i)的内积,即: K (x , ) = ( )× ( ) (13) 任何函数只要满足 M ercer 条件都可用作核函数 ,采 用不 同的函数作为核 函数 ,可以构造实现输入空间 中不 同类型的非线性决策面的学习机器 。 2 .3 基于数据挖掘的 SV M 预测模型 2.3.1 基于数据挖掘的SV M 结构 从前面分析 的数据挖掘技 术和SV M 方法各功 能、特点中可发现它们存在2个互补性的差别: (1) SV M 处理信息一般不能将输入信息空间 维数简化,所 以当输入信息空间维数较大时,就会 导致SV M 训练时间较长,而数据挖掘技术却能够通 过发现数据间的关系,既可 以去掉数据 中的冗余信 息,又可以简化输入信息的数据空间维数。 (2 ) 数据挖掘技术在实际应用过程 中对噪声 比较敏感 ,因而用无噪声的训练样本学习推理的结 果在有噪声的环境中应用效果就不太好 ,也就是说 数据挖掘技术 的泛化性能较差,而SV M 方法有较好 的抑制噪声干扰的能力 ,且具有 良好的泛化能力。 因此,根据它们的互补性把两者结合起来,用 数据挖掘技术先对数据进行预处理,使得历史数据 序列的变化规律有较大的简化、随机性弱化且含预 测 日气象特征,以便建立支持 向量机预测模型时可 以不再重复考虑气象特征的输入,就可使预测结果 自然含有预测 日的气象特征,使模型训练速度明显 加快。再根据数据挖掘预处理后的信息结构来构成 SV M 的信息预测系统。这种系统的结构如图2所示。 在图2中,假设训练样本为G :{.fXl d 1l ,其 中 X ∈R d ,是输入向量 ;v;∈R 是期望值:,z是数 据点的总数。在所有输入向量中,假设支持向量有Ⅳ 个,分别为 SV,, ⋯ ., 相应的满足M ercer条 图 2 基于数据挖掘的支持 向量机结构图 F ig .2 Struc tu re of su p p ort vecto r m a ch in es b a sed o n d a ta m in in g 2.3.2 SV M 算法的具体实现 在此选取Shevade等人提 出的改进SM O 算法 巧】 维普资讯 http://www.cqvip.com l0 中 国 电 机 工 程 学 报 第 26 卷 来确定拉格朗日乘子 和 以及阈值 b ,它是 目前 实现SV M 算法 中效率最高的一种,其具体实现如 图3 所示 。其 步骤 为 : (1) 输入历史数据并进行预处理。数据预处 理方法采用本文提出的联合数据挖掘技术 ,形成具 有高度相似性气象特征 的训练和测试样本集。 (2) 对SV M 的模型参数进行初始化 。将拉格 朗 日乘子 和 以及阈值b赋以随机 的初始值 。 (3) 利用训练样本建立形如式(9)的 目标函数, 然后采用改进的SM O 算法求解 目标函数式(9),得到 和 以及b的值 。 (4 ) 将得到的参数值代入式(10),用测试样本 计算未来某一时刻的预测值 。 (5) 计算误 差函数,当误差的绝对值 小于预 先设定 的某个正数时,则结束学习过程(或设置迭代 次数控制学 习过程),否则返 回步骤 (3 ) 继续学习。 开始 l输入数据l = . 数据挖掘预处理l = 二 [ 二=== 形成训练、测试样本 二二二[ 二 I 参数初始化 1 改进的 SM O 算法 一 __=二][=二 l 输出参数 I — — . 土 . 1输出预测值 I 结束 图 3 支持向量机学习算法 F ig.3 A lg orithm o f su pp o rt v ecto r m ach in es 3 实证分析 3.1 系统简介 运用本文所提新方法 ,对山西某地区电网短期 负荷预测进行研究 。该地区电网的电力负荷变化规 律受气象影响非常显著 ,季节气温变化明显 ,年温 差较大 ,雨量相对集中,农业负荷 比例很大,因此 按照通常经典预测方法和普通人工神经 网络方法 预测有较大 困难,这些方法没有考虑气象诸因素的 影响,历史负荷受到的干扰严重,明显导致预测结 果不准确。下面采用本文提 出的新方法,对该地区 电网的负荷预测 工作进行实证分析 ,并与单纯 的 SV M 模型、普通人工神经网络模型进行预测精度分 析比较。 3.2 样本选择 选取该电网 自2002 年 9 月一2004 年 8 月期间 的负荷数据库作为训练样本 ,2004 年 9 月一2o04 年 12 月期间的负荷数据作为测试样本 。对于训练 样本,通过本文提出的数据挖掘技术找 出和预测 点 在气象特性和预测时段都相同的数据作为 SV M 中 的 Y 值 ,相应的 值(即样本输入量)分为以下几类: (1) A = { l,日2,⋯ , )。预测 日之前 n 日内的在 预测时段的负荷数据。 (2 ) = { l,62,⋯ ,b )。预测 日前一 日预测时段 之前 m 的负荷数据。 (3) CI_ {cl,c2,⋯ ,C )。预测 日的气象预报,共 S 个数据 ,包含平均气温、最高气温 、最低气温、 日降雨量。 (4 ) D = { l,d2,⋯ , )。预测 日之前 n 日内的每 日气象数据,其中任何一个元素 包含 S 个如上所 述的气象数据 。 对于输入量 ,还可以根据实际情况考虑负荷的 工作 日与非工作 日、星期属性等其他因素 。 3.3 参数分析 本文采用以下高斯函数作为核函数: K (x ,X ,) = exp [- 1/ (X 一X ,) 】 (14 ) 式中 为高斯核的宽度参数。 参数的选择分别为 =20 ,c= l00 和£--0.001。 在本文研究中发现 ,核参数 。和C对 SV M 算法的表 现起着非常重要的作用 ,当分别把C和£固定在 10 和 0.00 1 时,训练集 的标准均方差随着 的增大而 增大。另一方面 ,测试集 的标准均方差随着 的增 大 而起初减 小 ,随后增 大 。这 表 明 的值太 小 (0.1—1),会对训练集造成过学 习现象, 的值太大 (100~100000),会对训练集造成欠学习现象 。 的 适合值应在 1~ 100 之间。由此可 见: 对SV M 的 泛化性 能起着关键作用 ,当分别把 和£固定在 10 和0.001时,训练集 的标准均方差随着C的增大而单 调减 小;同时,当C的值从0.1增大到10 时,测试集 的标准均方差逐渐减小;当C的值从10增大到100 时. 测试集的标准均方差几乎保持为一常量;当C的值 超过100时 ,测试集 的标准均方差开始增大 ,其原 因在于小的C值会对训练数据造成欠学习现象 ,c值 太大容 易对 训练数据造成过 学习现象而导致泛化 性能恶化 ,因此,C的适合值应在10到1o0之间:当 和C固定不变时,韵 变化对训练集和测试集 的标准 均方差的影响不大 ,这表明SV M 的性能对£不敏感 ; 当分别把 和c都固定在 10时,训练集和测试集的 标准均方差非常稳定 ,因而不受£值变化的影响: 一 般情况下 ,支持 向量 的数 目随着£的增大而减 小,然而大的£值也能降低数据点的逼近精度 ,因 此£不能太大,根据训练过程,当 .00 1时,支持 向量的数 目较少,而数据点的逼近精度也较高。 普通神经网络模型采用标准的3层B P 网络,分 维普资讯 http://www.cqvip.com 第 l8 期 牛东晓等 : 基于数据挖掘 的 SV M 短期负荷预测方法研究 11 别为输入层、隐含层和输出层。输入层的节点数为 输入 向量的分量数,取为9 ,其中5个为相似 日同一 时刻的负荷数值 ,由于普通神经网络模型并没有对 负荷序列进行数据挖掘预处理,因此负荷序列不具 有特定的气象特征 ,为了考虑气象因素影响,还需 要再加上4个气象影响因素分量 ,即:日最高温度 、 日最低温度、日平均温度和 日降雨量;输出层节点 数为 1,即短期负荷预测值;隐含层的节点数 由经 验取为5 。网络初始化 时,给定任意初始结构 ,将 各连接权值 ,)随机置到小的随机数,给定学习训 练次数(初设为100次),学习率取0.2 ,初始衰减率取 为5x 10 ,并设定学习速度r/=0.01。 表 1显示 了本文方法(D M SV M )与单纯 的SV M 方法和B P 神经网络方法训练精度的比较。由表 1可 知,D M SV M 算法的e值(见下节)小于SV M 算法和B P 算法的e值 。当训练5000次时所用训练时间D M SV M 算法为5s,而SV M 算法为30s,B P算法则为547s。由 此可见,在收敛性和训练速度上,D M SV M 算法 明显 优于SV M 算法和B P 算法。 表 1 D M SV M 与 SV M 模型和 B P 模型的 e 值 T ab .1 C o m p ariso n of e b etw ee n D M S V M ,SV M an d B P 3.4 误差测量与结果分析 本文选取平均相对误差 e 作为各种方法预测效 果判断的根据 : 1 e = ——2 咒 X 100 % (15) 式中 A (i)和 f 1分别为实际负荷值和预测负荷 值。本文以 3%为评判标准,若某点的e> 3% ,则 判定该点预测结果为不合格。定义,.为该工作 日负荷 预测结果的不合格率: ,.= [num (e > 3%)/ 】×100 % (16) 式中 num (e > 3%、为某工作 日预测结果平均 相对 误差超过3%的个数, 为负荷点总数。 为突 出本文新方法的先进性,用本文模型 (简 记为D M SV M ) 和单纯的SV M 方法、普通人工神经 网络模型 (A N N ) 对2004年9月12 日一 25 日连续14 日某 点的负荷和8月7 日的24h负荷进行预测 ,并比 较三者的精度,其结果见表2和表3。从表2和表3可 看 出本文 方法 比其他2种方法 的预测 误差 明显 要 小 。 由表2 知 :本 文方法 的相对误差 总平均值 为 2.432%,比Sv M 法 的3.09 1%和A N N 法 的3.584%,Jx, 本文方法 的不合格率平均值为4.494%,也均LP,SV M 法 的5.476%和A N N 法 的6.625%/Jx。 图4为3种模型对连续14 日负荷 的拟合 曲线与 实际负荷 曲线的对 比分析图。从图4可看 出本文方 法的拟合精度最好 ,可见本文所提方法预测效果好、 精度高,是一种新的实用型方法,按此方法处理气 表 2 2004 年 9 月 12 日— _25 日预测误差 的比较 T ab .2 C o m p a ri so n of foreca stin g e rro r from Sep tem be r 1 2,200 4 to Se p te m b e r 25,20 04 表 3 2004年8f]7 日24h预测误 差比较 T ab .3 C om p ari so n of th e 24 -h ou r foreca sting erro r of A u g u st 7 ,200 4 维普资讯 http://www.cqvip.com 12 中 国 电 机 工 程 学 报 第 26 卷 时 I司/大 图 4 三种模 型的拟合 曲线 图 F ig.4 F ittin g cu rv e o f th ree m o d els 象影响 问题 ,能够有效地提 高短期负荷预测 的精 度 ,能相对简化负荷预测模型,免去SV M 建模时的 气象特征输入量,同时,SV M 方法能有效地克服普 通网络的缺点,使预测误差进一步减小,预测精度 有了较大的提高,达到了实用的要求 。 4 结论 (1) 本文充分考虑了气象中的主要影响因素 对负荷预测的影响,提出了基于模糊分类器和灰色 关联分析的数据挖掘技术 ,对训练样本进行 了有效 的约简,提高了训练速度,并使预测结果 自然地含 有气象因素,不需要人工干预 。 (2 ) 经过数据挖掘预处理后 ,用具有更好泛 化能力和全局寻优 能力的支持向量机建立预测模 型,较好地解决了有限样本学习问题,并有唯一的 全 局最优 解 。 (3 ) 经过与单纯的SV M 模型和A N N 模型的实 际预测 比较 ,证 明本文所建模型较大地提高了短期 负荷预测 的精度和系统的实用性 ,易于软件实现, 能够有效地应用于电力负荷预测 的管理工作。 参考文献 [2】 [3】 谢宏,程浩忠,张国立,等.基于粗糙集理论建立短期电力负荷神 经网络预测模型【J】.中国电机工程学报,200 3,23(11):l一4 . X ie H on g ,C h e ng H a ozh o n g ,Z h an g G uo li,et a1 .A p ply in g ro u gh set the ory to e stab lish artifi c ial ne u ral ne tw o rks fo r sho rt term lo ad forecasting[J】.Proceedings of the C SEE ,2003 ,23(11): l一4(in C h in ese ). 邰能灵,侯志俭.小波模糊神经网络在电力系统中短期负荷预测中 的应 用 fJ】.中 国电机 工程 学报 ,2004 ,24(1):24—29. Tai N en gling ,H ou Zhijian .N ew short -term load forecasting pri nciple w ith th e w av ele t tran sfo rm fu zz y ne ural n etw o rk fo r th e po w er sy ste m [J】.Pr oc eedings of th e C SEE ,2004 ,24(11:24—29(in C hinese). 姚李孝,姚金雄,李宝庆,等.基于竞争分类的神经网络短期电力 负荷预测【J】.电网技术,2004,28( 10):45—4 8. Y ao L ix iao , Y ao Jin x io n g , L i B a oq in g , e t a1 . S ho rt —tim e lo ad fo re casti n g u sing n e ural n etw o rk b as ed o n c o m p e titiv e lea rn in g classifi cation[J】.Pow er S yste m Technology,2004,28(10):45—48(in C h in ese). [4 】 谢开贵 ,李春燕,俞集辉.基于遗传算法的短期负荷组合预测模型 【J】.电网技术,200 1,25( 8):20—23 . X ie K aigu i , L i C h u n yan , Y u Jih u i . G e netic alg o rith m b ased com bination forecasting m od el fo r short term load 【J】.Pow er System T e ch no lo g y , 2 00 1 , 2 5(8 ): 20 —2 3(in C hine se ). [5】 Senjyu T .O ne—hour-ah ead load forecasting using neural netw ork [J】.IE EE Trans.on Pow er Syst.,2002 ,l7(1): l13.118 . [6】 Youshen X ia,Jun W ang .A general projection neu ral netw ork fo r so lv in g m o n o to ne v ariatio n al in eq u al ities an d relate d o ptim iz atio n problem s[J】. IE EE Tran sactions on N eural N etw orks,2004 ,l5(2 : 3 l8 .32 8 . [7】 Shevade S K ,K eert hi S S t Bhattacharyy C ,et a1 . Im provem ents to SM O al gori thm fo r SV M regression[J】. IE EE T ran s. on N eural N e tw o rk , 20 0 0 , 1 1(5 ): 118 8 —1 19 3 . [8】 Suykens J A K ,L ukas L ,V an dew alle J.A pproxim ation using least squares support vector m achine[A 】.IE EE Int Sym po sium 07 l C ircuits and System s[C 】.G eneva,2000,(1):757—760 . [9】 C hen L D ,Toru S . D ata m ining m eth od s, applications , an d tools[J】.Inform ation system m anagem ent,2000 , l7(1): 65—70 . [10】于之虹,郭志忠.数据挖掘与电力系统【J】.电网技术,2001 .25(8): 5 8 —6 2 . Y u Z hihong ,G uo Z hizhong.D ata mi ning an d po w er system 【J】.Pow er S y ste m T ech n o lo gy , 20 0 1 ,2 5(8); 5g 一6 2 (in C h in ese ). [11】 赵登福 ,王蒙,张讲社,等.基于支持向量机方法的短期负荷预 测【J】.中国电机工程学报,2002 ,22(4):26—30 . Z h ao D en g fu ,W a n g M en g ,Z h an g Jian g sh e ,e t a1.A su p p ro t v ecto r m achines approach fo r short —term load forecasting ⋯ .Procee dings of the C S E E ,2 0 0 2 t 2 2(4 ): 2 6 ·3 0 (in C h in ese). [12】李元诚,方廷健,于尔铿 .短期负荷预测的支持向量机方法研究 fJ】.中国 电机工 程学 报 ,2003 ,23(6):55—59. L i Yuancheng ,Fan g T ingjian ,Yu E rkeng .Study of suppo rt vector m achines for short —term load forecasting[J】. Pr oc eedings of th e C S E E , 2 0 0 3 , 2 3 (6 ): 5 5 —5 9 (in C h ine se). [13】张林,刘先珊,阴和俊 .基于时间序列的支持向量机在负荷预测 中 的应用fJ】.电网技术 ,2004,28(10):38-4 1. Z hang L in,Liu X ian shan ,Y in H ejun.A pplication of suppo rt vector m ac hin e s b a sed o n tim e seq u enc e in p o w e r sy stem lo ad foreca stin g fJ】.P ow er System Technology ,2004 ,28(10):38—4 1(in C hinese). [14】 C hape lle O ,V apnik V .C hoosing m ultiple par am ete rs fo r suppo rt vector m achines[R 】.N ew Y ork :AT &T Research Labs,200 1. [15】 S hevadeS K ,K ee rthi S S ,B hattacharyy C ,et a1 . Im provem ents to SM O al gori th m fo r SV M regression[J】.IEE E T ran saction N eural N etw o rk s, 2 00 0 , ll(5 ): 35 6 —3 6 2 . 收稿 日期:2006—04一l7 。 作者简介: 牛东晓(1962-- ),男,汉,安徽宿县人,教授,博士生导师,主要 研究方向为电力负荷预测技术、电力市场技术、综合评价理论方法应用、 技术经济评价理论方法; 谷志红(198O一),男,汉 ,河北石家庄人,华北电力大学工商管理 学 院 硕 士 研 究 生 , 主 要 研 究 电 力 市 场 理 论 、 电 力 负 荷 预 测 lao b in g 6 18 @ l6 3 .co m ;lao b in g6 18 @ l26 .co m : 王会青(19 8O一),女,汉,山西l临汾人,硕士研究生,主要研究电 力市场营销、综合评价理论方法应用。 (责任编辑 喻银凤 ) 维普资讯 http://www.cqvip.com
还剩6页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 5 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf