说明:1.1节主要是概括和帮助理解考虑影响因素的BP神经网络算法原理,即常规的BP模型训练原理讲解(可根据自身掌握的知识是否跳过)。1.2节开始讲基于历史值影响的BP神经网络预测模型。
使用BP神经网络进行预测时,从考虑的输入指标角度,主要有两类模型:
如图一所示,使用MATLAB的newff函数训练BP时,可以看到大部分情况是三层的神经网络(即输入层,隐含层,输出层)。这里帮助理解下神经网络原理:
1)输入层:相当于人的五官,五官获取外部信息,对应神经网络模型input端口接收输入数据的过程。
2)隐含层:对应人的大脑,大脑对五官传递来的数据进行分析和思考,神经网络的隐含层hidden Layer对输入层传来的数据x进行映射,简单理解为一个公式hiddenLayer_output=F(w*x+b)。其中,w、b叫做权重、阈值参数,F()为映射规则,也叫激活函数,hiddenLayer_output是隐含层对于传来的数据映射的输出值。换句话说,隐含层对于输入的影响因素数据x进行了映射,产生了映射值。
3)输出层:可以对应为人的四肢,大脑对五官传来的信息经过思考(隐含层映射)之后,再控制四肢执行动作(向外部作出响应)。类似地,BP神经网络的输出层对hiddenLayer_output再次进行映射,outputLayer_output=w *hiddenLayer_output+b。其中,w、b为权重、阈值参数,outputLayer_output是神经网络输出层的输出值(也叫仿真值、预测值)(理解为,人脑对外的执行动作,比如婴儿拍打桌子)。
4)梯度下降算法:通过计算outputLayer_output和神经网络模型传入的y值之间的偏差,使用算法来相应调整权重和阈值等参数。这个过程,可以理解为婴儿拍打桌子,打偏了,根据偏离的距离远近,来调整身体使得再次挥动的胳膊不断靠近桌子,最终打中。
再举个例子来加深理解:
图一所示BP神经网络,具备输入层、隐含层和输出层。BP是如何通过这三层结构来实现输出层的输出值outputLayer_output,不断逼近给定的y值,从而训练得到一个精准的模型的呢?
从图中串起来的端口,可以想到一个过程:坐地铁,将图一想象为一条地铁线路。王某某坐地铁回家的一天:在input起点站上车,中途经过了很多站(hiddenLayer),然后发现坐过头了(outputLayer对应现在的位置),那么王某某将会根据现在的位置离家(目标Target)的距离(误差Error),返回到中途的地铁站(hiddenLayer)重新坐地铁(误差反向传递,使用梯度下降算法更新w和b),如果王某某又一次发生失误,那么将再次进行这个调整的过程。
从在婴儿拍打桌子和王某某坐地铁的例子中,思考问题:BP的完整训练,需要先传入数据给input,再经过隐含层的映射,输出层得到BP仿真值,根据仿真值与目标值的误差,来调整参数,使得仿真值不断逼近目标值。比如(1)婴儿受到了外界的干扰因素(x),从而作出反应拍桌(predict),大脑不断的调整胳膊位置,控制四肢拍准(y、Target)。(2)王某某上车点(x),过站点(predict),不断返回中途站来调整位置,到家(y、Target)。
在这些环节中,涉及了影响因素数据x,目标值数据y(Target)。根据x,y,使用BP算法来寻求x与y之间存在的规律,实现由x来映射逼近y,这就是BP神经网络算法的作用。再多说一句,上述讲的过程,都是BP模型训练,那么最终得到的模型虽然训练准确,但是找到的规律(bp network)是否准确与可靠呢。于是,我们再给x1到训练好的bp network中,得到相应的BP输出值(预测值)predict1,通过作图,计算Mse,Mape,R方等指标,来对比predict1和y1的接近程度,就可以知道模型是否预测准确。这是BP模型的测试过程,即实现对数据的预测,并且对比实际值检验预测是否准确。
图一 3层BP神经网络结构图
以电力负荷预测问题为例,进行两种模型的区分。在预测某个时间段内的电力负荷时:
一种做法,是考虑 t 时刻的气候因素指标,比如该时刻的空气湿度x1,温度x2,以及节假日x3等的影响,对 t 时刻的负荷值进行预测。这是前面1.1所说的模型。
另一种做法,是认为电力负荷值的变化,与时间相关,比如认为t-1,t-2,t-3时刻的电力负荷值与t时刻的负荷值有关系,即满足公式y(t)=F(y(t-1),y(t-2),y(t-3))。采用BP神经网络进行训练模型时,则输入到神经网络的影响因素值为历史负荷值y(t-1),y(t-2),y(t-3),特别地,3叫做自回归阶数或者延迟。给到神经网络中的目标输出值为y(t)。
算法基本思想描述如下:在群体中,每个萤火虫个体被随机分布在目标函数定义的空间中,初始阶段,所有的萤火虫都具有相同的荧光素值和动态决策半径。其中,每个萤火虫个体根据来自动态决策半径内所有邻居萤火虫信号的强弱来决定其移动的方向。萤火虫的动态决策半径会随着在它范围内萤火虫个体的数目而变化,每个萤火虫的荧光素也会随着决策半径内萤火虫个体的数目而改变。萤火虫群优化算法是无记忆的,无需目标函数的全局信息和梯度信息,具有计算速度快,调节参数少,易于实现等特点。萤火虫进化过程中,每次迭代都由萤火虫的部署(初始化)、荧光素更新阶段、移动概率计算阶段、位置更新阶段、邻域范围更新阶段五个部分组成,现分别介绍如下:
clc clear all tic m=2;%维数 n=50;%萤火虫个数 a=3; b=-3; jis=0; L0=5;%荧光素初值 beta=0.08;%动态决策域的更新率 nt=5;% 领域个数阈值 s=0.05;%步长 %s=0.03;%步长 gama=0.6;%荧光素更新率 p=0.4;%荧光素消失率 t=2;%次数初值 iter_max=200;%最大迭代次数 R0=3;%动态决策域Rd的初值 Rs=5;%感知域RS>=Rd L=zeros(n,iter_max); Rd=zeros(n); P=zeros(n,n); Nei=cell(n,iter_max); %随机分配个体荧光素及动态决策域 for i=1:n L(i,1)=L0; Rd(i)=R0; end %第i萤火虫在t时刻的位置初始化 for i=1:n X(i,1:m)=(a-b)*rand(1,m)+b; plot(X(i,1),X(i,2),'sk'); hold on end while t<iter_max %荧光素的更新 for i=1:n L(i,t)=(1-p)*L(i,(t-1))+gama*J1(X(i,1:m)); end %位置移动规则 for i=1:n for j=1:n if (norm(X(j,1:m)-X(i,1:m))<Rd(i))&&(L(i,t)<L(j,t)) Nei{i,t}=[j,Nei{i,t}];%获取邻域Nei end end end tempsum=zeros(n); for i=1:n for j=Nei{i,t} tempsum(i)=L(j,t)-L(i,t)+tempsum(i); end end %移动概率的计算 for i=1:n for j=Nei{i,t} P(i,j)=(L(j,t)-L(i,t))/tempsum(i); end end for i=1:n if isempty(Nei{i,t}) X(i,1:m)= X(i,1:m); Rd(i)=min(Rs,max(0,Rd(i)+beta*(nt-length(Nei{i,t})))); plot(X(i,1),X(i,2),'*k'); hold on else for j=Nei{i,t} if P(i,j)==max(P(i,:))&&P(i,j)~=0 SeJ=j;%选择最好的移动方向 %位置更新 X(i,1:m)= X(i,1:m)+s.*(X(SeJ,1:m)-X(i,1:m))/norm(X(SeJ,1:m)-X(i,1:m)); %动态决策域更新 Rd(i)=min(Rs,max(0,Rd(i)+beta*(nt-length(Nei{i,t})))); plot(X(i,1),X(i,2),'*k'); hold on end end P(i,:)=zeros(1,n); end end if t<=150 s=s-0.0003; end t=t+1 end %取值 for i=1:n num=0; for j=i+1:n if norm(X(i,1:m)-X(j,1:m))<0.05 num=num+1; if num<=1 jis=jis+1; if J1(X(i,1:m))<J1(X(j,1:m)) fuzhu(jis,1:m)=X(j,1:m); else fuzhu(jis,1:m)=X(i,1:m); end X(j,1:m)=[inf]; else if J1(X(i,1:m))<J1(X(j,1:m)) fuzhu(jis,1:m)=X(j,1:m); end X(j,1:m)=[inf]; end end end end fuzhu %画图 toc for i=1:n plot(X(i,1),X(i,2),'or'); hold on end grid on %x1=-3:0.05:3; %y1=x1'; %x=ones(size(y1))*x1; %y=y1*ones(size(x1)); %z=3.*(1-x).^2.*exp(-(x.^2+(y+1).^2))-10.*(x./5-x.^3-y.^5).*exp(-(x.^2+y.^2))-(1/3).*exp(-((x+1).^2+y.^2)); %figure(1) %surf(x,y,z) %figure(1 ) %for i=1:n %temp2=X{i,2}; %plot(temp2(1),temp2(2),'sk'); % hold on % temp3=X{i,iter_max}; % plot(temp3(1),temp3(2),'*r'); % hold on % for j=2:iter_max-1 % temp=X{i,j}; % plot(temp(1),temp(2),'k'); % hold on % grid on % end %end %for j=2:iter_max-1 % temp2=X{1,2}; % plot(temp2(1),temp2(2),'sr'); % grid on % hold on % temp3=X{1,199}; % plot(temp3(1),temp3(2),'or'); % hold on % temp=X{1,j}; % plot(temp(1),temp(2),'*k-.'); %hold on %end
图2萤火虫算法收敛曲线
测试统计如下表所示
测试结果 | 测试集正确率 | 训练集正确率 |
---|---|---|
BP神经网络 | 100% | 95% |
GWO-BP | 100% | 99.8% |
《基于BP神经网络的宁夏水资源需求量预测》