您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > CNN算法中BP算法权重调整过程
CNN算法中权重调整过程详细推导卷积神经网络(CNN)训练的过程是:信号由输入层输入,经隐含层(至少一层),最后由输出层输出。为了使得输出的结果与期望值间的误差最小,我们需要对每层的权重参数进行调整,调成的过程是:利用输出值与期望值之间的误差,由输出层经隐含层到输入层,进行每层的误差计算,这个过程其实就是反向传播网络BP(BackPropagation)的计算过程。BP(BackPropagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP学习网络能学习和存储大量的输入-输出模式映射关系,而事前无需揭示这种映射关系的数学方程。它的学习规则是使用梯度下降法,通过反向传播不断调整网络的权重和阈值,使网络的误差平方和最小。图1神经网络示意图(这里没有添加偏置项)为了方便BP算法推导,如图1所示,我们做了如下的定义:(1)我们定义输入是:nixxxxXni,],...,,...,,[21(2)隐含层的输出是:ltxyyyYlt,],...,,...,,[21(3)输出层是:mjooooOmj,],...,,...,,[21(4)输入层到隐含层的权重,我们定义:ltvvvvVlt,],...,,...,,[21线的颜色相同的权重一样,例如绿颜色的线权重是:1v)。(5)隐含层到输出层的权重,我们定义:mj,],...,,...,,[21下边讲的才是我们这部分的核心和重点,如何利用以上的定义,来描述图1所示的网络的工作过程。在这里插入一个关于激活函数的定义,你肯定会问什么是激活函数,跟神经网络有什么关系?首先,激活函数是把激活的神经元的特征通过该函数把特征保存并映射出来,这里的保存特征,同时去除了数据中的一些冗余的信息,这是神经网络NN解决非线性问题的关键。常见的激活函数有:Sigmoid,tanh,ReLu,softmax等。Sigmoid函数,也叫S曲线函数:xexf11,tanh:xxftanh,ReLu:0,maxxxf,sofamax:xexf1log。对图1中的输出层:mjnetfojj,...,2,1,,这里的jnet表示输出层的第j个输入,且mjywnettlttjj,...,2,1,1,则mjywfotlttjj,...,2,11,;则对于隐含层:ltnetfytt,...,2,1,,这里的tnet表示输出层的第t个输入,ltxvnetiniitt,...,2,11,,则:ltxvfyiniitt,...,2,11,;在这里我们定义输出误差:mjmmodOdE1222121,这里的d表示期望输出值。mjmmodOdE1222121=mjjmnetfd1221=mjltttjmywfd12121=mjltttjmnetfwfd12121=mjltniiittjmxvfwfd121121(1)此时式(1)中,E,md,ix是已知的(当然激活函数f是已知的),只有权重值w和v是未知的,即是我们要求解的,接下里我们利用梯度下降法求解式(1),则:ititvEv-,tjtjwEw-,itttitvnetnetEv-,tjjtjwnetEwjnet-(2)在这里,我们对输出层,隐含层各定义个误差信号,则:jojnetE,tytnetE,那么式(2)可以写成:(1)tjjtjwnetwoj=tjltttjwyw1oj=tyoj(3)(2)ittytitvnetv,=itniiitytvxv1=iytx(4)这里的是比例系数,观察式(3)和式(4),只要oj和yt已知,那么我们就完成了对权重值的调整,那么我们有:jmmjjjjjjojnetfodnetfoEnetooEnetE''(5)ttttttytnetfyEnetyyEnetE'(6)由于mjmmodOdE1222121=mjltttjmywfd12121则,tjltttjljltttjmtwywfywfdyE1'11,tjjljmmwnetfod'1那么式(6)可以重写成:ttjjljmmytnetfwnetfod''1xexf11=xfxfxf1'ttjjjljmmytnetfwnetfnetfod'11=tttjjjljmmyywoood111(7)由式(5)得,mmmmjjmmojooodnetfnetfod11(8)将式(8)带入式(7)得:tttjljojytyyw11(9)因此,将式(8)和式(9)分别带入式(3)和式(4)中,我们可以得到:ttjywoj=tmmmmyoood1(10)iytitxv=itttjljojxyyw11(11)
本文标题:CNN算法中BP算法权重调整过程
链接地址:https://www.777doc.com/doc-4209284 .html