您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第4章 神经网络基本理论
第四章神经网络基本理论CollegeofElectricalandInformationEngineering,HunanUniv.24.1人工神经元模型人工神经元是对人或其它生物的神经元细胞的若干基本特性的抽象和模拟。生物神经元模型生物神经元主要由细胞体、树突和轴突组成,树突和轴突负责传入和传出信息,兴奋性的冲动沿树突抵达细胞体,在细胞膜上累积形成兴奋性电位;相反,抑制性冲动到达细胞膜则形成抑制性电位。两种电位进行累加,若代数和超过某个阈值,神经元将产生冲动。CollegeofElectricalandInformationEngineering,HunanUniv.34.1人工神经元模型人工神经元模型模仿生物神经元产生冲动的过程,可以建立一个典型的人工神经元数学模型[x1,…,xn]T为输入向量,y为输出,f(·)为激发函数,θ为阈值。Wi为神经元与其它神经元的连接强度,也称权值。CollegeofElectricalandInformationEngineering,HunanUniv.44.1人工神经元模型常用的激发函数f的种类:1)阈值型函数0x00x1f(x)0x10x1f(x)CollegeofElectricalandInformationEngineering,HunanUniv.54.1人工神经元模型2)饱和型函数k1x1k1xk1kxk1x1f(x)3)双曲函数arctan(x)f(x)CollegeofElectricalandInformationEngineering,HunanUniv.64.1人工神经元模型4)S型函数0β,βx)exp(11f(x)5)高斯函数)bxexp(f(x)22CollegeofElectricalandInformationEngineering,HunanUniv.74.2神经网络的定义和特点神经网络系统是由大量的神经元,通过广泛地互相连接而形成的复杂网络系统。定义特点(1)非线性映射逼近能力。任意的连续非线性函数映射关系可由多层神经网络以任意精度加以逼近。(2)自适应性和自组织性。神经元之间的连接具有多样性,各神经元之间的连接强度具有可塑性,网络可以通过学习与训练进行自组织,以适应不同信息处理的要求。(3)并行处理性。网络的各单元可以同时进行类似的处理过程,整个网络的信息处理方式是大规模并行的,可以大大加快对信息处理的速度。(4)分布存储和容错性。信息在神经网络内的存储按内容分布于许多神经元中,而且每个神经元存储多种信息的部分内容。网络的每部分对信息的存储具有等势作用,部分的信息丢失仍可以使完整的信息得到恢复,因而使网络具有容错性和联想记忆功能。(5)便于集成实现和计算模拟。神经网络在结构上是相同神经元的大规模组合,特别适合于用大规模集成电路实现。CollegeofElectricalandInformationEngineering,HunanUniv.84.3感知器模型感知器(Perceptron)是由美国学者F.Rosenblatt于1957年提出的,它是一个具有单层计算单元的神经网络,并由线性阈值元件组成。激发函数为阈值型函数,当其输入的加权和大于或等于阈值时,输出为1,否则为0或-1。它的权系W可变,这样它就可以学习。感知器的结构CollegeofElectricalandInformationEngineering,HunanUniv.94.3感知器模型感知器的学习算法为方便起见,将阈值θ(它也同样需要学习)并入W中,令Wn+1=-θ,X向量也相应地增加一个分量xn+1=1,则1n1iii)xWf(y学习算法:①给定初始值:赋给Wi(0)各一个较小的随机非零值,这里Wi(t)为t时刻第i个输入的权(1≤i≤n),Wn+1(t)为t时刻的阈值;②输入一样本X=(xi,…,xn,1)和它的希望输出d;③计算实际输出1n1iii)(t)xWf(Y(t)④修正权W:Wi(t+1)=Wi(t)+η[d-Y(t)]xi,i=1,2,…,n+1⑤转到②直到W对一切样本均稳定不变为止。CollegeofElectricalandInformationEngineering,HunanUniv.104.3感知器模型根据某样本训练时,均方差随训练次数的收敛情况CollegeofElectricalandInformationEngineering,HunanUniv.114.4神经网络的构成和分类构成从Perceptron模型可以看出神经网络通过一组状态方程和一组学习方程加以描述。状态方程描述每个神经元的输入、输出、权值间的函数关系。学习方程描述权值应该怎样修正。神经网络通过修正这些权值来进行学习,从而调整整个神经网络的输入输出关系。分类(1)从结构上划分通常所说的网络结构,主要是指它的联接方式。神经网络从拓扑结构上来说,主要分为层状和网状结构。CollegeofElectricalandInformationEngineering,HunanUniv.124.4神经网络的构成和分类①层状结构:网络由若干层组成,每层中有一定数量的神经元,相邻层中神经元单向联接,一般同层内神经元不能联接。前向网络:只有前后相邻两层之间神经元相互联接,各神经元之间没有反馈。每个神经元从前一层接收输入,发送输出给下一层。CollegeofElectricalandInformationEngineering,HunanUniv.134.4神经网络的构成和分类②网状结构:网络中任何两个神经元之间都可能双向联接。反馈网络:从输出层到输入层有反馈,每一个神经元同时接收外来输入和来自其它神经元的反馈输入,其中包括神经元输出信号引回自身输入的自环反馈。混合型网络:前向网络的同一层神经元之间有互联的网络。CollegeofElectricalandInformationEngineering,HunanUniv.144.4神经网络的构成和分类(2)从激发函数的类型上划分高斯基函数神经网络、小波基函数神经网络、样条基函数神经网络等等(3)从网络的学习方式上划分①有导师学习神经网络为神经网络提供样本数据,对网络进行训练,使网络的输入输出关系逼近样本数据的输入输出关系。②有导师学习神经网络不为神经网络提供样本数据,学习过程中网络自动将输入数据的特征提取出来。(4)从学习算法上来划分:基于BP算法的网络、基于Hebb算法的网络、基于竞争式学习算法的网络、基于遗传算法的网络。CollegeofElectricalandInformationEngineering,HunanUniv.154.4多层前向BP神经网络最早由werbos在1974年提出的,1985年由Rumelhart再次进行发展。多层前向神经网络的结构多层前向神经网络由输入层、隐层(不少于1层)、输出层组成,信号沿输入——输出的方向逐层传递。CollegeofElectricalandInformationEngineering,HunanUniv.164.4多层前向BP神经网络沿信息的传播方向,给出网络的状态方程,用Inj(i),Outj(i)表示第i层第j个神经元的输入和输出,则各层的输入输出关系可描述为:第一层(输入层):将输入引入网络iiixInOut)1()1(ni,,2,1第二层(隐层)niiijjOutwIn1)1()1()2()()2()2(jjInfOutlj,,2,1第三层(输出层)ljjjOutwInOuty1)2()2()3()3(CollegeofElectricalandInformationEngineering,HunanUniv.174.4多层前向BP神经网络网络的学习学习的基本思想是:误差反传算法调整网络的权值,使网络的实际输出尽可能接近期望的输出。MkyXkk,2,1),,(TknkkkxxxX],,[21假设有M个样本:将第k个样本Xk输入网络,得到的网络输出为ky定义学习的目标函数为:MkkkyyJ12)(21CollegeofElectricalandInformationEngineering,HunanUniv.184.4多层前向BP神经网络为使目标函数最小,训练算法是:)()()1(twJtwtw)()()1()2(1)2()2(twJtwtwjjj)()()1()1(2)1()1(twJtwtwijijij令2)(21kkkyyJ则MkkwJwJ1)2()2()2()ˆ(ˆˆjkkjkkkjkOutyywyyJwJ)1()2()1()2()2()2()2()1()ˆ(ˆˆijkkijjjjjkkkijkOutfwyywininoutoutyyJwJCollegeofElectricalandInformationEngineering,HunanUniv.194.4多层前向BP神经网络学习的步骤:(1)依次取第k组样本MkyXkk,2,1),,(,将Xk输入网络。(2)依次计算MkkkyyJ12)(21,如果J,退出。(3)计算wJk(4)计算MkkwJwJ1(5))()()1(twJtwtw,修正权值,返回(1)如果样本数少,则学习知识不够;如果样本多,则需计算更多的dJk/dw,,训练时间长。可采用随机学习法每次以样本中随机选取几个样本,计算dJk/dw,,调整权值。CollegeofElectricalandInformationEngineering,HunanUniv.20例4.1多层前向BP网络训练训练样本SISO:SampleInput=[00.10.20.30.4];SampleOutput=[42222];网络结构:CollegeofElectricalandInformationEngineering,HunanUniv.21网络输入输出关系:)(2iiiizfwy)exp(11)(iiiizzfiiixwz1需训练的量:iiiiww,,,21CollegeofElectricalandInformationEngineering,HunanUniv.22训练算法:515125122)()(kiikikkkkikizfkewyyJwJwJ51221515111)()exp()()()(kiiiiiiiiiiikiikkkkikixzfzwkewzzzfzfyyJwJwJ51225151)()exp()()()(kiiiiiiiiikiikkkkikizfzzwkezfzfyyJJJ51225151)()exp()()()(kiiiiiiiiiiikiikkkkikizfzwkezzzfzfyyJJJ25151251))()(ˆ(2121kykyeJJkkkkkCollegeofElectricalandInformationEngineering,HunanUniv.231111iiiwJww2222iiiwJwwiiiJ3iiiJ4训练初始参数:W1=rand(1,5);W2=rand(1,5);theta=rand(1,5);beta=rand(1,5);LearningRate1=0.2;LearningRate2=0.4;LearningRate3=0.2;LearningRate4=0
本文标题:第4章 神经网络基本理论
链接地址:https://www.777doc.com/doc-3818870 .html