您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 神经网络在对鲍鱼年龄识别中的应用
1引言鲍鱼是一种原始的海洋贝类,单壳软体动物,只有半面外壳,壳坚厚,扁而宽。是我国著名的海产八珍之一,味道清新,肉质鲜嫩,不仅美味佳肴,而且有治病功用,可治阴虚内热、废墟咳嗽等症。鲍鱼外形呈有螺旋形,结构有单个外壳、吸盘上足、触角等构成。鲍鱼还有极高的应该价值,、鲍鱼含有丰富的蛋白质,还有较多的钙、铁和维生素A等营养元素。随着社会的进步,人们物质生活的日益丰富,人类对食物的要求越来越高。鲍鱼是中国传统的名贵食材,四大海味之首,鲍鱼的肉很好吃,自古以来人们都非常喜欢食用。但它的自然产量较小,远远不能满足需要,所以人们都想办法养殖它,目前在日本已对鲍鱼的养殖做了很多工作。我国在这方面也进行了一些工作,为鲍鱼养殖建立了一定的条件。由于人工饲养的鲍鱼与野生的鲍鱼的个头有所不同,野生鲍鱼的个头明显大于人工饲养的,且鲍鱼种类繁多,且鲍鱼的肉质受年龄的影响较大。所以,我们需要一种简单快速的分类方法,通过对鲍鱼的性别、重量、直径、高度等生理特征分析,将鲍鱼以年龄分离开来,满足商家对鲍鱼的分类包装销售,以满足不同人群对不同种类鲍鱼的需求。2鲍鱼数据集与预处理鲍鱼数据集是鲍鱼的各方面生理特征与它们年龄之间的一个关系。其中,我们可以由它的“年轮”得出其年龄。鲍鱼的属性信息如表1所示。由于鲍鱼年龄从一岁到二十九岁,即目标向量元素过多,会由于两个相邻年龄里面属性相近,而易导致分类错误。所以,在数据预处理阶段,我们按鲍鱼的年龄段进行分类,即以四个年龄为一个年龄段(共七个年龄段)。鲍鱼的性别方面,幼鲍对应1,雄性对应2,雌性对应3。表1.鲍鱼的属性属性数据类型单位.描述SexnominalM,F,andI(infant)LengthcontinuousmmLongestshellmeasurementDiametercontinuousmmperpendiculartolengthHeightcontinuousmmwithmeatinshellWholeweightcontinuousgramswholeabaloneShuckedweightcontinuousgramsweightofmeatVisceraweightcontinuousgramsgutweightShellweightcontinuousgramsafterbeingdried神经网络在对鲍鱼年龄识别中的应用朱祯昊浙江大学宁波理工学院,宁波315000E-mail:hao3535@yahoo.com.cn摘要:人工神经网络具有适合于解决复杂的非线性问题的特点,因此,在这里根据鲍鱼的多个生理特征,如性别、重量、直径等信息,采用BP神经网络的方法,对鲍鱼的年龄进行分类预测,以满足商家对鲍鱼的分类。本文先介绍一个简单的神经网络器—感知器,再根据它的改进(BP神经网络),利用Matlab神经网络工具箱对鲍鱼数据进行操作。关键词:分类,神经网络,鲍鱼ApplicationofNeuralNetworkinageidentificationofabaloneZhenhaoZhu1NingboInstituteOfTechnology,ZhejiangUniversity,Ningbo315000E-mail:hao3535@yahoo.com.cnAbstract:Artificialneuralnetworksuitableforsolvingcomplexnonlinearcharacteristicsoftheproblem,therefore,whereanumberofabaloneunderphysiologicalcharacteristics,suchasgender,weight,diameterandotherinformation,theuseofBPneuralnetworks,toclassifytheageofabaloneForecasttomeettheclassificationofbusiness-to-abalone.Thisarticlefirstdescribesasimpleneuralnetworkdevices-sensors,accordingtoitsimprovement(BPneuralnetwork),useofMatlabneuralnetworktoolboxoftheabalonedataoperations.KeyWords:Categories,NeuralNetworks,Abalone3基本理论3.1神经网络介绍人工神经网络(ArtificialNeuralNetworks,简写为ANN)也简称为神经网络,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入-输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果,这种学习分析的过程被称为“训练”。3.2神经网络原理人工神经网络类似于人脑的结构,由一组相互连接的结点和有向链构成。通过感知器训练解决分类问题。感知器包含两种结点:输入节点,用来表示输入属性;一个输出结点,用来提供模型输出。神经网络结构中的结点通常叫做神经元或单元。在感知器中,每个输入结点都通过一个加权的链连接到输出结点。这个加权的链用来模拟神经元间神经键连接的强度。像生物神经系统一样,训练一个感知器模型就相当于不断调整链的权值,知道能拟合数据的输入输出关系为止。输入结点简单地吧接受到值传送给输出链,而不做任何转换。输出结点则是一个数学装置,计算输入的加权和,减去偏置项,然后根据结果的符号产生输出。感知器模型的输出可以用如下数学方式表示:^112211()ddddysignwxwxwxwxt其中,12,,,d是输入链的权值,而12,,,dxxx是输入属性值。sign作为输入神经元的激活函数,当参数为正时输出+1,参数为负是输出-1。在感知器模型的训练阶段,权值参数w不断调整直到输出和训练样例的实际输出一致。3.3感知器的算法以及步骤1)准备好训练输入集和目标输出集;2)以均布随机设定加权值矩阵w;3)计算每个训练样例的^y:^112211()ddddysignwxwxwxwxt4)计算加权值矩阵修正量ΔW:mijmijWWN5)更新加权值矩阵W:()^1()()kkkjjiijiwwyyx其中kw是第k次循环后的第i个输入链上的权值,参数称为学习率,ijx是训练样例ix的第j个属性值。权值更新公式的理由是相当直观的。新权值(1)kw是等于旧权值()kw加上一个正比于预测误差^()yy的项。如果预测正确,那么权值保持不变,否则,就更新。6)重复步骤3至步骤7直至到收敛或执行一定数目的学习循环。3.4BP神经网络图1.多层人工神经网络人工神经网络比感知器更加复杂,由于网络的输入层与输出层之间可能包含多个中间层,这些中间层叫做隐藏层,隐藏层中的结点称为隐藏结点,而感知器就是一个单层的前馈神经网络。因此我们用单独的感知器来求解ANN模型的权值是行不通的,我们需要更合适的方法。ANN学习算法的目的是确定一组权值W,最小化误差平方和:^211()()2NiiiEwyy由于激活函数的选择,ANN的输出是参数的非线性函数。这样,导出W的全局最优解就变得不那么直接了,为了更有效的解决这个问题,我们将梯度下降使用的权值更新公式更新为:()jjjE但是在不知道输出值的情况下,我们很难估计结点的误差项()jEww。这里我们就用反向传播技术来解决这个问题。算法的每一次迭代包括二个阶段:前向阶段和后向阶段。在前向阶段,使用前一次迭代所得到的权值计算网络中每一个神经元的输出值。计算是向前的,即先计算第k层神经元输出,再计算第k+1层地输出。此时k+1层地净输入为:(1)()jijijijjjjjIwOErrOOTO其中ijw是由上一层额单元i到单元j的连接权重;iO是上一层的单元i的输出;而j是单元j的偏倚。偏倚充当阈值,用来改变单元的活性。使用logistic或sigmoid函数。给定k+1层的净输出为:11jjIOe在向后阶段,通过更新权重和反映网络预测误差的偏倚,向后传播误差。对于输出单j,误差jErr用下公式计算:(1)()jjjjjErrOOTO其中,jO是单元j的实际输出,而jT是j基于给定训练元组的已知目标值。隐藏层单元j的误差是:(1)jjjkjkkErrOOErrw其中,jkw是由下一较高层中单元k到单元j的连接权重,而jErr是单元k的误差。更新权重和偏倚,以反映传播误差。ijw是权ijw的改变。l是学习率:()ijjiwlErrOijijij偏倚由下式更新,其中j是偏倚j的改变。()jjlErrjjj3.5神经网络的特点1)非线性映射能力:能学习和存贮大量输入-输出模式映射关系,而无需事先了解描述这种映射关系的数学方程。2)泛化能力:当向网络输入训练时未曾见过的非样本数据时,网络也能完成由输入空间向输出空间的正确映射。3)容错能力:输入样本中带有较大的误差甚至个别错误对网络的输入输出规律影响很小。4神经网络在识别鲍鱼年龄中的应用我们现在用matlab自带的神经网络工具箱对鲍鱼的数据进行操作。神经网络工具箱默认的为二层前馈神经网络,隐藏层中默认设置20个神经单元。鲍鱼数据总共有4177条数据,70%作为训练集,15%作为验证集,15%作为测试集,然后进行训练。图2.混淆矩阵图2中,主对角线上的表示正确分类的样本数及所占比例,红色区域数据表示错分的样本数及其所占比例,灰色区域数据分别表示每行(每列)的正确分类样本数占所有OutClass(TargetClass)样本数的比例(绿色数字表示)。从图中可以看出,训练、验证、测试正确率(Accuracy)分别为83.0%、79.7%、81.2%,综合正确率达82.2%。图3.ROC曲线图3中,ROC曲线显示了给定模型的真正率与假正率之间的比较评定,即对鲍鱼年龄判断的正确率与错误率的比较。ROC曲线下面的面积是模型准确率的度量。图4.运行结果图4中,MSE表示均方误差,%E表示错误分类的百分比。5人工神经网络不足点:1)算法的学习速度较慢。由于其本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现“锯齿形现象”。同时为了使网络执行BP算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。网络训练失败的可能性较大。从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;2)网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能力、学习能力)的矛盾。一般情况下,训练能力差时,预测能力也差,并且一定程度上,随训练能力地提高,预测能力也提高。但这种趋势有一个极限,当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓“过拟合”现象。此时,网络学习了过多的样本细节,而不能反映样本内含的规律。6总结与分析本次对鲍鱼年龄进行识别分类的实验中,由于鲍鱼年龄从1至29岁不等,所以造成分类的困难度增大。所以,在对数据进行训练之前,先把鲍鱼的年龄按年龄段分。虽然现在只有4个年龄段,但是,每个年龄段中相差较大的两个年龄之间它们的属性相差很大,所以造成分类的错误率增大,最终造成整体的正确率较低,而且不容易更正。参考文献(References)[1]JiaweiHan,MichelineKamber.数据挖掘概念与技术.北京:机械工业出版社,2007.3[2]Pang-NingTan,MichaelSteinbach,Vipi
本文标题:神经网络在对鲍鱼年龄识别中的应用
链接地址:https://www.777doc.com/doc-5201536 .html