您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第22章spss21教程完整版课件
第二十二章神经网络神经网络的概述SPSS神经网络模型的参数设置实例分析22.2SPSS神经网络模型的设置22.2.1多层感知器(MLP)的设置选择菜单“分析→神经网络→多层感知器”,则弹出如图22-3所示的对话框,此对话框用于设置多层感知器的各种参数。此界面中共有8个标签,即Variables(变量)、Partitions(分区)、Architecture(体系结构)、Training(培训)、Output(输出)、Save(保存)、Export(导出)、Options(选项)。1.变量•因变量:用于选入因变量;•因子:用于选入因变量;•协变量:用于设置协变量;•协变量重标度:用于设置协变量的标度,其下拉菜单中有四个选择项,分别是标准化、Normalized、调整,以及None。2.分区单击图22-3中的“分区”标签,则弹出如图22-4所示的对话框。①变量:用于存放待分析的变量。②分区数据集:用于设置分区数据集,有两个选项。•根据个案的相对数量随机分配个案:根据个案的相对数量随机的分配个案,其下的选项栏有分区、相对数量、培训、检验、支持、总计。•使用分区变量分配个案:使用分区变量分配个案,其下的分区变量表示分区变量。3.体系结构(1)自动体系结构的选择•隐藏层中最小单位数;•隐藏层中最大单位数。(2)自定义体系结构①隐藏层数。•One:一个;•Two:两个。②激活函数。•双曲正切;•S型函数。③单位数。•自动计算;•设定:用户自定义,如下有隐藏层1,隐藏层2。(3)输出层①激活函数。恒等函数;Softmax;双曲正切;Sigmoid。②尺度因变量重标度。标准化(Z;标准化;调整标准化;无。4.培训单击图22-5中的“培训”标签,则弹出如图22-6所示的对话框。①培训类型。•批处理;•在线;•袖珍型批处理,选择此项后激活其下的选项栏,自动计算表示自动计算;设定表示拥护自定义,在其下的记录数选项栏中填入记录数。②优化算法。•调整的共轭梯度法;•梯度下降法。③培训选项。•初始Lambda值;•初始的Sigma值;•初始的中心点;•间隔偏移量。5.输出单击图22-6中的“输出”标签,则弹出如图22-7所示的对话框。各个部分组成如下所述。①网络结构。•描述;•图表;•键结值;②网络性能。•模型汇总;•分类结果;•ROC曲线;•累积增益图;•增益图;•观测预测值;•残差分析图。③个案处理摘要。④自变量重要性的分析。6.保存单击图22-7中的“保存”标签,则弹出如图22-8所示的对话框。①保存各个因变量的预测值或类别。②保存各个因变量预测拟概率或类别。③保存变量名称选项栏:用于保存变量名称。•自动生成唯一的名称:自动生成唯一的名称。如果要在每次运行模型时将一组新的保存变量添加到数据集,则选择此项。•自定义名称:为变量指定名称,如果选择此项,具有相同名称或者根名称的任何现有自变量将在每次运行模型时刻被替换。7.导出单击图22-8中的“导出”标签,则弹出如图22-9所示的对话框。此对话框用于导出数据。其中将键结值估算导出至XML文件选项表示将键结值估算数据导出到XML文件之中。THANKYOUSUCCESS2020/3/199可编辑8.选项①用户缺失值。•指定如何使用因子及类别因变量的用户缺失值处理个案,其下有两个选项即排除和包括。•具有用户缺失值协变量或者尺度因变量的个案始终被视为无效。②中止规则。•预测误差未减少情况下的最大步骤数。•用于计算预测误差的数据,其下有自动选择;培训及测试数据。•最长培训时间,在其后的Minutes中填写数据。•最长培训时程,其下有自动计算;指定自定义值,其后的Maximumnumberofepochs表示最大时程数。•培训错误的最小相对变化。•培训错误率的最小相对变化。③存储在内存中的最大个案数。22.2.2径向基函数(RBF)的设置选择菜单“分析→神经网络→径向基函数”1.变量设置图22-11中的变量选项栏与多层感知器的设置基本相同,只是在因变量选项栏的下方需要设置RescalingofScaleDependentVariables,即设置尺度因变量重标度,下拉菜单有四个选项,分别是Standardized(Z标准化)、Normalized(标准化)、AdjustedNormalized(调整后的标准化),以及None(不操作)。2.体系架构设置•单击图22-11中的“体系架构”标签,则弹出如图22-12所示的对话框,此对话框用于设置体系结构,各个组成部分如下所述。①隐藏层中的单位数。•在某个范围内查找最佳单位数。其下的选项栏用于设置范围,有自动计算范围;使用指定范围,其下的选项栏有最小,最大。•使用指定单元数,其下的数用于指定数量。②隐藏层激活函数。•标准化径向基函数;•一般的径向基函数。③隐藏单位中的重叠。•自动计算允许的重叠数量;•允许指定数量的重叠,在其下的重叠因子选项栏中填入重叠因子。3.选项设置单击图22-11中的“选项”标签,则弹出如图22-13所示的对话框各部分组成如下所述。•用户缺失值。•①指定如何使用因子及类别因变量的用户缺失值处理个案。其下有两个选项即•排除;•包括。•②具有用户缺失值协变量或者尺度因变量的个案始终被视为无效22.3实例分析22.3.1参数设置首先产生随机数来选择样本数据集,选择菜单“转换→随机数生成器”,则弹出如图22-15所示的对话框,选择“设置起点”选项栏,并选中“固定值”选项,填入9191972,然后单击图22-15中的“确定”按钮。然后选择菜单“转换→计算变量”,则弹出如图22-16所示的对话框,在“目标变量”选项栏中填入变量名partition,然后在“数学表达式”选项框中填入计算表达式2*RV.BERNOULLI(0.7)1,此公式用于产生bernoulli分布数据,数据集的名称为partition。生成随机数以后,则选择菜单“分析→神经网络→多层感知器”,则弹出如图22-17所示的对话框。选择变量Previouslydefaulted[default]到“因变量”选项栏中。选择变量Levelofeducation[ed]到“因子”选项栏中。选择变量age、employ、address、income、debtinc、creddebt、othdebt到“协变量”选项栏中。然后单击“分区”标签,弹出如图22-18所示对话框,选中“使用分区变量分配个案”选项栏,然后选中变量partition到“分区变量”选项栏中。然后单击“输出”标签,弹出如图22-19所示对话框。选择“ROC曲线”、“累积增益图”、“增益图”,以及“观察预测值”选项栏,去掉“图表”选项。最后选择“自变量重要性分析”选项栏。然后单击“确定”按钮进行分析。THANKYOUSUCCESS2020/3/1917可编辑
本文标题:第22章spss21教程完整版课件
链接地址:https://www.777doc.com/doc-4463118 .html