您好,欢迎访问三七文档
SPSS神经网络是对SPSS&nbssp;StatisticsBase以及附加模块中传统统计方法的一个补充。您可以使用SPSS神经网络发现数据中间的新关系,然后用传统的统计技术检验其显著性。SPSS神经网络可以仅仅作为客户端软件安装,但是为了得到更好的性能和扩展性,它也可以与SPSSStatisticsBaseSever一起作为Client/Server安装。为什么要使用神经网络?神经网络是一个非线性的数据建模工具集合,它包括输入层和输出层、一个或者多个隐藏层。神经元之间的连接赋予相关的权重,训练算法在迭代过程中不断调整这些权重,从而使得预测误差最小化并给出预测精度。您可以设置网络的训练条件,从而控制训练的停止条件以及网络结构,或者让算法自动选择最优的网络结构。在许多领域,您都可以将SPSS神经网络和其他的统计分析过程结合起来,获得更深入、清晰的洞察力。例如,在市场研究领域,你可以建立客户档案发现客户的偏好;在数据库营销领域,您可以进行客户细分,优化市场活动的响应。在金融分析方面,您可以使用SPSS神经网络分析申请人的信用状况,探测可能的欺诈。在运营分析方面,您也可以使用这个新工具管理现金流、优化供应链。此外,在科学和医疗方面的应用包括预测医疗费用、医疗结果分析、预测住院时间等。从始至终控制整个过程SPSS神经网络,包括多层感知器(MLP)或者径向基函数(RBF)两种方法。这两种方法都是有监督的学习技术-也就是说,他们根据输入的数据映射出关系。这两种方法都采用前馈结构,意思是数据从一个方向进入,通过输入节点、隐藏层最后进入输出节点。你对过程的选择受到输入数据的类型和网络的复杂程度的影响。此外,多层感知器可以发现更复杂的关系,径向基函数的速度更快。MLP可以发现更复杂的关系,而通常来说RBF更快。使用这两种方法的任何一种,您可以将数据拆分成训练集、测试集、验证集。训练集用来估计网络参数。测试集用来防止过度训练。验证样本用来单独评估最终的网络,它将应用于整个数据集和新数据。您设置的因变量可以是连续型、分类型或者两者的组合。如果因变量是连续型,神经网络预测的连续值是近似于输入数据的某个连续函数的“真实”值。如果因变量是分类型,神经网络会根据输入数据,将记录划分为最适合的类别。您可以通过选择分析中拆分数据集,网络结构的排序,计算方法等调整神经网络程序。最后,您可以通过图形或者表格,在当前活动的数据集中保存可选的临时变量,并且将模型导出成XML格式对新的数据进行打分。特性:多层感知器(MLP)MLP通过多层感知器来拟和神经网络。多层感知器是一个前馈式有监督的结构。它可以包含多个隐藏层。一个或者多个因变量,这些因变量可以是连续型、分类型、或者两者的结合。如果因变量是连续型,神经网络预测的连续值是输入数据的某个连续函数。如果因变量是分类型,神经网络会根据输入数据,将记录划分为最适合的类别。预测:因子协变量选项“除外”列出MLP中需要排除的因子或者协变量。当因子或者协变量包含大量的变量时,这个选项很有用。选项“缩放”对协变量和因变量进行变换因变量(如果需要变换):标准化,正态化,调整的正态化,或者无协变量:标准化,正态化,调整的正态化,或者无选项“拆分”用来设定对当前活动数据集的拆分方法。训练样本用来训练神经网络、测试集是一个独立的数据集,用来跟踪预测无法来防止过度训练。验证集是另外一个独立的数据集,用来评估最后的神经网络。您可以设定:相对记录数来随机分配训练样本相对记录数来随机分配测试样本相对记录数来随机分配验证样本使用变量对样本进行拆分用神经网络技术探索数据的结果可以用多种图形格式表示。这个简单的条形图是多种选择中的一种。选项“结构”用来设置神经网络的结构,您可以设定:是否使用自动选择结构神经网络的隐藏层个数隐藏层单元之间的激活函数(双曲函数或者S型函数)输出层单元之间的激活函数(标识,双曲,S型,SoftMax函数)选项“标准”设定MLP的计算参数。例如,训练类型决定了神经网络如何处理训练数据,包括批处理训练、在线训练、小批量训练。您也可以设置:每个小批量的训练记录数当选择自动化结构或者小批量训练模式时,内存中存储的最大记录个数。优化算法决定突触权重:梯度下降法、共轭梯度下降法梯度下降优化方法的初始学习率当使用在线或者小批量训练模式时,梯度下降的学习率下限。梯度下降优化算法的动量率共轭梯度下降发的初始lambda共轭梯度下降法的sigma初始权重区间[a0-a,a0+a]选项“停止训练”决定神经网络停止训练的规则。您可以设置:预测误差下降的次数训练时间或者最大训练时间最大收敛次数训练误差的相对变化率训练误差率准则选项“缺失”用来控制分类变量(因子和分类因变量)的缺失值是否被作为有效值使用。选项“打印”指定输出内容,也可以请求一个敏感性分析。您可以设置:处理过程设置概要神经网络的基本信息,包括因变量、输入和输出单元个数、隐藏层单元个数、激活函数神经网络输出结果的概要信息,包括:总体平均误差、停止规则、训练时间每个分类因变量的分类表突触权重,也就是连接第i-1层第j个单元和第i层第k个单元的系数估计值敏感性分析,用来计算每个预测元对神经网络的影响的重要性选项“画图”指定输出的图形,您可以选择:网络图每个因变量的预测值和观测值图连续型因变量的残差图分类变量的ROC曲线分类因变量的累积收益图分类因变量的提升图选项“保存”可以将生成的临时变量保存到当前数据集中。您可以保存:预测值或者分类预测的伪概率选项“输出文件”将神经网络的结构输出保存成包含突触权重的XML格式。径向基函数(RBF)RBF程序拟和一个前馈型、有监督学习的径向基函数网络,包括输入层、隐藏层(也就是径向基函数层)、输出层。输入向量通过隐藏层传递到径向基函数。类似MLP,RBF可以进行预测和分类。RBF程序分两个阶段训练网络:程序通过聚类方法确定径向基函数。以及每个径向基函数的中心和宽度。估计径向基函数的连接权重。在预测和分类中都使用激活函数作为均方误差函数。使用普通最小二乘方法求均方误差的最小值。由于RBF训练过程分两个阶段,因此,一般情况下,RBF网络的训练速度优于MLP。MLP和RBF的选项基本相同,除了以下几个:如果使用“结构”选项,用户可以指定隐藏层的高斯径基函数:标准RBF或者普通RBF当使用“准则”选项时,用户可以指定RBF的计算参数,指定隐藏层单元的交叠方式。系统需求软件:SPSSStatisticsBase17.0其他系统需求根据平台有所不同
本文标题:SPSS神经网络
链接地址:https://www.777doc.com/doc-4902716 .html