您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 第九讲SPSS主成分分析和因子分析
第七讲因子分析与主成分分析模型选择是艺术,而不是科学。——WilliamNavidi统计名言因子分析得到的是什么?因子分析方法在部分领域应用的一些例子心理学:心理学家瑟斯登对56项测验的得分进行因子分析,得出了7中主要智力因子:词语理解能力,语言流畅能力、计数能力、空间能力、记忆力、知觉速度和推理能力因子分析得到的是什么?医学:一位研究者对山东某县2000~2002年3年的全死因调查资料中不同地区各恶性肿瘤标化死亡率进行因子分析后发现,该县居民恶性肿瘤的发病和死亡具有明显的地区分布。在地区分布中,各种恶性肿瘤的死亡具有一定程度的聚集性。经因子分析得到的4个主因子可以解释10种恶性肿瘤死亡率的74.54%;10种恶性肿瘤中,被解释的比例最小也在62%以上;而胃癌、白血病、膀胱癌、乳腺癌、结肠癌死亡率被解释的比例均在77%以上,表明这10种恶性肿瘤之间存在中等偏强的内在联系和地区分布特点在研究实际问题时,往往需要收集多个变量。但这样会使多个变量间存在较强的相关关系,即这些变量间存在较多的信息重复,直接利用它们进行分析,不但模型复杂,还会因为变量间存在多重共线性而引起较大的误差。为能够充分利用数据,通常希望用较少的新变量代替原来较多的旧变量,同时要求这些新变量尽可能反映原变量的信息。主成分分析和因子分子正式解决这类问题的有效方法。它们能够提取信息,使变量简化降维,从而使问题更加简单直观。主成分分析和因子分析(PrincipalComponentAnalysis&FactorAnalysis)因子分析的基本原理因子分析有探索性因子分析和验证性因子分析两种。其中探索性因子分析的主要作用是简化数据和探索数据结构;验证性因子分析的作用是对数据结构的先在假设进行检验。因子分析使用的方法是分解原始变量,通过相关找出潜在的“类别”,把每一类变量看作一个共同因子,从此确定数据结构。主成分分析的基本原理严格来说,主成分分析只是一种中间手段,其作用为简化数据。主成分分析不能作为研究结果,应该在进行主成分分析之后继续使用其他多元统计方法进行分析。主成分分析所使用的方法是通过线性变换将原来的多个指标组合成相互独立的少数几个能够反映出大部分信息的指标。spss的实现在实际求解过程中,因子分析和主成分分析都有着一定的区别,计算上因子分析更为复杂。但对于计算机,因子分析并不费事。因子分析比主成分分析多了“因子旋转(factorrotation)”这样一个步骤。对样本量的要求主成分分析对于样本量没有严格的要求,只要把需要进行分析的样本都用于进行主成分分析即可。因子分析理想的样本量是样本数为变量数的10~25倍,考虑到因子分析时的变量数通常很多,5~10倍的样本量也可以使用。主成分因子分析Analyze→DimentionReduction→FactorKMO和Bartlett球形检验是分辨数据能否进行因子分析的一个重要指标KMO取值范围从0到1,值越大越适合进行因子分析,一般0.7P0.05公因子方差:观测变量能够被公因子所解释的变异占总变异的百分比特征根的含义是公因子能够解释的变异是一个观测变量变异的多少倍公因子贡献率指一个公因子能够解释所有观测变量总变异的百分比因子负荷矩阵,也就是公因子与观测变量的相关矩阵默认主成分分析碎石图可以作为截取公因子时的重要参照根据特征根的值提取公共因子,一般要求特征根1固定公共因子的个数提取公共因子的方式截取公因子的标准特征根大于1公因子累积贡献率达到一定水平碎石图的拐点去掉因子负荷大于0.5非常少的因子如果想把因子分存储下来用于进一步分析,可以把这个选项选上在数据文件中新生成的两个变量就是提取出的公因子的因子分选择是否进行因子旋转的菜单,这里面提供了三种正交旋转和两种斜交旋转的方法,默认值为不进行旋转。做主成分分析,不用旋转因子分析中的正交旋转方法Varimax方差最大法只有少数几个变量在某个因子上有较高的负载,其他变量在这个因子上的负载尽可能低。该方法强调对因子的解释的简洁性。Quartimax四次方最大法每个变量只在某一个因子上有较高的负载,在其他的因子上有尽可能低的负载。该方法强调了对变量解释的简洁性。Equamax等量最大法等量最大法是上面两种方法的加权平均。选择最常用的方差最大法进行正交旋转。呈现因子负荷图旋转前的因子载荷矩阵旋转后的因子载荷矩阵因子旋转的转换矩阵因子转换矩阵就是旋转前的公因子与旋转后的公因子之间的相关矩阵旋转前旋转后因子分析的一般步骤KMO与Bartlett`s球型检验进行分析,按一定标准提取公因子如果进行主成分分析则将主成分存为新变量用于继续分析;如果进行因子分析则考察公因子的实际意义,如有必要还需要进行因子旋转,以寻求对因子的最佳解释。如有必要可以计算因子得分等中间指标供进一步分析使用。选上后,因子负荷矩阵按照负荷大小排序低于特定值的因子负荷不显示不排序并显示所有因子负荷排序、旋转后、不显示比较小的因子负荷删除题目的原则1.删除在两个或两个以上的公共因子上具有接近因子载荷的题目2.某个公因子下只有1个题目3.删除在公共因子上的最大载荷小于0.35,共同度小于0.4验证性因子分析简介在寻找公共因子的过程中,是否利用先验信息,产生了探索性因子分析和确定性因子分析的区别。探索性因子分析是在事先不知道影响因素的基础上,完全依据资料数据,以一定的原则进行因子分析,最后得出因子的过程。而验证性因子分析充分利用了先验信息,是在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。因此探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度;而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力。两种因子分析的比较
本文标题:第九讲SPSS主成分分析和因子分析
链接地址:https://www.777doc.com/doc-2124443 .html