您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 《SPSS数据分析教程》——因子分析
《SPSS数据分析教程》——因子分析因子分析目录12.1因子分析简介12.2因子分析法的统计理论12.2.1因子分析的模型12.2.2因子分析模型的求解方法12.2.3因子分析的应用前提12.2.4因子个数的确定12.2.5因子的解释12.2.6因子旋转12.2.7因子得分12.3因子分析案例12.3.1探索变量间的结构关系12.3.2因子分析在市场调查中的应用12.4因子分析结果的有效性12.5因子分析和主成分分析的比较本章要求了解因子分析模型的基本理论;了解因子分析法的应用条件因子分析模型的求解方法;掌握因子分析法的应用;掌握因子分析法输出结果的解释;了解因子旋转的方法。12.1因子分析简介有时侯,我们要考察的指标是无法直接测量的。比如考察学生的学习能力,可以直接测试的指标有数学、语文、物理等科目的考试成绩,但是一些抽象的指标,譬如运算能力、表达能力则无法通过直接测试的方法得到,然而这些抽象指标却体现在上述可以测试的指标之中。因子分析法就是研究如何来表达这两类不同性质的指标之间的关系的。因子分析是一种数据降维方法因子分析试图用最少个数的不可观测的互不相关的公共因子(例如运算能力、表达能力等公共因子)的线性组合,再加上特殊因子来描述原来一组可观测的有相互关系的变量。其目的是尽可能合理地解释存在于原始变量之间的相关性,并且简化变量的维数和结构。因子分析的分类因子分析既可以对变量作因子分析,也可以对样品作因子分析。前者称为R型因子分析,后者称为Q型因子分析。根据原始变量之间是否有先验的关系结构,因子分析法又可以分为探索性因子分析和验证性因子分析。探索性因子分析事前没有原始变量之间、原始变量和因子之间以及因子之间关系的先验知识,而验证性因子分析事前给出原始变量和因子的结构关系。12.2因子分析的统计理论因子分析假设每一个原始变量都可以表示成不可观测的公共因子的线性组合和一个特殊因子之和。211222122221111122111122qpqqqpqqppppXaFaFaFXaFaFaFXaFaFaF因子分析模型(1)这里q为公共因子的个数,F1,…,Fq表示公共因子,也可以表示为下列矩阵形式:(1)其中,A称为载荷矩阵XAFε111212122212qqpppqaaaaaaaaaA因子分析模型(2)因子分析模型要求方程(1)满足下列条件:qp:公共因子的个数不大于原始变量的个数公共因子和特殊因子是不相关的,即:公共因子F1,…,Fq不相关且方差为1各个特殊因子不相关,但是方差不要求相等。Cov(,)0Fε因子分析结果解释因子载荷的意义在因子上的因子载荷实际上是原始变量和公共因子的相关系数。它们的大小反映了原始变量对公共因子的重要性。变量共同度它反映了公共因子对原始变量的影响程度公共因子的方差贡献它衡量公共因子的重要性。因子分析模型的求解方法(1)SPSS中给出了7种求解因子分析模型的方法主成分未加权的最小平方法综合最小平方法最大似然(K)主轴因子分解α因子分解映像因子分解法。因子分析模型的求解方法(2)这7种求解因子分析模型的方法都可以基于相关系数矩阵。主成分、主轴因子分解和映像因子分解3种方法既可以基于相关系数矩阵,也可以基于协方差矩阵。因子分析的应用前提因子分析的主要目的是数据降维,如果原始变量之间没有相关性,因子分析的意义不大。判断原始变量之间是否有相关性。判断的方法为Bartlett球形检验和KMO方法。经验上,因子分析方法要求个案个数是变量个数的10到25倍。如果个案个数相对于变量个数而言较少,那么考虑用主成分法来替代。建议如果变量中有分类变量,那么分类变量的可取值个数要不小于5。因子个数的确定有3个方法可以用来确定因子的个数方差贡献率设定特征值条件碎石图因子旋转当因子分析模型得到的公共因子没有较好的解释时,一般可以对因子进行旋转以得到原始变量和公共因子之间关系的较好解释。因子旋转分为正交旋转和非正交旋转。在正交旋转下,特殊因子的协方差、公共因子的协方差都不变,因此旋转之后的因子仍然是不相关的。正交旋转SPSS提供了3种正交旋转的方法,它们是最大四次方值法(Q:QuartmaxRotaiton)最大方差法(V:Kaiser’sVarimaxRotation最大平衡值法(E:Equamax)这三种方法的目的都是简化因子载荷矩阵,使得某些元素为0或者接近于0。并且这三种方法的坐标轴都是正交的,旋转后的公共因子仍然是相互无关的。因子得分因子分析中各个变量的公共因子取值称为因子得分。从因子分析模型知道,原始变量是公共因子的线性组合和特殊因子之和。SPSS提供了三种估计因子得分的方法,它们是Thomson回归法、Bartlett法和Anderson-Rubin法。因子分析案例SPSS因子分析的菜单是【分析】→【降维】→【因子分析】案例1:探索变量间的结构关系直接从相关系数矩阵或者协方差矩阵开始,用语法命令的方式来进行因子分析。为了分析(英格兰)盖尔语、英语、历史、算术、几何和代数6门学科之间的相互关系,Lawley和Maxwell调查了220名男学生的6门学科的成绩,并记录下它们的相关系数矩阵GaelicEnglishHistoryArithmeticAlgebraGeometry1.0000.4391.0000.4100.3511.0000.2880.3540.1641.000.3290.3200.1900.5951.0000.2480.3290.1810.4700.464R1.00输入数据MATRIXDATAvariables=ROWTYPE_GaelicEnglishHistoryArithmetiAlgebraGeometry.begindata.N220220220220220220SD111111CORR1.00CORR0.4391.00CORR0.4100.3511.00CORR0.2880.3540.1641.0CORR0.3290.3200.1900.5951.00CORR0.2480.3290.1810.4700.4641.00ENDdata.结果分析(1):相关系数矩阵GaelicEnglishHistoryArithmetiAlgebraGeometryGaelic1.000.439.410.288.329.248English.4391.000.351.354.320.329History.410.3511.000.164.190.181Arithmeti.288.354.1641.000.595.470Algebra.329.320.190.5951.000.464相关Geometry.248.329.181.470.4641.000KMO和Bartlett检验取样足够度的Kaiser-Meyer-Olkin度量。.775近似卡方310.841df15Bartlett的球形度检验Sig..000特征值、方差贡献率和累积方差贡献率初始特征值提取平方和载入旋转平方和载入因子合计方差的%累积%合计方差的%累积%合计方差的%累积%12.73345.54845.5482.20936.82436.8241.60626.76226.76221.1318.8364.3780.60610.09546.9181.20920.15746.91830.61510.25374.6340.60110.0284.65150.5258.74793.39760.3966.603100初始因子载荷矩阵因子12Gaelic.553.429English.568.288History.392.450Arithmeti.740−.273Algebra.724−.211Geometry.595−.132旋转因子载荷矩阵因子12Gaelic.232.660English.321.551History.085.591Arithmeti.770.173Algebra.723.215Geometry.572.213碎石图因子载荷图案例2:因子分析在市场调查中的应用数据文件cereals.sav某市场调查项目需要了解消费者是否偏爱某个谷物品牌。现有117个受访者对12个销量比较好的谷物产品的25个属性进行评分。现在用因子分析法对消费者的偏好习惯进行分析。哪些品牌的谷物产品易受消费者青睐?消费者喜欢哪些属性?这些属性之间有什么关系?因子分析选项设置(1)因子分析选项设置(2)如果因子分析的结果输出错误信息“解不收敛”,可以考虑更改“最大收敛性迭代次数”为一个较大的值,然后重新进行因子分析。因子分析选项设置(3)因子分析结果(1)取样足够度的Kaiser-Meyer-Olkin度量。.855近似卡方2888.038Df300Bartlett的球形度检验Sig..000因子分析结果(2)初始特征值提取平方和载入旋转平方和载入成份合计方差的%累积%合计方差的%累积%合计%累积%16.5026.0226.026.5026.0226.025.5022.0122.0123.8215.2841.303.8215.2841.303.0812.3134.3232.5010.0151.312.5010.0151.313.0712.2946.6141.686.7458.051.686.7458.052.389.5356.1451.094.3462.391.094.3462.391.566.2562.3960.933.7366.1270.853.4169.5380.793.1572.6790.732.9375.60100.702.7878.38因子分析结果(3)初始特征值提取平方和载入旋转平方和载入成份合计方差的%累积%合计方差的%累积%合计%累积%110.652.5980.97120.552.1983.16130.532.1285.28140.491.9687.24150.421.6788.91160.391.5590.46170.361.4591.91180.361.4493.34190.301.2294.56200.271.1095.66210.261.0596.71220.240.9797.68230.220.8798.55240.200.7999.34250.160.66100.00旋转后的因子载荷矩阵成份12345Fibre.855Nutritious.849Health.841Natural.760Regular.715Filling.715Quality.685Energy.684Satifying.627.481Sugar.825Salt.774Calories.705Sweet.702Process.527Kids.860Family.824Fun.535Easy因子的解释第一个因子上载荷较大的原始变量有Fibre、Nutritious、Health、Natural、Regular、Filling、Quality、Energy和Satisfying,所有这些变量都描述了谷物产品的自然健康属性,我们称之为“健康因子”。第二个因子上载荷较大的原始变量有Sugar、Salt、Calories、Sweet和Process,所有这些都是谷物产品的人工添加成分所体现的属性,称为“人工成分因子”。第三个因子上载荷较大的原始变量有Kids、Family和Fun,称为“群体因子”。前两个主成分的因子载荷图产品在前两个公共因子上的定位图小结
本文标题:《SPSS数据分析教程》——因子分析
链接地址:https://www.777doc.com/doc-5009441 .html