您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > SPSS数据的因子分析
zf因子分析(FactorAnalysis)知识点1、什么是因子分析?2、理解因子分析的基本思想3、因子分析的数学模型以及模型中公共因子、因子载荷变量共同度的统计意义4、因子旋转的意义5、结合SPSS软件进行案例分析2020/1/102zf案例1:我们试图对某快餐店的质量进行评估,选择了就餐等待时间、清洁度等6个指标作为观测变量:这些变量之间有高度的相关关系这些变量能否综合成两个或多个因子?这些彼此相关的变量会导致某些信息多次考虑,引起分析的偏误······如何避免??因子分析的基本理论2020/1/103zf除了主成分分析(PCA)外,还有用来实现‘降维’的其他方法吗??因子分析Factoranalysis1、什么是因子分析?2、因子分析的基本思想?3、因子分析与主成分分析的区别??2020/1/104zfSpearman(1904)发表的论文“Generationintelligenceobjectivelydeterminedandmeasured”,AmericanJournalPsychology15,201-293.被认为是因子分析研究的开端.这篇文章主要是针对中学生考试成绩进行因子分析2020/1/105zf当考虑该矩阵上三角中的相关元素会发现:(1)每一行元素呈递减的趋势,且递减的大小大致相当;(2)任意两列元素大致成比例。中学生各门课程考试成绩的相关系数矩阵classicsfrenchenglishmathdiscrmusicclassics10.830.780.70.660.63french0.8310.670.670.650.57english0.780.6710.640.540.51math0.70.670.6410.450.51discr0.660.650.540.4510.4music0.630.570.510.510.41究竟是什么因素在影响着学生的成绩呢?2020/1/106zfSpearman提出:标准化的每个原始变量可用以下的方程形式表示:66*22*11*fMusicfFrenchfClassics每门课程的考试成绩可用两个因素做解释:(1)总体智力水平因子generalintelligencef;(2)特殊潜能因子specifictalentsordeficienciesiClassics*、French*等是标准化后的考试成绩,均值为0,方差为1f为公共因子,对各门课程的考试成绩均有影响,且其均值为0,方差为1;为特殊因子,仅对第i门课程考试成绩有影响;其中f与相互独立。ii每门课程的考试成绩可看作为由一个公共因子和一个特殊因子之和2020/1/107zf案例2:假设我们有学生以下几门课程的成绩Supposewehavestudents’testscoresforMathematics(M),Physics(P),Chemistry(C),English(E),History(H),andFrench(F).其相关系数矩阵如下:MPCEHFM1P0.621C0.540.511E0.320.380.361H0.2840.3510.3360.6861F0.370.430.4050.730.7351这6门课程成绩可用两个或多个能力因子做解释吗?在M,P,C这几门课程之间有较高的相关关系;在E,H,F这几门课程之间有较高的相关关系。2020/1/108zf案例3:在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而每个原始变量可表示为:称是不可观测的潜在因子,称为公共因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分,称为特殊因子。iiiiiFFFx332211321FFF、、i2020/1/109zf1、什么是因子分析?因子分析是主成分分析的推广,也是利用降维的思想,由研究原始变量相关矩阵的内部依赖关系出发,把一些具有错综复杂关系的多个变量归结为少数几个综合因子的一种多元统计分析方法。2020/1/1010zf2、因子分析的基本思想:根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量之间的相关性较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。因子分析将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。注意:原始变量是可观测的,而公共因子是不可观测的潜在变量。我们需要计算每个公共因子得分,从而替代原始变量。2020/1/1011zf3、主成分分析分析与因子分析差异:(1)主成分分析模型是原始变量的线性组合,是将原始变量加以综合、归纳;而因子分析是将原始变量加以分解。(2)主成分分析中,主成分载荷是唯一确定的;因子分析中因子载荷不是唯一的。(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释;而主成分分析对提取的主成分的解释能力有限。2020/1/1012zf例:对美国洛杉矶12个人口调查区的5个经济学变量的数据进行因子分析(12个地区调查表.sav)2020/1/1013zfCorrelationMatrix1.000.010.972.439.022.0101.000.154.691.863.972.1541.000.515.122.439.691.5151.000.778.022.863.122.7781.000总人口中等学校平均校龄总雇员数专业服务项目数中等房价Correlation总人口中等学校平均校龄总雇员数专业服务项目数中等房价2020/1/1014zfComponentMatrixa.581.806.767-.545.672.726.932-.104.791-.558总人口中等学校平均校龄总雇员数专业服务项目数中等房价12ComponentExtractionMethod:PrincipalComponentAnalysis.2componentsextracted.a.RotatedComponentMatrixa.016.994.941-.009.137.980.825.447.968-.006总人口中等学校平均校龄总雇员数专业服务项目数中等房价12ComponentExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.Rotationconvergedin3iterations.a.每个因子的载荷系数没有很明显的差别,所以不好命名.为了对因子进行命名,可以进行旋转,使系数向0和1两极分化第一主因子对中等学校平均校龄,专业服务项目,中等房价有绝对值较大的载荷(代表福利条件因子);第二主因子对总人口和总雇员数有较大的载荷(代表人口因子).2020/1/1015zf因子分析的基本步骤(1)因子分析的前提条件鉴定考察原始变量之间是否存在较强的相关关系,是否适合进行因子分析。如果原有变量相互独立,不存在相关关系,也就无需进行因子分析。(2)因子提取研究如何在样本数据的基础上提取综合因子。2020/1/1016zf(3)因子旋转通过正交旋转或斜交旋转使提取出的因子具有可解释性。(4)计算因子得分求解各样本在各因子上的得分,为进一步分析奠定基础。2020/1/1017zf(1)计算相关系数矩阵(correlationcoefficientsmatrix)如果相关系数矩阵中的大部分相关系数值均小于0.3,即各变量间大多为弱相关,原则上这些变量不适合进行因子分析。(2)巴特利特球度检验(Bartletttestofsphericity)其零假设H0:相关系数矩阵为单位矩阵(即原始变量之间无相关关系)。如果统计量卡方值较大且对应的sig值小于给定的显著性水平a时,零假设不成立。即说明相关系数矩阵不太可能是单位矩阵,变量之间存在相关关系,适合做因子分析。因子分析前提条件——相关性分析方法2020/1/1018zf(3)KMO(Kaiser-Meyer-Olkin)检验KMO检验的统计量是用于比较变量间简单相关系数矩阵和偏相关系数的指标,数学定义为:KMO值越接近1,意味着变量间的相关性越强,原有变量适合做因子分析;越接近0,意味变量间的相关性越弱,越不适合作因子分析。Kaiser给出的KMO度量标准:0.9以上非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。ijijijijijijiprrKMO2222020/1/1019zf因子分析不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析。如果每个公共因子的含义不清,则可对因子载荷阵进行旋转。因子旋转的目的:使每个变量在尽可能少的因子上有比较高的载荷,让某个变量在某个因子上的载荷趋于1,而在其他因子上的载荷趋于0。即:使载荷矩阵每列或行的元素平方值向0和1两极分化。因子旋转的目的及方法2020/1/1020zf因子旋转方法:•(1)正交旋转:在旋转时始终保持公因子之间的相互独立性。主要有以下方法:varimax方差最大旋转;quartmax四次最大正交旋转;equamax等量正交旋转•(2)斜交旋转:在旋转时,放弃了因子之间彼此独立的限制,旋转后的新公因子更容易解释。主要有以下的方法:directoblimin直接斜交旋转;promax斜交旋转方法。2020/1/1021zf生育率受社会、经济、文化、计划生育政策等很多因素影响,但这些因素对生育率的影响并不是完全独立的,而是交织在一起,如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能保留两三个变量,其他变量的信息就损失了。因此,考虑用因子分析的方法,找出变量间的数据结构,在信息损失最少的情况下用新生成的因子对生育率进行分析。选择的变量有:多子率、综合节育率、初中以上文化程度比例、城镇人口比例、人均国民收入。下表是1990年中国30个省、自治区、直辖市的数据。案例分析3:生育率的影响因素分析2020/1/1022zf多子率(%)综合节育率(%)初中以上文化程度比例(%)人均国民收入(元)城镇人口比例(%)0.9489.8964.51357773.082.5892.3255.41298168.6513.4690.7138.2114819.0812.4690.0445.12112427.688.9490.4641.83108036.122.890.1750.64201150.868.9191.4346.32138342.658.8290.7847.33162847.170.891.4762.36482266.235.9490.3140.85169621.242.692.4235.14171732.817.0787.9729.5193317.914.4488.7129.04131321.3615.2489.4331.0594320.43.1690.2137.85137227.349.0488.7639.7188015.5212.0287.2838.76124828.9111.1589.1336.3397618.2322.4687.7238.38184536.7724.3484.8631.0779815.133.2183.7939.44119324.054.7890.5731.2690320.2521.568622.3865419.9314.0980.8621.4995614.7232.3187.67.786512.5911.1889.7141.0193021.4913.886.3329.6993822.04
本文标题:SPSS数据的因子分析
链接地址:https://www.777doc.com/doc-2860010 .html