您好,欢迎访问三七文档
第七章因子分析实验目的:是使学生能熟练应用计算机软件进行因子分析与结果分析,培养实际应用能力;实验方法是上机操作;本章安排2个课时的上机实验;实验内容是SPSS软件中factoranalysis的计算机操作及结果分析.因子分析同主成分分析一样,也是一种简化和分析数据的方法。因子分析最早是心理学家提出来的,主要用于心理测验和分析上,后来用来对各种数据的分析。这种方法不同于主成分分析,它把每个变量分解为两部分因素,一部分是由这些变量内含的共同因素所构成的,即所谓公共因素部分,另一部分是每个变量各自独有的因素,即所谓独特因素部分或单一因素部分。因子分析关注的是找出这些公共的因子,利用少数的公共因子的线性函数与独特因素之和来解释原来的观测变量,并对这些公共因子的实际意义进行解释,而不是按分解的变差贡献大小来决定因子,这是和主成分分析的一个很大的差别。例如100个学生考试,考试成绩记为10021,,xxx,考题为30题,覆盖的知识面很广,但是总体上可以分为以下4个方面:数理逻辑、文学修养、历史知识、生活实践,设为4321,,,ffff,则我们可以建立如下的模型:iiiiiiiffffx44332211100,2,1i用这四个方面的一个线性组合再加上表示单个因素的i来解释第i个学生的考试成绩xi,其中4321,,,ffff称为公共因子,矩阵4100ij称为因子载荷矩阵,i是第i个学生的考试成绩不能被这四个因子解释的部分,称为特殊因子。因子分析就是要竭力找出这些公共因子和特殊因子,将观测值表示成这些因子的线性组合,并给这些因子以合理的解释,但是虽然所要讨论的变量的公共因子和特殊因子客观存在,但往往不能直接观测到,这也是因子分析问题的一个特点。应用SPSS软件中的数据文件car_sales.sav进行因子分析。SPSS操作步骤1.选择菜单项Analyze→DataReduction→Factor,如错误!未找到引用源。。2.打开FactorAnalysis对话框,将原始变量Vehicletype到Fuelefficiency移入Variables列表框中。如图7-2。如果不想使用全部的样本进行分析,且数据文件中存在一个选择变量的话,将该选择变量移入SelectionVariable框中,并单击右边的Value按钮,在跳出的窗口中输入一个筛选值,这样,只有选择变量的值等于输入的筛选值的case才能参与因子分析。图7-1图7-2FactorAnalysis对话框3.单击点击Extraction按钮,打开Extraction子对话框,如错误!未找到引用源。,设置有关因子提取的选项。在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项Principalcomponents,即“主成分法”。在Analyze选项栏中指定用于提取因子的分析矩阵,分别为相关系数矩阵(Correlationmatrix)和协方差矩阵(Covariancematrix)。如果选择相关系数矩阵,则表示首先对原始数据进行标准化,然后再进行因子分析;如果选择协方差矩阵,则表示直接对原始数据进行因子分析。这里我们选择默认的相关系数矩阵。在Display选项栏中指定与因子提取有关的输出项,其中,Unrotatedfactorsolutions表示输出旋转前的因子方差贡献表和旋转前的因子载荷阵;ScreePlot表示输出因子碎石图。因子碎石图其实就是样本协差阵的特征根按大小顺序排列的折线图,可以用来帮助确定提取多少个因子。典型的碎石图会有一个明显的拐点,拐点之前是较大特征根连接形成的陡峭折线,拐点之后是较小特征根连接形成的平缓折线,一般选择拐点之前的特征根数目为提取因子的数目。这里我们将两个选项都选中。在Extract选项栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvaluesover后的输入框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Numberoffactors后的输入框中输入要求提取的公因子的数目。这里我们保持默认选项。图7-3Extraction子对话框4.点击Rotation按钮,打开Rotation子对话框,如错误!未找到引用源。,设置有关因子旋转的选项。Method选项栏用于设置因子旋转的方法,可供选择的方法包括方差最大旋转法(Varimax)、直接斜交旋转法(DirectOblimin)、四次方最大正交旋转法(Quartmax)、平均正交旋转法(Equamax)、斜交旋转法(Promax),如果选择None选项,则不进行旋转。Display选项栏用于设置与因子旋转有关的输出项。其中,Rotatedfactorsolutions表示输出旋转后的因子方差贡献表和旋转后的因子载荷阵;Loadingplots表示输出旋转后的因子载荷散点图,旋转后因子散点图是以因子为坐标轴,以旋转后因子载荷为坐标的散点图,从该散点图中可以直观地观察因子载荷在各因子上的分布状况。这里我们在Method选项栏中选择Varimax(方差最大旋转),并选择Display栏中的Rotatedsolution复选框。图7-45.点击Scores按钮,打开FactorScores子对话框,如错误!未找到引用源。,设置有关因子得分的选项。选中Saveasvariables复选框,表示将因子得分作为新变量保存在数据文件中。提取了几个因子则会在数据文件中保存几个因子得分变量,变量名为“facm_n”,其中,m表示第m个因子,n表示进行第n次因子分析的结果。选中Displayfactorscorecoefficientmatrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。图7-5结果解释表7-1共同度表7-1给出了10个原始变量的变量共同度。变量共同度反映每个变量对提取出的所有公共因子的依赖程度。从错误!未找到引用源。来看,几乎所有的变量共同度都在80%甚至90%以上,说明提取的因子已经包含了原始变量的大部分信息,因子提取的效果比较理想。图7-6碎石图图7-6给出了因子的碎石图。图中横坐标为因子的序号,纵坐标为相应特征根的值。从图中可以看到,前3个因子的特征根普遍较高,连接成了陡峭的折线,而第4个因子之后的特征根普遍较低,连接成了平缓的折线,这进一步说明提取3因子是比较适当的。表7-2旋转后的因子载荷表7-2给出了旋转后的因子载荷矩阵,根据该表可以写出每个原始变量的因子表达式:321954.02478.9101.0FFEFtypeVehicle32102136.4345.3935.0PrFEFEFthousandsinice……根据变量的含意可对因子的经济意义进行分析,分别确定提取的3个因子的名称。表7-3因子得分系数矩阵表7-3给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算每个观测值的各因子的得分。本例中旋转后的因子得分表达式可以写成:efficiencyFuelcapacityFuelweightCurbLengthWidthWheelbaseHorsepowersizeEnginethousandsinicetypeVehicleF107.0012.0070.0105.0011.0177.0368.0226.0Pr414.0173.01…………由于我们在FactorScores子对话框中选择了Saveasvariables复选框,所以,在数据文件中会生成3个因子得分变量,变量名分别为:fac1_1、fac2_1、fac3_1。这里有两点值得注意的地方:(1)由于我们是以相关系数矩阵为出发点进行因子分析,所以,因子得分表达式中的各变量应该是经过标准化变换后的标准变量,均值为0,标准差为1。(2)由于因子载荷阵经过了旋转,所以,因子得分是不是利用初始的因子载荷阵,而是利用旋转后的因子载荷阵计算得到的。薃肀莂蒃袂肀肂虿袈聿芄薂螄肈莇螇蚀肇葿薀罿肆腿莃袅肅芁薈螁膄莃莁蚇膄肃薇薃膃芅荿羁膂莈蚅袇膁蒀蒈螃膀膀蚃虿腿节蒆羈芈莄蚁袄芈蒆蒄螀芇膆蚀蚆袃莈蒃蚂袂蒁螈羀袁膀薁袆袁芃螆螂袀莅蕿蚈衿蒇莂羇羈膇薇袃羇艿莀蝿羆蒂薆螅羅膁蒈蚁羅芄蚄罿羄莆蒇袅羃蒈蚂螁羂膈蒅蚇肁芀蚁薃肀莂蒃袂肀肂虿袈聿芄薂螄肈莇螇蚀肇葿薀罿肆腿莃袅肅芁薈螁膄莃莁蚇膄肃薇薃膃芅荿羁膂莈蚅袇膁蒀蒈螃膀膀蚃虿腿节蒆羈芈莄蚁袄芈蒆蒄螀芇膆蚀蚆袃莈蒃蚂袂蒁螈羀袁膀薁袆袁芃螆螂袀莅蕿蚈衿蒇莂羇羈膇薇袃羇艿莀蝿羆蒂薆螅羅膁蒈蚁羅芄蚄罿羄莆蒇袅羃蒈蚂螁羂膈蒅蚇肁芀蚁薃肀莂蒃袂肀肂虿袈聿芄薂螄肈莇螇蚀肇葿薀罿肆腿莃袅肅芁薈螁膄莃莁蚇膄肃薇薃膃芅荿螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄薆袀腿蕿蒂衿芁莂螁袈羁薇蚇袇肃莀薃羆膅薆葿羆芈荿螇羅羇膁螃羄膀莇虿羃节芀薅羂羂蒅蒁羁肄芈螀羀膆蒃蚆肀芈芆薂聿羈蒂蒈肈肀芅袆肇芃薀螂肆莅莃蚈肅肅薈薄蚂膇莁蒀蚁艿薇蝿螀罿荿蚅蝿肁薅薁螈膄莈薇螈莆膀袆螇肆蒆螁螆膈艿蚇螅芀蒄薃螄羀芇葿袃肂蒃螈袂膄芅蚄袂芇蒁蚀袁肆芄
本文标题:第七章因子分析
链接地址:https://www.777doc.com/doc-2209010 .html