您好,欢迎访问三七文档
因子分析理论与案例一、因子分析原理因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的变量归为一类,不同类间的变量的相关性则较低。每类变量代表了一个“共同因子”,即一种内在结构(联系)。因子分析就是寻找这种内在结构(联系)的方法。从全部计算过程来看作R型因子分析与作Q型因子分析都是一样的,只不过出发点不同,R型从相关系数矩阵出发,Q型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。(一)模型主要模型形式:(2)矩阵型式(二)相关概念解释pmpmppmmpFFFaaaaaaaaaXXX212121222211121121pmpmppmmmmFaFaFaXFaFaFaXFaFaFaX22211222221212112121111)1(展开式m1mXAF+p1pmm1p11mp2CovF0103DFIFF=1.01简记为:()()()()且满足:))(,)=)()=即不相关且方差1、因子载荷aij称为因子载荷(实际上是权数)。因子载荷的统计意义:就是第i个变量与第j个公共因子的相关系数,即表示变量xi依赖于Fj的份量(比重),心理学家将它称为载荷。2、变量共同度3、方差贡献率方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡量公因子相对重要程度的指标。通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。二、主要计算方法及步骤(一)方法说明1、因子载荷矩阵估计方法因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子im22iijj1ii11i22immi22ii11immi2222i1i2imi22ii22iiiXAihai1,,pXaF+aF++aF+VarXaVarFaVarFVaraaahX1h变量的共同度——因子载荷阵中第行元素的平方和,即:为了说明他的统计意义,将下式两边求方差,即()=()++()+()=由于已经标准化了,所以有:法的不同之处在于,其假定m个公因子只能解释原始变量的部分方差,利用变量共同度来代替相关矩阵中对角元素1,并以新矩阵为出发点求解特征值和特征向量。极大似然估计法假定公因子与特殊因子服从正态分布,通过构造似然函数求因子载荷和特殊因子方差的极大似然估计。2、因子旋转因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义。主因子的意义是根据主因子与可观测变量Xi的关系来确定的。因此希望主因子Fj对Xi(i=1,2,…,p)的载荷平方,有的值很大,有的值很小,(向0,1两极分化),因子载荷矩阵的这种特征称“因子简单结构”。但是用上述方法所求出的主因子解,初始因子载荷矩阵并不满足“简单结构准则”,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。为此须对因子载荷矩阵施行旋转,因子轴方差最大正交旋转的目的即使因子载荷矩阵成为“简单结构”的因子载荷矩阵。使得因子载荷的平方按列向0和1两极转化,较大的载荷值只集中在少数X变量上,达到其结构简化的目的。易于因子命名。经过旋转后,主因子对Xi的方差贡献(变量共同度)并不改变,但各主因子的方差贡献可能有较大的改变,即不再与原来相同,因此,可以通过适当的旋转求得令人满意的主因子。为了对公因子F能够更好的解释,可通过因子旋转的方法得到一个好解释的公因子。所谓对公因子更好解释,就是使每个变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。这种变换因子载荷的方法称为因子轴的旋转。因子旋转的方法很多,常用的为方差最大正交旋转。3、因子得分在分析中,人们往往更愿意用公共因子反映原始变量,这样更有利于描述研究对象的特征。因而往往将公共因子表示为变量(或样品)的线性组合,即:11111221221122221122ppppmmmmppfxxxfxxxfxxx称上式为因子得分函数,用它可计算每个样品的公因子得分。估计因子得分的方法很多。(二)计算步骤1、数据标准化2、建立相关系数矩阵3、求解特征根及相应特征向量4、因子旋转5、计算因子得分三、实证分析(一)、背景介绍随着市场竞争的日益激烈,公司在人才选择方面更加注重人才的综合素质,并结合职位特定选择专门人才。在本文中选取一家集生产与销售于一体的大公司在人才招聘中数据,从综合素质以及招聘职位来选择优秀的员工。“华威”公司是一家集生产、销售为一体的大型国际著名公司。现公司计划录用6名的员工。经过初选,公司对48位应聘者进行面试,面试共有15项指标,这15项指标分别是:求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)、经验(EXP)、驾驶水平(DRV)、事业心(AMB)、理解能力(GSP)、潜在能力(POT)、交际能力(KJ)和适应性(SUIT)。每项指标的分数是从0分到10分,0分最低,10分最高。每位求职者的15项指标的得分在文件(应聘者得分记录.xls)中。试从综合素质选出6名优秀员工,若将这6名员工分别分配到管理、销售和生产部门各2名,指出合理的分配方案。(二)、分析过程详解1、数据标准化由于数据均为在面试中的打分成绩,量纲相同,并且观察数据的分布,并无异常值的出现,因此数据没有必要进行标准化,可以直接进行分析。2、建立相关系数矩阵利用SPSS软件,correlate功能计算相关系数矩阵,计算皮尔森相关系数并进行卡方双尾检验,可以看出变量间存在这很大的相关性。进行相关系数矩阵检验——KMO测度和巴特利特球体检验:KMO值:0.9以上非常好;0.8以上好;0.7一般;0.6差;0.5很差;0.5以下不能接受。巴特利特球体检验原假设H0:相关矩阵为单位阵KMOandBartlett'sTest.784645.317105.000Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.Approx.Chi-SquaredfSig.Bartlett'sTestofSphericity通过观察上面的计算结果,可以知道,KMO值为0.784,在较好的范围内;而巴特利球体检验的sig值为0.00,拒绝原假设,说明相关矩阵并非单位矩阵,变量的相关系数较为显著。3、求解特征根及相应特征向量Spss选项:Analyze-DataReduction-Factor用Extraction,选择提取共因子的方法(如果是主成分分析,则选PrincipalComponents),用Rotation,选择因子旋转方法(如果是主成分分析就选None),用Scores计算因子得分,再选择Saveasvariables(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如Regression);要想输出ComponentScoreCoefficientMatrix表,就要选择Displayfactorscorecoefficientmatrix;输出结果如下:碎石图:151413121110987654321ComponentNumber86420EigenvalueScreePlot通过此图可以明显看出前五个因子可以解释大部分的方差,到第六个因子以后,线逐渐平缓,解释能力不强。因此我们提取5个公因子。方差贡献率选择5个公因子,从方差贡献率可以看出,其中第一个公因子解释了总体方差的50.092%,四个公因子的累计方差贡献率为86.42%,可以较好的解释总体方差。因子载荷矩阵ComponentMatrixa.445.615.381-.103.098.584-.051-.028.287.748.110.340-.519.696-.183.617-.186.562.378-.111.796-.357-.291-.189.004.863-.188-.181-.078-.178.433-.581.343.456-.055.889-.042-.224-.217.032.367.793.100.074-.089.864.066-.096-.171-.173.872-.098-.252-.218.140.909-.033-.141.082-.071.914.032-.088.206-.109.711-.118.564-.220-.096.647.603.108-.022.070求职信形式外貌专业能力讨人喜欢能力自信心洞察力诚实推销能力经验驾驶水平事业心理解能力潜在能力交际能力适应性12345Component5componentsextracted.a.通过因子载荷矩阵可以看出因子的意义并不是十分明确,为了对因子进行解释与说明,进行因子旋转,选取方差最大因子旋转方法,并保留因子得分。4、因子旋转旋转后的因子载荷矩阵:RotatedComponentMatrixa.107.830.097-.147.101.325.149.216.057.899.065.120-.013.946.038.230.240.875-.042.092.907-.110.142-.068.150.877.092.267.041.005.217-.247.848.022.161.897.220.078-.050.168.097.849-.046.231-.039.817.346.175-.012-.032.891.157.053-.074.270.808.249.313.157.145.747.320.398.247.135.460.362.565-.481-.031.370.795.051.071.152求职信形式外貌专业能力讨人喜欢能力自信心洞察力诚实推销能力经验驾驶水平事业心理解能力潜在能力交际能力适应性12345ComponentRotationconvergedin5iterations.a.通过上表中旋转的结果,我们可以看出第一个公因子在自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上有较大的载荷,可以将其命名为基本素质;第二个因子在求职信形式,经验,适应性上有较大的载荷,可以理解为工作经验素质;第三个因子在讨人喜欢能力,诚实,交际能力上有较大的载荷,可以命名为外在能力;第四个因子在专业能力上载荷较大,但在交际能力上的载荷为负相关,也从侧面反映了专业能力较强的人在交际上有一定的欠缺,这和目前一部分高校毕业生书本专业知识较强,但日常待人接物能力较差的现象相吻合,将其命名为专业素质;第五个因子仅在外貌上有较大的载荷,可以将其命名为外表。最后,通过上面的因子选注我们的评价指标可以通过五个主要的因子来表示,分别为基本素质,工作经验素质,外在能力,专业素质和外表。接下来计算各因子得分,并按照要求筛选优秀的应试者。5、计算因子得分ComponentScoreCoefficientMatrix-.112.375.002-.162.085-.128-.006-.052-.0411.033-.005-.004.073.737-.071-.140.070.506.037-.062.249-.173-.107-.055.007.216-.078.012.051-.209-.089-.160.494.102.039.21
本文标题:因子分析理论与案例
链接地址:https://www.777doc.com/doc-6426097 .html