您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 量表的因子分析-8-3
因子分析(FactAnalysis)因子分析是多元统计技术的一个分支,其目的是浓缩数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(公共因子)来表示基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,将这些假想变量称为基础变量,即因子(Factors)。因子分析就是研究如何以最少的信息丢失把众多的观测变量浓缩为少数几个因子的过程。两个主要应用寻求基本结构、检验结构效度——在多元分析中,经常碰到观测变量很多且变量之间存在着较强的相关关系的情形,这不仅给问题的分析和描述带来一定困难,而且在使用某些统计方法时会出现问题。数据简化——通过因子分析把一组观测变量化为少数几个因子后,可以进一步将原始观测变量的信息转换成这些因子的因子值,然后用这些因子代替原来的观测变量进行其他统计分析,如回归分析、路径分析、判别分析和聚类分析,利用因子值也可以直接对样本进行分类和综合评价。因子分析的基本假设,是因子隐含在许多可观察的现实事物的背后。虽然难以直接测量,但是可以从复杂的外在现象中计算、估计。其数学原理的共变的抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分。因子的提取也是根据共同相关的得分而决定。一般说来,研究者事先对观测数据背后存在多少个因子、因子如何抽取、因子的内容以及变量的分类等一无所知,未有任何事前的假定,而由因子分析的过程来决定。这种类型的应用称为探索性因子分析(EFA),因子分析的大部分应用都属于这种类型。探索性因子分析(ExploratoryFactorAnalysis;EFA)有的情况下,研究者根据某些理论或其他先验知识可能对因子的个数或因子的结构作出假设,因子分析也可以用来检验这个假设,作为证实假设的工具,这种类型的应用称为证实性(CFA)因子分析。证实性因子分析(ConfirmatoryFactorAnalysis;CFA)探索性因子分析步骤第一步:通过共变关系的分解,找出最低限度的主要成分(principalcomponent)或共同因子(commonfactor)。第二步:探讨这些主成分或共同因子与个别的变量的关系,找出观测变量与其相对应因子的强度,即因子负荷值或负载值(factorloading),以说明因子与所属的观察变量的关系与强度。第三步:决定因子的内容,为因子取一个合适的名字。變數Xi因素fj2ij2ij因子分析的条件因子分析的变量都必须是连续变量,符合线性相关的假设。顺序与类别变量不得使用因子分析简化结构。抽样的过程必须具有随机性,并具有一定的规模。如果研究的总体具有较高的同质性(如学生样本),变量数目不多,样本数可以介于100~200之间;Gorsuch(1983)建议样本数最少为变量数的5倍,且大于100。因子分析的原理1.因子分析模型imimiiiiUFaFaFaFaX332211因子分析模型在形式上和多元回归模型相似,每个观测变量由一组因子的线性组合来表示。上式中,F1,F2,……Fm叫公共因子(Commonfactors),它们是各个观测变量所共有的因子,解释了变量之间的相关。Ui称为特殊因子(Uniquefactor),它是每个观测变量所特有的因子,相当于多元回归中的残差项,表示该变量不能被公共因子所解释的部分。aim称为因子负载(Factorloading),它是第i个变量在m个公共因子上的负载,相当于多元回归分析中的标准回归系数。相關矩陣1.000.293.462.409.291.136.445.477.337.370.2931.00.347.200.621.284.279.300.465.263.462.3471.000.474.359.182.495.461.341.353.409.200.4741.00.201.036.508.447.301.346.291.621.359.2011.000.363.332.333.553.275.136.284.182.036.3631.00.096.137.250.092.445.279.495.508.332.0961.000.584.378.412.477.300.461.447.333.137.5841.000.338.452.337.465.341.301.553.250.378.3381.000.325.370.263.353.346.275.092.412.452.3251.000大體來說,我對我自己十分滿意(X1)有時我會覺得自己一無是處(X2)我覺得自己有許多優點(X3)我自信我可以和別人表現得一樣好(X4)有時候我的確感到自己沒有什麼用處(X5)我時常覺得自己沒有什麼好驕傲的(X6)我覺得自己和別人一樣有價值(X7)我十分地看重自己(X8)我常會覺得自己是一個失敗者(X9)我對我自己抱持積極的態度(X10)相關X1X2X3X4X5X6X7X8X9X10因子分析的数学原理(相关矩阵)因子分析的基础是变量之间的相关。分析相关矩阵代表的意义。如果“自尊”用Y来表示,其他10个选项的分数以X1到X10表示,则Y的得分可以用以下数学模型预测得到:Y=b1X1+b2X2+b3X3+……+b10X10+U因子分析中的因子负载(负荷)因子负荷是因子分析中的最重要的统计量,它是连接观测变量和公共因子之间的纽带。因子负荷不仅表示观测变量如何由因子线性表示的,而且也反映了因子和变量之间的相关关系。假如我们得到了5个观测变量、2个公共因子的情形:X1=0.9562F1+0.2012F2+0.2126U1X2=0.8735F1+0.2896F2+0.3913U2X3=0.1744F1+0.8972F2+0.4057U3X4=0.5675F1+0.7586F2+0.3202U4X5=0.8562F1+0.3315F2+0.3962U5可以看出,公共因子F1与变量X1、X2、X4、X5关系密切,它主要代表了这些变量的信息。F2与变量X3、X4关系密切,它主要代表了这两个变量的信息。F1F2hi2X10.95620.20120.9548X20.87350.28960.8469X30.17440.89720.8354X40.56750.75860.8975X50.85620.33150.8430hi2=ai12+ai22+……+aim2(i=1,2,……p)表明F1和F2两个因子解释了X1变量信息的95.48%。公共因子方差(Communality),或共同度指观测变量方差中由公共因子决定的比例。变量的方差由两部分组成,一部分由公共因子决定,一部分由特殊因子决定(即残差)。公共因子方差表示原始变量方差能被公共因子所解释的部分,共同度越大,变量能被因子说明的程度越高。一个原始变量的共同度等于因子负荷矩阵中该变量所在行的所有元素的平方和。对上例,计算出每个变量的公共因子方差为:共同度这个指标以观测量为中心,其意义在于说明如果用公共因子替代观测变量后,原来的每个变量的信息被保留的程度。因子贡献(Contributions)特征值(eigenvalue)一个因子的特征值等于因子负荷矩阵中该变量所在列的所有元素的平方和,表示该因子所能解释的方差。因子Fj所能解释的方差所占的比例叫做该因子的贡献率。其计算公式为:F1F2hi2X10.95620.20120.9548X20.87350.28960.8469X30.17440.89720.8354X40.56750.75860.8975X50.85620.33150.8430特征值:2.76281.614684Fj贡献率:0.5520.323表明第一个因子F1解释了所有变量总方差的55%,第二个变量解释了上述总方差的32%,两个因子一共解释了总方差的87%。),2,1(/22221mjpaaaFpjjjj)(的贡献率因子分析的主要步骤:第一步:计算所有变量的相关矩阵。相关矩阵是因子分析直接要用的数据,根据相关矩阵还应该进一步判断应用因子分析方法是否合适。第二步:提取因子。这一步是确定因子的个数和求因子解的方法。第三步:是进行因子旋转。这一步的目的是通过坐标轴变换使因子解的实际意义更容易解释。第四步:计算因子值。因子值是各个因子在每个观测量上的得分,有了因子值可以在其他的分析中使用这些因子。前提是观测变量之间应该有较强的相关关系。如果变量之间的相关程度很小的话,他们不可能共享因子。所以,计算出相关矩阵后,应对相关矩阵进行检验,如果相关矩阵的大部分相关系数都小于0.3,则不适合做因子分析。SPSS提供了三个统计量帮助判断观测数据是否适合做因子分析。1.反映象相关矩阵(Anti-imagecorrelationmatrix)其元素等于负的偏相关系数。偏相关是控制其他变量不变,一个自变量对因变量的独特解释作用。如果数据中确实存在公共因子,变量之间的偏相关系数应该很小,因为它与其他变量重叠的解释影响被扣除掉了。所以如果反映象相关矩阵中很多元素的值比较大,应该考虑该观测数据不适合做因子分析。KMO與Bartlett檢定.8795569.70345.000Kaiser-Meyer-Olkin取樣適切性量數。近似卡方分配自由度顯著性Bartlett球形檢定Barlett球形检验呈现显著表示相关系数足以作为因子分析抽取之用2.巴特勒球形检验(Bartlett’stestofsphericity)该统计量从检验整个相关矩阵出发,其零假设为相关矩阵是单位阵(我们一般将对角元素为1,其余元素为0的矩阵称为单位阵)。如果检验的结果无法拒绝零假设,那么,因子分析的使用就可能是不适当的,应该重新考虑。另外,需要注意的是,随着样本量的增加,巴特勒球形检验对检验出变量间的相关也会变得更为敏感。KMO统计量因子分析适合性0.90以上极佳0.80以上良好0.70以上中度0.60以上平庸0.50以上可悲0.50以下无法接受KMO與Bartlett檢定.8795569.70345.000Kaiser-Meyer-Olkin取樣適切性量數。近似卡方分配自由度顯著性Bartlett球形檢定3.KMO(kaiser-Meyer-OlkinMeasureofSamplingAdequacy)测度该测度从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化范围从0~1。当所有变量之间的偏相关系数的平方和,远远小于简单相关系数的平方和时,KMO值接近1。KMO值较小时,表明观测变量不适合做因子分析。通常按以下标准解释该指标的大小:因子抽取的目的在于决定测量变量中,存在着多少个潜在的成分或因子。因子的抽取(Factorextraction)方法一类是基于主成分分析模型的主成分法。在因子分析着占重要地位。一类是基于公共因子模型的公因子法,包括主轴因子法、极大似然法、最小二乘法、alpha法等。主成分法(Principalcomponentsanalysis)是一种数学变换方法,它把给定的一组(如k个)相关变量通过线性变换成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一个变量具有最大的方差,称为第一主成分,第二个变量的方差次之,并且和第一个变量不相关,称为第二主成分,依次类推,k个变量就有k个主成分,最后一个主成分具有的方差最小,且和前面的主成分都不相关。因子数的确定有k个变量就有k个成分,但是因子分析的目的是为了简化数据。于是,提取前几个主成分作为初始因子,需要几个因子能代表原来数据中的主要信息呢?目前没有精确的定量方法,实际应用中借助一些准则类判断:1.特征值准则取特征值大于1的主成分作为初始因子,放弃特征值小于1的主成分。因为每个变量的方差为1,该准则认为每个保留下来的因子至少应该能解释一个变量的方差,否则达不到精简的目的。2.碎石检验准则(ScreeTestCriterion)按照因子被提取的顺序,画出因子的特征值随因子个数变化的散点图,
本文标题:量表的因子分析-8-3
链接地址:https://www.777doc.com/doc-6345235 .html