您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第6章--因子分析法
因子分析的原理与模型因子分析的计算步骤及应用实例第六章因子分析因子因子分析分析的原的原理与理与模型模型什么叫因子分析因子分析的模型因子分析的统计意义因子载荷矩阵的估计方法因子旋转因子得分定义解释因子分析是主成分分析的推广和发展,它是把具有复杂关系的多个变量(或样品)综合为少数几个因子,并给出原始变量与综合因子之间的相关关系的多元统计分析方法种类R型因子分析(对变量进行因子分析)Q型因子分析(对样品进行因子分析)什么叫因子分析基本思想通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量(不可观测)去描述多个变量之间的相关关系;然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系。因此,因子分析的出发点是原始变量的相关矩阵。因子因子分析分析的模的模型型几个重要概念:(1).因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因子对相应原变量的贡献力大小。(1).因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因子对相应原变量的贡献力大小。(2).变量共同度:对某一个原变量来说,其在所有因子上的载荷的平方和就叫做该变量的共同度。它反映了所有公共因子对该原变量的方差(变异)的解释程度。如果因子分析结果中大部分变量的共同度都高于0.8,说明提取的公共因子已经基本反映了原变量80%以上的信息,因子分析效果较好。变量共同度是衡量因子分析效果的常用指标。(2).变量共同度:对某一个原变量来说,其在所有因子上的载荷的平方和就叫做该变量的共同度。它反映了所有公共因子对该原变量的方差(变异)的解释程度。如果因子分析结果中大部分变量的共同度都高于0.8,说明提取的公共因子已经基本反映了原变量80%以上的信息,因子分析效果较好。变量共同度是衡量因子分析效果的常用指标。(3).公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和,它反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。(3).公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和,它反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。因子因子分析分析的模的模型型数学模型建立了因子分析模型的目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清,则不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。使因子载荷阵的结构简化,使载荷矩阵中每列或行的元素平方值向0和1两极分化。为什么要旋转因子因子因子旋转旋转因子因子旋转旋转含义:因子旋转是根据因子载荷矩阵的不唯一性,用一个正交矩阵右乘因子载荷矩阵,实行旋转(由线性代数,一次正交变换,对应坐标系的一次旋转),使旋转后的因子载荷矩阵结构简化,以便对公共因子进行合理的解释。所谓结构简化就是使得每个变量仅在一个公共因子上有较大的载荷,而在其他的公共因子上的载荷比较小。常用的方法有:正交旋转、斜交旋转等。最常用的是方差最大正交旋转。方差方差最大最大正交正交旋转旋转方差最大正交旋转是使因子载荷矩阵中,各因子载荷值的总方差达到最大作为因子载荷矩阵结构简化的准则。其中,总方差最大,而不是某个因子方差极大。即如果第i个变量在第m个公共因子上的载荷经过“方差极大”旋转后,其值增大或减少,意味着这个变量在另一些公共因子上的载荷要缩小或增大。所以“方差极大”旋转是使载荷值按照列向0,1两极分化,同时也包含着按行向两极分化。12四次方最大旋转四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上有较高的载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差达到最大。因子因子得分得分因子因子分析分析的计的计算步算步骤及骤及应用应用实例实例计算步骤第一步:数据标准化第二步:计算相关系数矩阵第三步:计算相关系数矩阵的特征值以及特征向量第四步:确定综合因子数以及因子结构和因子模型综合因子数的确定:依据定义依据贡献比例第五步:计算因子得分应用实例因子分析的应用条件Bartlett球形检验(1)因子分析的原始变量之间必须有相关性,如果变量之间相互独立,则无法用主成分分析法来进行数据降维。Bartlett球形检验的假设为原假设:相关系数矩阵为单位矩阵(即变量互不相关)。备择假设:相关系数矩阵不是单位矩阵(即变量之间有相关关系)。Bartlett球形检验(2)SPSS将提供Bartlett球形检验的卡方统计量的值、相应的自由度和显著性值。如果显著性值小于0.05,则认为因子分析是适宜的。卡方统计量的值越大,变量之间的相关性越强。KMO统计量(1)KMO统计量比较样本相关系数和样本偏相关系数,它用于检验样本是否适于作因子分析。KMO统计量的取值在0和1之间,该值越大,则样本数据越适于作因子分析。一般要求该值大于0.5,方可以应用因子分析。KMO统计量(2)生育率的影响因素分析生育率受社会、经济、文化、计划生育政策等很多因素影响,但这些因素对生育率的影响并不是完全独立的,而是交织在一起,如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能保留两三个变量,其他变量的信息就损失了。因此,考虑用因子分析的方法,找出变量间的数据结构,在信息损失最少的情况下用新生成的因子对生育率进行分析。选择的变量有:多子率、综合节育率、初中以上文化程度比例、城镇人口比例、人均国民收入。下表是1990年中国30个省、自治区、直辖市的数据。21多子率(%)综合节育率(%)初中以上文化程度比例(%)人均国民收入(元)城镇人口比例(%)0.9489.8964.51357773.082.5892.3255.41298168.6513.4690.7138.2114819.0812.4690.0445.12112427.688.9490.4641.83108036.122.890.1750.64201150.868.9191.4346.32138342.658.8290.7847.33162847.170.891.4762.36482266.235.9490.3140.85169621.242.692.4235.14171732.817.0787.9729.5193317.914.4488.7129.04131321.3615.2489.4331.0594320.43.1690.2137.85137227.349.0488.7639.7188015.5212.0287.2838.76124828.9111.1589.1336.3397618.2322.4687.7238.38184536.7724.3484.8631.0779815.133.2183.7939.44119324.054.7890.5731.2690320.2521.568622.3865419.9314.0980.8621.4995614.7232.3187.67.786512.5911.1889.7141.0193021.4913.886.3329.6993822.0425.3481.5631.3110027.3520.8481.4534.59102425.8239.664.938.47137431.91EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.02011.0000特征根与各因子的贡献Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962没有旋转的因子结构在这个例子中我们得到了两个因子,第一个因子是社会经济发展水平因子,第二个是计划生育因子。有了因子得分值后,则可以利用因子得分为变量,进行其他的统计分析。Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋转后的因子结构标准化得分函数对全国30个省市自治区的经济发展八项指标作因子分析。CorrelationMatrix1.000.237.946.203.615-.271-.267.873.2371.000.442.741-.214-.213-.579.299.946.4421.000.400.431-.280-.363.792.203.741.4001.000-.355-.135-.540.105.615-.214.431-.3551.000-.253.017.659-.271-.213-.280-.135-.2531.000.762-.125-.267-.579-.363-.540.017.7621.000-.197.873.299.792.105.659-.125-.1971.000Zscore:GDPZscore:居民消Zscore:固定资Zscore:职工平Zscore:货物周Zscore:居民消指数Zscore:商品零指数Zscore:工业总Correlatscore:GDscore:居民消费水平score:固定资产投资score:职工平均工资Zscore:货物周转量score:居民消费价格指数score:商品零售价格指数Zscore:工业总产值Communalities1.000.9451.000.8221.000.9141.000.8701.000.8621.000.9551.000.9261.000.899Zscore:GDPZscore:居民消费水平Zscore:固定资产投资Zscore:职工平均工资Zscore:货物周转量Zscore:居民消费价格指数Zscore:商品零售价格指数Zscore:工业总产值InitialExtractionExtractionMethod:PrincipalComponentAnalys各变量中信息被三个公因子提取出的比例TotalVarianceExplained3.72646.57946.5793.72646.57946.5793.19439.92539.9252.23727.96674.5442.23727.96674.5442.25528.18968.1151.23015.37189.9151.23015.37189.9151.74421.80089.915.3484.34994.264.2152.68396.947.1571.96298.909.072.90199.811.015.189100.000Compo12345678TotalofVarianumulativeTotalofVarianumulativeTotalofVarianumulativeInitialEigenvaluestionSumsofSquaredLoaonSumsofSquaredLoaExtractionMethod:PrincipalComponentAnalysis.
本文标题:第6章--因子分析法
链接地址:https://www.777doc.com/doc-4665682 .html