您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > (绝对经典)SPSS中主成分分析的基本操作
SPSS中主成分分析的基本操作Xiaowenzi22与pinksss共同制作阐述主成分分析法的原理主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。昀经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差昀打的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。主成分模型:F1=a11X11+a21X21+……+ap1XpF2=a12X12+a22X22+……+ap2Xp……Fp=a1mX11+a2mX22+……+apmXp其中a1i,a2i,……,api(i=1,……,m)为X的协差阵Σ的特征值多对应的特征向量,X1,X2,……,Xp是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。A=(ija)mp×=(,1α,2α…,mα),iiiRαλα=,R为相关系数矩阵,iiαλ、是相应的特征值和单位特征向量,1λ≥2λ≥…≥pλ≥0上述方程组要求:1、a21i+a22i+……+a2pi=1(i=1,……,m)2、mIAA=′(A=(ija)mp×=(,1α,2α…,mα),A为正交矩阵)3、Cov(Fi,Fj)=ijiδλ,=01ijδjiji≠=操作步骤:一、数据标准化1、2、在弹出对话框中把需标准化的变量选进Variable去并在下面的提示前打钩3、然后点“OK”4、数据编辑窗内将出现结果二、主成分分析基本操作1、2、选择后弹出现下面的对话框3、把标准化后的数据都选进Variables去4、点击5、弹出现下面的对话框6、在对话框的空白处填0,记得上面的图中要选中前面的点7、点击continue钮8、返回上个对话框9、如需要得到相关系数矩阵,点击10、弹出下面的对话框在Coefficients前的方框打上钩11、然后点击continue钮12、返回上个对话框,点击“OK”TotalVarianceExplained3.84948.11848.1183.84948.11848.1181.80822.59470.7121.80822.59470.7121.30616.32987.0421.30616.32987.042.5957.44394.485.5957.44394.485.2893.60898.092.2893.60898.092.078.97799.069.078.97799.069.057.71899.787.057.71899.787.017.213100.000Component12345678Total%ofVarianceCumulative%Total%ofVarianceCumulative%InitialEigenvaluesExtractionSumsofSquaredLoadingsExtractionMethod:PrincipalComponentAnalysis.三、提取特征向量1、在计算主成分的步骤中将出现因子载荷矩阵,我们可以取得每个主成分的方差,即特征根,它的大小表示了对应主成分能够描述原来所有信息的多少(更多情况下是由方差贡献率来反映)。一般来讲,为了达到降维的目的,我们只提取前几个主成分,由于前3个特征值累计贡献率达到87.042%,根据累计贡献率大于85%的原则,故选取前三个特征值。所以决定用三个新变量来代替原来的七个变量。但这三个新变量的表达还不能从输出窗口中直接得到,因为“ComponentMatrix”是指因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。2、将前三个因子载荷矩阵输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2、B3),然后利用“TransformÆcompute”,在对话框中输入“A1=B1/SQR(3.849)”[注:第二主成分SQR后的括号中填1.808,第三主成分SQR后的括号中填1.306],即可得到特征向量A1。同理,可得到A2、A3。然后就可以得出主成分表达式。四、主成分排名将特征向量与标准化后的数据相乘,就可以得到各个主成分得分Z1、Z2、Z3,若需求综合评价函数,还需在TransformÆcompute输入综合评价函数,Z1、Z2、Z3前的系数是主成分的方差贡献率。参考文献[1]张文彤主编《SPSS11统计分析教程(高级篇)》[M],北京希望电子出版社,2002年6月。[2]王芳《主成分分析与因子分析的异同比较及应用》,《统计教育》,2003年第5期。[3]于秀林任雪松,《多元统计分析》,中国统计出版社,1999年8月。ComponentMatrixa.855.477-.025.049-.133-.098.069.747-.614.083.103.086.179.088.916.352-.030.103-.094-.007.089.554-.688.330.231.169-.169-.031.627-.078.371-.680.028-.009-.021-.379-.095.851.132-.325.027.000-.285.682.569.086.346.024.046.893.355.063.179.001.081-.183¹úÃñÉú²ú×ÜÖµ(x1)¾ÓÃñÏû·Ñˮƽ(x2)¹Ì¶¨×ʲúͶ×Ê(x3)Ö°¹¤Æ½¾ù¹¤×Ê(x4)»õÎïÖÜתÁ¿(x5)¾ÓÃñÏû·Ñ¼Û¸ñÖ¸Êý(x6)ÉÌÆ·ÁãÊÛ¼Û¸ñÖ¸Êý(x7)¹¤Òµ×ܲúÖµ(x8)1234567ComponentExtractionMethod:PrincipalComponentAnalysis.7componentsextracted.a.
本文标题:(绝对经典)SPSS中主成分分析的基本操作
链接地址:https://www.777doc.com/doc-5671471 .html