您好,欢迎访问三七文档
休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院第3章因子分析要点3.1因子分析的基本思想3.2因子分析的数学模型(R型)3.3因子载荷的估计方法和因子旋转推荐阅读3.4因子得分3.5计算步骤与SPSS实现休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院返回第3章因子分析学习目的和要求:通过本章的学习,使学生了解因子分析问题提出的背景,掌握因子分析的基本思想和方法。了解主成分分析和因子分析的区别与联系。应用SPSS进行计算处理。休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1因子分析的基本思想返回3.1.1引例3.1.2因子分析的基本思想3.1.3与主成分分析的区别休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1因子分析的基本思想返回3.1.1引例3.1.2因子分析的基本思想3.1.3与主成分分析的区别引例1引例2休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院在企业经济效益的评价中,有经济效益的指标体系。通常这个指标体系有八项指标:固定资产利税率、资金利税率、销售收入利税率、资金利润率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等。这八项指标可概括为盈利能力、资金和人力利用、产值能耗三个方面。这三个方面在企业的生产经营活动中为主要因子,起着支配作用,企业要提高经济效益就要在这三个公共因子方面下功夫。3.1.1引例引例1休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。但消费者主要关心的是三个方面,即购物环境、商品价格和售后服务。因子分析方法可以通过24个变量,找出反映商店环境、商品价格和服务水平的三个潜在的因子,对商店进行综合评价。3.1.1引例引例2称是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分,称为特殊因子。321FFF、、iiiiiFaFaFa33221124,,1i这三个公共因子可以表示为:i休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院进一步可把这个简单因子模型推广到多个因子的情况,即影响百货商场形象X所共有的因子有m个,(分别记为F1,…,Fm)。另外,每个商场的形象还可能受一些独特因素影响,虽然这些公共因素和独特因素是客观存在的,但是又不能直接被测量到。3.1.1引例休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院百货商场的形象。,并解释分析,,变量来描述原始可测的相关和一个特殊因子也称为潜因子),,的公共因子个不可观测的相互独立用这pimimimiiiFFFaFaFampi112211(),,1(3.1.1引例休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1因子分析的基本思想返回3.1.1引例3.1.2因子分析的基本思想3.1.3与主成分分析的区别因子分析的含义因子变量的特点休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1.2因子分析的基本思想因子分析(factoranalysis)是一种数据简化的技术。它是通过寻找众多变量的公共因素来简化变量中存在的复杂关系的一种方法。它将多个变量综合为少数几个“因子”(假想变量),以再现原始变量与“因子”之间的相互关系。这几个因子能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子是不可观测的潜在变量。因子分析的含义休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院用统计语言来说:是通过对变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述原始多个变量(或样品)之间的相关(相似)关系。对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。3.1.2因子分析的基本思想因子分析的含义休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院通过因子分析得来的新变量是对每一个原始变量进行内部剖析,打比喻来说,原始变量就如成千上万的糕点,每一种糕点的原料都有面粉、油、糖及相应的不同原料,这其中,面粉、油、糖是所有糕点的共同材料,正如因子分析中的新变量即因子变量,正确选择因子变量后,如果想考虑成千上万糕点的物价变动,只需重点考虑面粉、油、糖等共因子的物价变动即可。3.1.2因子分析的基本思想所以因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。即因子分析就是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它把原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子构成的,另一部分是每个原始变量独自具有的因素,即特殊因子。休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1.2因子分析的基本思想因子分析分为两类,即R型因子分析(对变量作因子分析),Q型因子分析(对样品作因子分析)。这两种因子分析的处理方法一样,只是出发点不同,R型从变量的相关阵出发,Q型从样品相似阵出发。对一批观测数据,可以根据实际问题的要求来决定采用哪一种类型的因子分析。本章主要介绍R型因子分析。休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院因子分析(FactorAnalysis)是主成分分析的推广,它也是利用降维的思想,从研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合变量(因子)的一种多变量统计分析方法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关矩阵。3.1.2因子分析的基本思想休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院因子分析主要是由心理学家发展起来的,1904年chalesSpearman提出这种方法用来解决智力测验得分的统计分析。目前因子分析在心理学、社会学、经济学、人口学、地质学和教育学中都取得了成功的应用。3.1.2因子分析的基本思想休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1因子分析的基本思想返回3.1.1引例3.1.2因子分析的基本思想3.1.3与主成分分析的区别因子分析与回归分析因子分析与主成分分析休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1.3与主成分分析的区别因子分析与回归分析因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义。休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院主成分分析分析与因子分析不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。因子分析与主成分分析3.1.3与主成分分析的区别休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院因子分析与主成分分析的区别(参见主成分分析与因子分析的异同比较及应用):1、主成分分析不能作为一个模型来描述,它只是通常的变量变换;而因子分析需要构造因子模型。2、主成分分析中主成分的个数和变量的个数P相同,它是将一组具有相关性的变量变换为一组独立的变量(注意应用主成分分析解决实际问题时,一般只选取前m(mp)个主成分;而因子分析的目的是要用尽可能少的公因子,以便构造一个结构简单的因子模型。3、主成分分析是将主成分表示为可观测的原变量的线性组合;而因子分析是将原始变量表示为公因子和特殊因子的线性组合。另一方面,这两种分析方法之间在某些情况下也有一定联系,我们将从下面的介绍中看到。因子分析与主成分分析3.1.3与主成分分析的区别休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院表2休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.1.2因子分析的基本思想因子变量的特点这些综合指标称为因子变量,是原变量的重新组构;个数远远少于原变量个数,但可反映原变量的绝大部分方差;不相关性,对因子变量的分析能够为研究工作提供较大的便利;因子变量具有可命名解释性;休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院3.2因子分析的数学模型返回3.2.1初始因子模型(R型)3.2.2几个相关概念公共因子与特殊因子初始因子模型休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院因子分析把每个原始变量分解成两个部分:一部分是由所有变量共同具有的少数几个因子构成的,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因素部分。设为观察到的随机向量,是不可观测的向量(m应小于p)。于是:),,,(21mFFFF公共因子与特殊因子3.2.1初始因子模型(R型)p,,,21休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院设有n个样品,每个样品观测P个变量,为了对变量进行比较,并消除由于观测量纲的差异及数量级所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量的均值为0,方差为1。容易证明,经过这样的标准化变换不改变变量之间的相关系数,所以不失一般性。为方便,把原始观测变量和变换后的新变量均用X表示。设原公共因子变量为Y1,Y2,…,Ym,经标准化后的公共因子变量记为F1,F2,…,Fm(mP),如果:3.2.1初始因子模型(R型)公共因子与特殊因子休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院相等。与相关阵且协方差阵,协方差矩阵)(均值向量是可观测随机变量,且、REp,)cov(0,,,121)。,且方差皆为是相互独立的(不相关各分量即向量,协方差矩阵)(值向量均是不可观测的变量,其,,、1,)cov(0,,221FIFFEpmFFFFm3.2.1初始因子模型(R型)初始因子模型则模型:独立的,的各分量之间也是相互是对角阵,说明的协方差阵,)(且相互独立,与,,,、0,0),cov(321EFFp休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院因子模型的一般表达形式:Xi=ai1F1+ai2F2+…+aimFm+εi(i=1,…,p)pmpm2p21p1p2m2m22212121m1m2121111εFaFaFaxεFaFaFaxεFaFaFax3.2.1初始因子模型(R型)初始因子模型休息一下统计学专业主干课程——多元统计分析2007.8安徽财经大学统计与应用数学学院也可以矩阵的形式表示为:X=AF+ε式中Xi(i=1,2,…,m)和Fj(j=1,2,…,p)都是标准化变量。pmpmppmmpFFFaaaaaaaaa2121212222111211213.2.1初始因子模型(R型)初始因
本文标题:第三章-因子分析
链接地址:https://www.777doc.com/doc-3602991 .html