您好,欢迎访问三七文档
第7章对应分析在市场细分研究实践中,我们往往遇到的问题就是到底是哪些不同背景(受教育程度、收入、职业等)的消费者在使用我们的产品,他们在消费行为上有什么差异,我们的产品品牌形象与竞争对手相比在消费者心目中究竟是怎样的等等。以往在分析时只是通过列联分析来表现他们之间的关系。如果仅仅是两个变量,且每个变量类别较少的时候表现的比较清楚,但在每个变量划分有多个类别的情况下就很难直观的揭示出变量之间的内在联系。对应分析方法(CorrespondenceAnalysis)又称相应分析是一种多元相依变量统计分析技术,是通过分析由定性变量构成的交互汇总数据来解释变量之间的内在联系的。同时,使用这种分析技术还可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。该统计研究技术在市场细分、产品定位、品牌形象以及满意度研究等领域正在越来越广泛的运用。学习目标•理解列联表分析及对应分析的基本思想•了解对应分析的基本理论•掌握对应分析的方法•能够用SPSS软件进行对应分析并正确理解输出结果列联表及列联分析某公司试图了解消费者对公司产品的满意情况,针对不同职业的消费者进行了调查,对调查资料整理如下表所示:以上是两变量列联表的一般形式,横栏与纵览交叉位置的数字是相应的频数。从上表数据就可以看到不同职业者对该公司产品的评价,所有调查者对该公司产品的总体评价;同时还可以看出职业分布与各种评价之间的相关关系。非常满意比较满意一般不太满意不满意汇总专业技术人员/教师/医生机关事业单位管理人员机关事业单位一般职员企业管理人员企业普通员工个体/私营业主学生离退休其他汇总一般地,假设按两个特性对事物进行研究,特性X有p类,特性Y有n类,属于和的个体数目为得到下面列联表其中:jXiY(1,2;1,2)ijninjpLL.12.121.2...1.2.,iiiipjjjnjnpnnnnnnnnNnnnnnnLLLLNXY12jpXXXXLL12inYYYYMM为了更方便的表示各频数之间的关系,通常用频率代替频数,即令,于是得到频率意义上的列联表显然,ijijnpn..11..11,1pniijjijjipnijijpppppp11121121222112121...1.'(,,)'(,,)jpjpiiijipnnnjnpInJpppppppppPppppppppPppPppLLLLMMMMMMMMLLLL12jpXXXXLL12inYYYYMMXY•行剖面和列剖面分析已知表示变量Y的第i状态与变量X的第j状态同时出现的概率,相应的就有边缘概率的含义。所谓行剖面是指当变量Y的取值定为i时,变量X的各个状态出现的概率,即矩阵P中第i行的每一个元素除以则第i行的行剖面为ijp..ijpp和.ip1...'()1,,ijipriiiiippppinpppLLL表示条件概率,|()PXjYiPXjYiPYi1.1pijjipp显然,.1pijijppQ所以,是p维超平面上的一个点。'rip121pxxxL同理可定义列剖面:为第j列的列剖面。它是n维超平面的一个点。行剖面分析例子:检查一部书的前后两部分是否出自一个人1...'()1,,jijnjcjjjjppppjppppLLL121nxxxL名词动词形容词副词冠词其他合计18030251560552652160605030120110530文章词汇类型列联表名词动词形容词副词冠词其他合计10.3020.1130.0940.0570.2260.208120.3020.1130.0940.0570.2260.2081文章词汇类型行剖面名词动词形容词副词冠词其他合计10.1010.0380.0310.0190.0750.0690.33320.2010.0750.0630.0380.1510.1380.667文章词汇类型频率列联表可断定,著作出自一人手笔。由此可知,对列联表做剖面处理很有必要,频率表两行直接比较易受边缘概率的影响•列联表的检验基本理论:如果特性X与特性Y之间相互独立,则检验的关键:对应分析的目标就是在原假设被否定后,进一步探讨两特性各状态之间的关系。2..ijijppp?..ijijppp012..22(1)(1)11..:()~pnijijnpijijHXYHXYpppNpp2:特性与特性相互独立特性与特性不独立构造统计量:对应分析的基本理论•行剖面点集N(r)对于一个频率矩阵第i个行剖面为记集合•N(r)的重心g在计算这些行剖面点的重心时,不能直接利用简单算术平均,因为这些状态(行剖面点)在总体(空间)重要程度不同。应利用其边缘概率作权重即()ijnpPp1...'()ijiprPiiiiippppRpppLL1(){',1,}riINrpinDPL.riipp的权重为1...()IIinpDdiagpppO则g的第j个分量为:所以恰好是特性Y的边缘分布。•行剖面点间的距离(目的是定义行剖面点到中心的距离)变量X的第k状态与第l状态的欧氏距离直接利用欧氏距离测度变量X不同状态的距离会受变量Y各状态边缘概率的影响,所以加入作权重221..(,)()'()()pkjljrrrrklkljklppdklpppppp.1/jp..11.nnijiijjiiipppppg.1..'()'jpJgppppLL得到两状态的加权距离用矩阵表示22.1..1(,)()()pkjljjjklppDklppp21.1..(,)()'()()rrrrklJklJJjpDklppDpppDdiagpppO.1.'(,,)JpPppL•行剖面点到重心的距离•行剖面点集N(r)的总惯量I(r)定义:n个行剖面点到重心的距离之和212..1.2.1..(,)()'()()/()rriJJiJpijjjjipijjjijDigppDpppppppppp222.....11111....22..11..()(,)()()()ppnnnijijiijijiijijijijpnijijijijppIrpDigpppppppppppppNg完全对应地,可以得到对列联表的列剖面的相应结论列剖面的重心:即特性X的边缘分布。列剖面的总惯量I(c)总惯量代表总体两个变量相互联系的总的信息量1...'()'inIgppppLL2()()IcIrN有了上述工具,我们可以直接计算某特性各状态之间的距离,通过距离的大小来反映各状态之间的接近程度,基于此状态进行合并,达到简化数据的目的。当然合并时的约束是原信息量损失最小。仅用距离来度量各状态之间的接近程度,并不能满足我们的需要(即对两种特性同时进行研究)。利用其他工具:主成分分析下面我们分别对行剖面点和列剖面点提取主成分来达到降维的目的。问题的关键在于建立行剖面点主成分与列剖面点主成分的关系。使得在得到行剖面点主成分的同时也可以得到列剖面点的主成分,同时可以将行剖面点和列剖面点的各特性同时表示在一个坐标平面中。主成分分析的结论:利用原始变量的协方差阵Σ的特征根λ1≥λ2≥…≥λp>0所对应的特征向量u1,u2,…,up作为系数向量,可依次得到原始变量的第1主成分、第2主成分、…第p主成分。且1122'''ppFuxFuxFuxL12()()()pVarFVarFVarFL()iiVarF•行剖面点集的主成分分析第一步:计算行剖面点集的协方差矩阵第二步:为了消除特性X不同状态概率不同的影响,对协方差进行加权处理()()'rEXEXXEX121111211.1.1.2212222.2.2.12...pprprnprnnnnnnXXXpppPppppppPppppppPpppLLLMMML1/21/21/21/21/21/211.1221122.2.1.2..[()()'][()][()]'JrJJJJJppppppDDDEXEXXEXDEDXEXDXEXXEXpXEXXEXXEXXEXpEpppXEXpLM211111122.1.1.1.2.1.222221122.2.1.2.2.2.1122..1..2..()()()()()()()()()()()()()()()()ppppppppppppppppppEXEXXEXEXEXEXEXXEXppppppEXEXXEXEXEXXEXEXEXppppppEXEXXEXEXEXXEXEXEXXEXppppppLLMML211212..1..1.2..1.111......1.1.1.2.1.2212..2.1..2.11....2.1.2.2()()()()()()()()(nnniiiiiiiipiiiiiiiipnniiiiiiiiiiiipppppppppppppppppppppppppppppppppppppppppLL2.2.1...2.212...1...2..111.......1..2..)()()()()()()nippiiipnnnipipipiiipipipiiiiiiiipppppppppppppppppppppppppppppppppppMML21121.1..1..2..1...111..1..1..2..1..22122.2..1..2..2.11..2..1..2..2.()()()()()()()()()(nnnipiiiiiiiipiiiiiiiiipnnipiiiiiiiiiiiiiiippppppppppppppppppppppppppppppppppppppppppppppppLL..1.212...1....2...111....1....2..21.1.1.1.2.21..1..1)()()()()()()()(npiipnnnipipipiipiipiipiiiiipiipiipniiiiiiiippppppppppppppppppppppppppppppppppppppppMML...1.1.11..2..1....22.2.1.1.2.2.2.2.111..2..1..2..2....1.1.....1)()()()()()()()()(nnippiiiiiiiiipnnnippiiiiiiiiiiiiiiiiipippiiiipipppppppppppppppppppppppppppppppppppppppppppppppLLMM....22.2.111....2..)()()()nnnippiippiiiiiiipiippppppppppppppppL11..111..1121..21..11..21..22..212..1222..22..12..22....1..12..2..1..2..'ppppppnpnpnnnnnnnprppppppppppppppppppppppppppppppZpppppppppppppppZZLLMML令:利用同样的分析思路得到列剖
本文标题:对应分析
链接地址:https://www.777doc.com/doc-5551397 .html