您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > Ch11-对应分析-151109.
Review:独立性检验(例题分析)【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-3所示,要求检验各个地区和原料质量之间是否存在依赖关系?(0.05)解:H0:地区和原料等级之间是独立的(不存在依赖关系)H1:地区和原料等级之间不独立(存在依赖关系)一级二级三级合计甲地区526424140乙地区605952171丙地区506574189合计16218815050045.3652.6455.4071.0656.7061.2464.3051.3042.00•P(甲∩一级)=P(甲)*P(一级)=(140/500)*(162/500)=0.09072•故甲区且一级原料的期望值为500*0.09072=45.36•Df=(3-1)*(3-1)=4独立性检验(例题分析)0.05(4)=9.488故拒绝H0,接受H1,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响然后呢?我应该跟哪个地区订原料?11.2.1对应分析的功能与意义1.研究分类变量间的联系。2.涉及的分类变量类别较多或者分类变量的个数较多时使用。3.对应分析的本质就是将行列变量的交叉表变换为一张散点图,从而将表格中包含的类别关联信息用各散点空间位置关系的形式表现出来。4.操作简单、结果直观并容易被解释,很受研究者的欢迎。11.2.2对应分析的优点定性变量划分的类别越多,这种方法的优势越明显。揭示行变量类别间与列变量类别间的联系。将类别联系直观地表现在二维图形中(对应图)。可以将名义变量或次序变量转变为间距变量。11.2.3对应分析的缺点不能用于相关关系的假设检验。维度要由研究者决定。有时候对应图解释比较困难。对极端值比较敏感。11.2.4对应分析对数据的格式两个变量间——简单对应分析。多个变量间——多元对应分析。11.2.2简单对应分析实例【例11.2】Fisher在1940年首次介绍列联表资料时使用的是一份关于眼睛颜色与头发颜色的调查研究数据。该研究数据包含了5387名苏格兰北部的凯斯纳斯郡的小学生的眼睛颜色与头发颜色,如下面的资料所示。试用对应分析方法研究眼睛颜色与头发颜色之间的对应关系。配书资料\源文件\11\正文\原始数据文件\案例11.2.sav对应分析表对应分析摘要TotalVarianceEigenvalueD1&D2相关系数拒絕Ho第一轴解释的惯量最多86.6%,最重要Eigenvalue惯量的平方根,是相关系数行信息表每一类所占总体的百分比坐标值在各个维度信息量在各类所间的分解状况各类信息量在所在各个维度间的分解状况TotalVariance列信息表多元对应分析的基本概念对多个定性变量的研究,其计算方法与两变量基本相同,但比简单对应分析更进一步。1.同时分析多个分类变量间的关系,並用二维图形展示。2.处理变量的种类更丰富。例如:顺序变量与连续变量。3.对多选题分析提供支持。范例说明这是一份关于绿色护肤品相关问题的学术研究问卷(请看问卷)。绿色护肤品是指选用天然植物原料、不添加防腐剂及人工色素、附有绿色环保标志,并且包装材料可回收利用的护肤品。第一部分:基本信息1.您的性别:□男□女2.您的年龄:□20岁以下□20-25□26-35□36-45□45岁以上3.您的教育背景:□大专以下□大专□大学本科□硕士研究生□博士及以上4.您的婚姻状态:□未婚□已婚5.您个人平均月收入金额□3000元及以下□3001-6000元□6001-9000元□9000元以上6.你认为绿色护肤品最应据有哪个特征:□1有绿色环保标志的护肤品□2不添加防腐剂的护肤品□3选用天然植物原料的护肤品□4不添加人工色素的护肤品□5包装可回收利用的护肤品□其他:多元对应分析步骤I多元对应分析步骤II所有變量均为分类变量多元对应分析步骤III多元对应分析步骤IV多元对应分析步骤V对应分析摘要特征性別年龄月收入对应分析图对应分析相关系数表辨别度量表辨别度量图辨别度量解释线段长度:线段长度越长,标明模型对改变量的解释性越好。图中可以看到年龄变量的线段最长,且在两个维度上的取值都较高,则模型对该变量的解释力最强。产品特征变量的线段最短,实际上它特别接近原点,则模型对该变量的解释力最弱。线段夹角:夹角越小,表明两变量间的关系越紧密。实际上,由于所有变量间的夹角都是较小的锐角,反映出各变量间均有一定的关系,而关系的强弱区分不大。课堂作业-HW4文件名:姓名-HW#-日期(例如:王大刚-HW4-150326)以下作业请提交一份Word文件(HW4)至MYSTU即可。迟交0分。HW4.1-老人健康自评和生活自理為了深入研究了影响老年人健康自评和生活自理能力的主要因素,进一步提高老年人的健康状况和生活自理能力,健全和完善老年人的社会保障制度和社会服务体系提出了相应的政策建议。中国老龄科学研究中心组织实施的“中国城乡老年人口状况一次性抽样调查“和”中国城乡老年人口状况追踪调查”的数据,详细分析了我国某城市老年人在2006年间的健康自评和生活自理能力状况,詳如下表:HW4.1-老人健康自评和生活自理生活自理能力完全自理部分自理不能自理合计自很好129148151评好931146961173健一般66011674850康差25110481436状很差1172341况没回答15132452合计19974003062703HW4.1-老人健康自评和生活自理1.请将下列统计量表复制到Word上:①对应分析摘要表②对应分析坐标值与贡献值(概述行、列点)③对应分析图2.请对下列问题提出解释:①两维度所累计解释的信息量百分比②由对应分析图阐述”自评健康状况”与”生活自理能力”两者的相关情况。③请对你的统计结果提出解释。HW4.2-“双十一”研究1.您的性别:□男□女2.您的年龄:□23岁及以下□24-33岁□34-43岁□44岁及以上3.您今年“双十一”购买的金额□200元以下□201-500元□501-1000元□1001-2000元□2001-5000元□5001元及以上4.您今年“双十一“购买的总金额是否超过了预算?□远远超出预算□相比预算,略有增加□与预算持平□相比预算,略有减少□远远低于预算□没有预算1.请对双11问卷4个分类变量作多元对应分析并将,将下列统计量表/图复制到Word上:①模型汇总表。②所有类别图。③对应分析图。④相关系数表。⑤辨别度量表。⑥辨别度量图。2.请对下列问题提出解释:①两维度所累计解释的信息量百分比②由对应分析图阐述所分析的4个变量之相关情况。③请由度量图线段长度,判别哪些变量对模型的解释性较强。④请由线段夹角與相關係數,判别变量间的关系强弱。⑤请對分析結果提出建议。
本文标题:Ch11-对应分析-151109.
链接地址:https://www.777doc.com/doc-2904749 .html