卡方检验解释

教学进程（包括：教学内容、学时分配、教学方法、辅助手段）Chi-Square过程三、操作过程：实例：某公司准备推出一个新品牌的矿泉水，现在新产品名称上几位董事意见尚未统一。董事会决定采用抽样调查的办法选择产品名称。在随机受访的200个人中，52人喜欢名称A，61人喜欢名称B，87人喜欢名称C，请问ABC三种名称受欢迎的程度有无差异？1、录入数据：TypeNumA52B61C872、data—weightcases—weightcasesby：frequencyvariable框内选入“num”（使频数变量为num）—ok3、analyse—nonparametrictests—chi-square—testvariablelist框内选入“type”（表示要检验的变量为type）—exact（计算确切概率）—continue—ok四、结果解释结果输出两个表格：1、type表：显示的是三个类别的观察频数、期望频数和残差。2、Teststatistics表：最终的检验结果，给出了卡方值、近似的P值和确切P值。表中最后一行为点概率值，即在总体中抽得当前样本的概率，在本例中无实际意义。通过P值大小来判断差异程度如何。五、实践操作：某地一周内各日患忧郁症的人数分布如下表，请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1。患病人数分布表周日患者1312383704805296247312教学进程（包括：教学内容、学时分配、教学方法、辅助手段）第一节Crosstabs过程详解一、卡方检验应用的环境：（一）定量变量与分类变量1、定量变量：变量取值是量的取值。表现为结果用数字表示。如：成绩变量：85、78、95、68、75、92、58、832、分类变量：变量取值是定性的，表现为互不相容的类别或属性。如：成绩变量：及格、不及格（1）有序分类变量：取值有序。如：“学习成绩”变量：不及格、及格、良好、优秀（2）无序分类变量：取值无序。如：“颜色”变量：红色、黄色、蓝色、绿色、紫色（二）卡方检验应用的环境：分类资料二、卡方检验过程（crosstabs过程）（一）分类资料数据录入格式简介采用频数表格式记录（P260），需要用“weightcases”过程指定相应的频数变量实例1：某医生用国产呋喃硝胺治疗十二指肠溃疡，以甲氰咪胍作对照组，问两种方法治疗效果有无差别？处理未愈合愈合合计呋喃硝胺85462甲氰咪胍204464合计2898126数据录入：确定三个变量：行变量“yw”、列变量“xg”和频数变量“rs”（注意“yw”和“xg”变量数据位字符型数据）。并根据表格录入数据，保存文件名为“治疗效果”。（二）crosstabs过程界面说明1、主对话框（1）行（rows）：用于选择行*列表中的行变量（2）列（columns）：用于选择行*列表中的列变量（3）层（layer）：用于设置分层分析变量（4）显示分组条形图（displayclusteredbarcharts）：可以直观反映各单元格内频数的多少。（5）压缩表（suppresstable）：禁止在结果中输出行*列表2、exact对话框（略）：用于设定针对2*2以上行*列表是否进行确切概率的计算，以及具体的计算方法。（1）Asymptoticonly：只计算近似的概率值，不计算确切概率（2）montecarlo：采用蒙特卡罗模拟方法计算确切概率值。即进行10000次抽样，给出确切概率以及99%可信区间。（默认值可以更改）（3）exact：计算出确切的概率值注意：在3*3及以上的行*列表中，确切概率的精确计算是极为漫长的过程。一般只需要选用蒙特卡罗模拟方法计算确切概率值的99%可信区间就行。3、统计量（statistics）对话框：（1）卡方检验（chi-square）：用于判断行、列标量是否独立。（注意：如果数据不满足其检验要求，即若有单元格期望数小于1，20%以上单元格期望数小于5，则会提示用户采用确切概率法分析）（2）相关（correlations）：Pearson相关系数和Spearman等级相关系数（3）名义（nominal）复选框：用于反映分类变量相关性的指标，有序和无序分类时都可用。（P263）（4）序数（ordinal）复选框：用于反映分类变量一致性指标。用于两个变量均属于有序分类变量（5）名义按间隔（nominalbyinterval）：包含一个变量为数值变量，而另一个变量为分类变量时度量两者关联度的指标（6）kappa：内部一致性系数（——0.4~0.75——）（7）风险（risk）：计算比数比和相对危险度（略，医学中常用）（8）McNemar：配对卡方检验一般只针对方形表格进行，即行、列分类数相同（9）cochran’sandmantel-haenszelstatistics：（略）为两个二分类变量进行独立性检验和同质性检验，同时可进行分层因素的调整。A、分层卡方检验；B、分层卡方检验的进一步发展；C、同质性检验。34、单元格（cells）对话框：（1）频数（counts）：是否输出实际观察数（observed）和理论数（expected）（2）百分比（percentages）：是否输出行百分数（row）、列百分数（column）及合计百分数（total）（3）残余（residuals）：选择残差的显示方式5、格式（format）：选择行变量是升序还是降序排列Crosstabs过程中详解：统计分析（Analyze）→描述性统计（descriptivestatistics）→交叉表（Crosstabs）→行（rows）：yw（药物）；列（columnns）：xg（性别）→统计（statistics）→勾选卡方（chi-square）→继续（continue）→确定（ok）卡方检验过程小结：第一步：输入数据（略）第二步：指定频数变量：weightcases—人数第三步：crosstabs过程（略）（三）结果解释：（P265）1、value：检验统计量值2、asymp.sig.2-sided：双侧近似概率3、exactsig.2-sided：双侧精确概率4、exactsig.1-sided：单侧精确概率5、Pearson卡方：常用的卡方检验（用于n≥40，T≥5）6、continuitycorrection：连续性校正卡方（用于n≥40，1≤T＜5）7、likelihoodratio：对数似然比卡方8、Fisher’sexacttest：Fisher’s确切概率法（用于n＜40，T＜1）9、linearbylinearassociation：线形相关卡方值三、本章练习：1、现有某班级男女生成绩统计如下表，试分析学生成绩是否与性别有关。成绩性别不及格及格男1418女17252、某研究者调查了一批高血压患者的血压控制情况和肥胖度，数据见下表。试分析两者间有无关系。血压控制情况合计良好尚可不良肥胖度不肥胖15241251轻度肥胖861024中/重度肥胖20131144合计4343331194内容第12章多选题分析-MultipleResponse菜单操作教学进程（包括：教学内容、学时分配、教学方法、辅助手段）第一节多选题概述一、多选题记录格式介绍：（一）多重二分法：将每个选择项都定义一个变量，每个变量俩取值：“有”和“无”。如：要了解病人采用了那些非药物方法来控制高血压，问题如下：确诊高血压后，您按照医生的建议采取了哪些非药物方法控制高血压？A、调理饮食B、做适宜运动C、保持情绪稳定D、其他措施则可以根据4个选项定义4个变量，每个变量取值为有或者无（二）多重分类法：如：请在下列20个品牌中选出您认为最信得过的几个（最多5个）品牌，并将代码填入下面空格中。1、2、3、4、候选品牌列表：1.长虹2.海尔……可以设置5个变量，均为多分类，每个变量代表受访者的一次选择，即记录的是被试选中品牌的代码。二、常用分析指标：（对多选题的分析一般以描述为主）1、应答人数百分比（percentofresponses）：选某项的人占总人数的百分比如：200个受访者中有178人选择了调理饮食以控制高血压，则调理饮食人数百分比为178/200=89.00%2、应答次数百分比（percentofresponses）：选某项的次数占总次数（总反应数）的比例。如：200个受访者对四种高血压控制方式分别选择了178、120、134、160次，则总的应答次数为592次，而调理饮食的应答次数百分比应为178/592=30.07%。三、SPSS相应模块介绍：Spss软件中为多选题的分析提供了全面的功能，具体来说有：1、tables模块：即customtables菜单可以为多选题生成各种复杂的频数表和交叉表，并计算表中各种比例指标。2、optimalscaling过程：用于非线性典型相关法（OVERALS）对多选题数据进行最优尺度分析（多重对应分析）。3、multipleresponse菜单：专门为多选题数据的描述而设计，用于生成频数表和交叉表。第二节definesets过程此过程用于将若干变量定义为多选题变量集。在这样定义后，多选题分析的专用过程就可以正确识别数据，并计算出如前所述的各种专门汇总指标。一、界面介绍：1、集合定义（setdefinition）：列出文件所有的数值型变量2、集合中的变量（variablesinsets）：选入需要加入同一个多选题变量集的变量列表，这些变量必须为多分类，并按照相同的方式来编码（如都用“1”代表“有”）。3、变量被编码成（variablesarecodedas）：选择变量集中变量的编码方式（1）二分变量（dichotomics）：变量为多重二分法编码方式。相应的数值在右侧方框中输入。（2）类型变量（categories）：变量为多重分类法编码方式。需要设定取值范围。4、名称（name）：输入多选题变量集的名称5、标签（label）：相应地定义一个名称标签6、多重回答集合（multresponsesets）：已定义好的变量集列表。（最多可以定义20个）二、定义集合（definesets）过程实例操作：（实例见文件“常见饮料喜好情况”）Analyze—multipleresponse—definesets—将“茶”、“牛奶”、“咖啡”、“果汁”、“矿泉水”输入variablesinset框中—选择dichotomics中输入“1”—在name和label框中分别输入多选题变量集名称和标签：“drink”和“平时爱喝的饮料”—add—close三、实践练习：某研究者做了一项关于大学生学习动机的调查，有道多选题是这样的：目前，你的课余时间主要用于（）（请最多选择三项）：A、上网B、看书学习C、做兼职，参与社会实践活动D、恋爱E、学生工作与学生社团活动F、参与科技创新活动G、其他（请注明）本次调查每位学生在本道题的回答结果已存入文件“学生学习动机调查1.xls”，请根据结果操作以下问题：1、请用各选项做自变量，并将数据输入到电脑中。52、定义变量集，变量集名称为kysj，标签为课余时间。第三节frequencies过程此过程的功能是为多选题变量集生成频数表。一、界面说明Table(s)for：需要进行频数统计的变量Missingvalues：用于选择对缺失值的处理方式二、操作过程实例：利用文件“饮料喜好情况.sav”，生成频数表。操作：Analyze—multipleresponse—frequencies—将“$drink”输入tablesfor框—ok。三、结果解释：通过频数表，可以反映各种饮料一共被选择了多少次，各种饮料分别选择的次数。右侧的两个百分比是多选题比较重要的输出：pctofreponses计算的是选择次数占总选择次数的比例；pctofcases计算的则是所有受访者中选择相应饮料者占总人数的比例。四、实践练习某研究者做了一项关于大学生学习动机的调查，有道多选题是这样的：目前，你的课余时间主要用于（）（请最多选择三项）：A、上网B、看书学习C、做兼职，参与社会实

卡方检验解释

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

网上服装店的设计毕业论文

地下室人防施工施工组织方案

房管党员的发展手册

物资管理

渠道案例分析奥妮借新品牌整合经销商

面向中国学生的日本留学咨询

工艺室部门职能

中兴通讯股份公司财务分析(ppt43)

财务战略2.ppt33页

土建预算的编制步骤

相关文档

相关搜索