您好,欢迎访问三七文档
教学进程(包括:教学内容、学时分配、教学方法、辅助手段)Chi-Square过程三、操作过程:实例:某公司准备推出一个新品牌的矿泉水,现在新产品名称上几位董事意见尚未统一。董事会决定采用抽样调查的办法选择产品名称。在随机受访的200个人中,52人喜欢名称A,61人喜欢名称B,87人喜欢名称C,请问ABC三种名称受欢迎的程度有无差异?1、录入数据:TypeNumA52B61C872、data—weightcases—weightcasesby:frequencyvariable框内选入“num”(使频数变量为num)—ok3、analyse—nonparametrictests—chi-square—testvariablelist框内选入“type”(表示要检验的变量为type)—exact(计算确切概率)—continue—ok四、结果解释结果输出两个表格:1、type表:显示的是三个类别的观察频数、期望频数和残差。2、Teststatistics表:最终的检验结果,给出了卡方值、近似的P值和确切P值。表中最后一行为点概率值,即在总体中抽得当前样本的概率,在本例中无实际意义。通过P值大小来判断差异程度如何。五、实践操作:某地一周内各日患忧郁症的人数分布如下表,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1。患病人数分布表周日患者1312383704805296247312教学进程(包括:教学内容、学时分配、教学方法、辅助手段)第一节Crosstabs过程详解一、卡方检验应用的环境:(一)定量变量与分类变量1、定量变量:变量取值是量的取值。表现为结果用数字表示。如:成绩变量:85、78、95、68、75、92、58、832、分类变量:变量取值是定性的,表现为互不相容的类别或属性。如:成绩变量:及格、不及格(1)有序分类变量:取值有序。如:“学习成绩”变量:不及格、及格、良好、优秀(2)无序分类变量:取值无序。如:“颜色”变量:红色、黄色、蓝色、绿色、紫色(二)卡方检验应用的环境:分类资料二、卡方检验过程(crosstabs过程)(一)分类资料数据录入格式简介采用频数表格式记录(P260),需要用“weightcases”过程指定相应的频数变量实例1:某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别?处理未愈合愈合合计呋喃硝胺85462甲氰咪胍204464合计2898126数据录入:确定三个变量:行变量“yw”、列变量“xg”和频数变量“rs”(注意“yw”和“xg”变量数据位字符型数据)。并根据表格录入数据,保存文件名为“治疗效果”。(二)crosstabs过程界面说明1、主对话框(1)行(rows):用于选择行*列表中的行变量(2)列(columns):用于选择行*列表中的列变量(3)层(layer):用于设置分层分析变量(4)显示分组条形图(displayclusteredbarcharts):可以直观反映各单元格内频数的多少。(5)压缩表(suppresstable):禁止在结果中输出行*列表2、exact对话框(略):用于设定针对2*2以上行*列表是否进行确切概率的计算,以及具体的计算方法。(1)Asymptoticonly:只计算近似的概率值,不计算确切概率(2)montecarlo:采用蒙特卡罗模拟方法计算确切概率值。即进行10000次抽样,给出确切概率以及99%可信区间。(默认值可以更改)(3)exact:计算出确切的概率值注意:在3*3及以上的行*列表中,确切概率的精确计算是极为漫长的过程。一般只需要选用蒙特卡罗模拟方法计算确切概率值的99%可信区间就行。3、统计量(statistics)对话框:(1)卡方检验(chi-square):用于判断行、列标量是否独立。(注意:如果数据不满足其检验要求,即若有单元格期望数小于1,20%以上单元格期望数小于5,则会提示用户采用确切概率法分析)(2)相关(correlations):Pearson相关系数和Spearman等级相关系数(3)名义(nominal)复选框:用于反映分类变量相关性的指标,有序和无序分类时都可用。(P263)(4)序数(ordinal)复选框:用于反映分类变量一致性指标。用于两个变量均属于有序分类变量(5)名义按间隔(nominalbyinterval):包含一个变量为数值变量,而另一个变量为分类变量时度量两者关联度的指标(6)kappa:内部一致性系数(——0.4~0.75——)(7)风险(risk):计算比数比和相对危险度(略,医学中常用)(8)McNemar:配对卡方检验一般只针对方形表格进行,即行、列分类数相同(9)cochran’sandmantel-haenszelstatistics:(略)为两个二分类变量进行独立性检验和同质性检验,同时可进行分层因素的调整。A、分层卡方检验;B、分层卡方检验的进一步发展;C、同质性检验。34、单元格(cells)对话框:(1)频数(counts):是否输出实际观察数(observed)和理论数(expected)(2)百分比(percentages):是否输出行百分数(row)、列百分数(column)及合计百分数(total)(3)残余(residuals):选择残差的显示方式5、格式(format):选择行变量是升序还是降序排列Crosstabs过程中详解:统计分析(Analyze)→描述性统计(descriptivestatistics)→交叉表(Crosstabs)→行(rows):yw(药物);列(columnns):xg(性别)→统计(statistics)→勾选卡方(chi-square)→继续(continue)→确定(ok)卡方检验过程小结:第一步:输入数据(略)第二步:指定频数变量:weightcases—人数第三步:crosstabs过程(略)(三)结果解释:(P265)1、value:检验统计量值2、asymp.sig.2-sided:双侧近似概率3、exactsig.2-sided:双侧精确概率4、exactsig.1-sided:单侧精确概率5、Pearson卡方:常用的卡方检验(用于n≥40,T≥5)6、continuitycorrection:连续性校正卡方(用于n≥40,1≤T<5)7、likelihoodratio:对数似然比卡方8、Fisher’sexacttest:Fisher’s确切概率法(用于n<40,T<1)9、linearbylinearassociation:线形相关卡方值三、本章练习:1、现有某班级男女生成绩统计如下表,试分析学生成绩是否与性别有关。成绩性别不及格及格男1418女17252、某研究者调查了一批高血压患者的血压控制情况和肥胖度,数据见下表。试分析两者间有无关系。血压控制情况合计良好尚可不良肥胖度不肥胖15241251轻度肥胖861024中/重度肥胖20131144合计4343331194内容第12章多选题分析-MultipleResponse菜单操作教学进程(包括:教学内容、学时分配、教学方法、辅助手段)第一节多选题概述一、多选题记录格式介绍:(一)多重二分法:将每个选择项都定义一个变量,每个变量俩取值:“有”和“无”。如:要了解病人采用了那些非药物方法来控制高血压,问题如下:确诊高血压后,您按照医生的建议采取了哪些非药物方法控制高血压?A、调理饮食B、做适宜运动C、保持情绪稳定D、其他措施则可以根据4个选项定义4个变量,每个变量取值为有或者无(二)多重分类法:如:请在下列20个品牌中选出您认为最信得过的几个(最多5个)品牌,并将代码填入下面空格中。1、2、3、4、候选品牌列表:1.长虹2.海尔……可以设置5个变量,均为多分类,每个变量代表受访者的一次选择,即记录的是被试选中品牌的代码。二、常用分析指标:(对多选题的分析一般以描述为主)1、应答人数百分比(percentofresponses):选某项的人占总人数的百分比如:200个受访者中有178人选择了调理饮食以控制高血压,则调理饮食人数百分比为178/200=89.00%2、应答次数百分比(percentofresponses):选某项的次数占总次数(总反应数)的比例。如:200个受访者对四种高血压控制方式分别选择了178、120、134、160次,则总的应答次数为592次,而调理饮食的应答次数百分比应为178/592=30.07%。三、SPSS相应模块介绍:Spss软件中为多选题的分析提供了全面的功能,具体来说有:1、tables模块:即customtables菜单可以为多选题生成各种复杂的频数表和交叉表,并计算表中各种比例指标。2、optimalscaling过程:用于非线性典型相关法(OVERALS)对多选题数据进行最优尺度分析(多重对应分析)。3、multipleresponse菜单:专门为多选题数据的描述而设计,用于生成频数表和交叉表。第二节definesets过程此过程用于将若干变量定义为多选题变量集。在这样定义后,多选题分析的专用过程就可以正确识别数据,并计算出如前所述的各种专门汇总指标。一、界面介绍:1、集合定义(setdefinition):列出文件所有的数值型变量2、集合中的变量(variablesinsets):选入需要加入同一个多选题变量集的变量列表,这些变量必须为多分类,并按照相同的方式来编码(如都用“1”代表“有”)。3、变量被编码成(variablesarecodedas):选择变量集中变量的编码方式(1)二分变量(dichotomics):变量为多重二分法编码方式。相应的数值在右侧方框中输入。(2)类型变量(categories):变量为多重分类法编码方式。需要设定取值范围。4、名称(name):输入多选题变量集的名称5、标签(label):相应地定义一个名称标签6、多重回答集合(multresponsesets):已定义好的变量集列表。(最多可以定义20个)二、定义集合(definesets)过程实例操作:(实例见文件“常见饮料喜好情况”)Analyze—multipleresponse—definesets—将“茶”、“牛奶”、“咖啡”、“果汁”、“矿泉水”输入variablesinset框中—选择dichotomics中输入“1”—在name和label框中分别输入多选题变量集名称和标签:“drink”和“平时爱喝的饮料”—add—close三、实践练习:某研究者做了一项关于大学生学习动机的调查,有道多选题是这样的:目前,你的课余时间主要用于()(请最多选择三项):A、上网B、看书学习C、做兼职,参与社会实践活动D、恋爱E、学生工作与学生社团活动F、参与科技创新活动G、其他(请注明)本次调查每位学生在本道题的回答结果已存入文件“学生学习动机调查1.xls”,请根据结果操作以下问题:1、请用各选项做自变量,并将数据输入到电脑中。52、定义变量集,变量集名称为kysj,标签为课余时间。第三节frequencies过程此过程的功能是为多选题变量集生成频数表。一、界面说明Table(s)for:需要进行频数统计的变量Missingvalues:用于选择对缺失值的处理方式二、操作过程实例:利用文件“饮料喜好情况.sav”,生成频数表。操作:Analyze—multipleresponse—frequencies—将“$drink”输入tablesfor框—ok。三、结果解释:通过频数表,可以反映各种饮料一共被选择了多少次,各种饮料分别选择的次数。右侧的两个百分比是多选题比较重要的输出:pctofreponses计算的是选择次数占总选择次数的比例;pctofcases计算的则是所有受访者中选择相应饮料者占总人数的比例。四、实践练习某研究者做了一项关于大学生学习动机的调查,有道多选题是这样的:目前,你的课余时间主要用于()(请最多选择三项):A、上网B、看书学习C、做兼职,参与社会实
本文标题:卡方检验解释
链接地址:https://www.777doc.com/doc-2598822 .html