您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 第五章_差异显著性检验
第五章差异显著性检验•统计方法描述统计推断统计参数估计假设检验第五章差异显著性检验第一节统计推断的意义和原理一、统计推断的意义和内容统计推断(statisticalinference):就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。统计推断假设检验(hypothesistest)参数估计(parametricestimate)第一节统计推断的意义和原理统计假设检验又称显著性检验(significancetest),它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种,即与要比较的总体参数间存在显著差异和不存在显著差异两种。第一节统计推断的意义和原理参数估计包括两个方面:一是参数的点估计(pointestimation)直接用样本的统计量数值估计相应总体的参数;二是参数的区间估计(intervalestimation)在一定的概率保证下(一般为95%或99%),由样本统计量的分布,计算出总体参数可能出现的数值范围或区间,用该区间来估计总体参数所在位置。学习目标1.了解假设检验的基本思想2.掌握假设检验的步骤3.能对实际问题作假设检验4.利用置信区间进行假设检验5.利用P-值进行假设检验第一节假设检验的一般问题一.假设检验的概念二.假设检验的步骤三.假设检验中的小概率原理四.假设检验中的两类错误五.双侧检验和单侧检验假设检验的概念与思想什么是假设?•对总体参数的一种看法–总体参数包括总体均值、比例、方差等–分析之前必需叙述我认为该企业生产的零件的平均长度为4厘米!1.概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立2.类型–参数假设检验–非参数假设检验3.特点–采用逻辑上的反证法–依据统计上的小概率原理假设检验的概念与思想假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程(提出假设→抽取样本→作出决策)抽取随机样本均值X=20我认为人口的平均年龄是50岁提出假设拒绝假设!别无选择.作出决策•问题的提出–例:某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。–问题:此说法是否正确?有4种可能性(假设)1)正确:=92)不正确:9(|-9|0)3)不正确:94)不正确:9–三对假设:=9vs9,=9vs9,=9vs9假设检验的概念与思想假设检验的基本原理•如何回答–随机抽取一个样本–计算该样本的平均数–比较样本平均数与9mm•难题–存在抽样误差–当样本平均数与9mm之差达到多大时可否定=9假设检验的基本原理•解决的思路–针对要回答的问题提出一对对立的假设,并对其中的一个进行检验–找到一个样本统计量,它与提出的假设有关,其抽样分布已知–根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断这个过程称为假设检验(hypothesistesting)提出无效假设和备择假设•什么是无效假设?(NullHypothesis)•1.待检验的假设,又称“0假设”•2.如果错误地作出决策会导致一系列后果•3.总是有等号,或•4.表示为H0–H0:某一数值–指定为=号,即或–例如,H0:3190(克)•什么是备择假设?(AlternativeHypothesis)•1.与原假设对立的假设•2.总是有不等号:,或•3.表示为H1–H1:某一数值,或某一数值–例如,H1:3910(克),或3910(克)提出无效假设和备择假设•什么检验统计量?•1.用于假设检验问题的统计量•2.选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量nxz0规定显著性水平•什么显著性水平?•1.是一个概率值•2.无效假设为真时,拒绝无效假设的概率–被称为抽样分布的拒绝域•3.表示为(alpha)–常用的值有0.01,0.05,0.10•4.由研究者事先确定作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值t或t/23.将检验统计量的值与水平的临界值进行比较4.得出接受或拒绝原假设的结论假设检验中的小概率原理•什么小概率?•1.在一次试验中,一个几乎不可能发生的事件发生的概率•2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设•3.小概率由研究者事先确定第一节统计推断的意义和原理某猪场10头长白猪和10头大白猪经产母猪的产仔数平均数1x=11头,标准差S1=1.76头长白猪10头经产母猪产仔长白111191213101313810大白11891012898710平均数1x=9.2头,标准差S1=1.55头大白猪10头经产母猪产仔1x2x能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?例造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。第一节统计推断的意义和原理两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。另一种方法,即研究样本,通过样本研究其所代表的总体。设长白猪经产母猪产仔数的总体平均数为大白猪经产母猪产仔数的总体平均数为试验研究的目的,就是要给、是否相同做出推断。以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象11221x2x1x2x第一节统计推断的意义和原理由于抽样的原因,两样本平均数之差(),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分。21xx第一节统计推断的意义和原理无偏估计:如果一个统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计值;否则,就是有偏估计值如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的有效估计量第二节显著性检验的基本原理通过试验测定得到的每个观测值每个观测值决定于:①被测个体所属总体的特征②个体差异和诸多无法控制的随机因素。所以观测值可以看作由两部分组成,即ixixiix为总体平均数,反映了总体特征表示误差若样本含量为n,则可得到n个观测,,,…,样本平均数nx1x2xnnxxii/)(说明样本平均数并非等于总体平均数,它还包含试验误差的成分第二节显著性检验的基本原理第二节显著性检验的基本原理上例中两个品种猪的产子数的样本均值分别可表示为:()()()()212121221121xxxx111x长白猪样本均值222x大白猪样本均值处理效应试验误差表面效应对显著性检验:就是分析试验的表面效应主要由处理效应引起的,还是主要由试验误差所造成。第二节显著性检验的基本原理()()212121xx()21xx()21显著性检验的意义上式表明:试验的表面效应包括处理效应与误差效应。因此,仅凭样本均值间的表面差异就对总体平均数间的差异作出判断(有差异或者没有差异)是不可靠的。只有通过显著性检验,才能从作出科学的结论。()21xx()21第二节显著性检验的基本原理虽然处理效应未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。()21xx()21()21第二节显著性检验的基本原理二、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设(二)在无效假设成立的前提下,构造并计算合适的统计量(三)给定小概率值(风险水分、显著平准),根据自由度查表获取理论临界值(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。这里假设或,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:头是试验误差,处理无效,这种假设称为无效假设,简记作:或第二节显著性检验的基本原理()21()021()8.121xx(一)首先对试验样本所在的总体作假设()21()0210H第二节显著性检验的基本原理(一)首先对试验样本所在的总体作假设无效假设是被检验的假设,通过检验可能被接受,也可能被否定提出无效假设的同时,相应地提出一对应相反假设,称为备择假设,简记备择假设是在无效假设被否定时准备接受的假设AH上面例子的备择假设是:即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等或两个均值之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。第二节显著性检验的基本原理(一)首先对试验样本所在的总体作假设:AH()21()021或第二节显著性检验的基本原理(二)在无效假设成立的前提下,构造并计算合适的统计量计算得到一个t统计量:2121xxSxxt)11()1()1()()(212112221211-2121nnnnxxxxSniiniixx其中:均数差异标准误两样本的含量第二节显著性检验的基本原理(二)在无效假设成立的前提下,构造并计算合适的统计量所得的统计量t服从自由度df=(n1-1)+(n2-1)的t分布。根据两个样本的数据,计算得:)11()1()1()()(212122221121nnnnxxxxSxx742.0)101101()110()110(6.2128426.2742.02.9112121xxSxxt第二节显著性检验的基本原理(三)给定小概率值(风险水分、显著平准),根据自由度查表获取理论临界值设定风险水平(显著水平),其值通常取为0.01与0.05计算自由度df,上例中,df=(n1-1)+(n2-1)=9+9=18查附表X,得两尾临界概率值:101.2)18(05.0t878.2)18(01.0t)(dft第一节显著性检验的基本原理①如果:则接受无效假设HO)(05.0dfxtt(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。②如果:则接受备择假设HA)(01.0)(05.0dfxdfttt③如果:则接受备择假设HA)(01.0dfxtt两样本均值所代表的总体均值间差异不显著两样本均值所代表的总体均值间差异显著两样本均值所代表的总体均值间差异极显著第二节显著性检验的基本原理(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。)(05.0dfxtt)(01.0)(05.0dfxdfttt)(01.0dfxtt第二节显著性检验的基本原理若t0.05(df)≤|t|t0.01(df),则说明试验的表面效应属于试验误差的概率P在0.01~0.05之间,即0.01P≤0.05,表明:表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设。统计学上把这一检验结果表述为:“两个总体平均数之间差异显著”,在计算所得的t值的右上方标记“*”即t*。第二节显著性检验的基本原理若|t|≥t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.
本文标题:第五章_差异显著性检验
链接地址:https://www.777doc.com/doc-2083532 .html