您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 05-假设检验基础(2015研)
5假设检验引子:1.医学科学研究的特点→医学统计学的任务普查:直接得到关于总体的认知,不需要统计推断。抽样调查抽样误差参数估计假设检验风险假设检验的基础假设检验的基本思想假设检验的步骤单组样本资料的假设检验假设检验的两类错误假设检验的几个观点【例5-1】某一般中学男生的心率平均值μ0=75次/分,标准差σ=5.0次/分(大规模调查获得);我们通过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?min/65次X未知总体=?第二种可能性:已知总体min/750次样本均数与拟比较的总体均数不等有两种可能:抽样误差本质差异-运动的影响n=100第一种可能性:分次/65X唯证据原则—反证法没有差异假设检验作检验无罪假设刑事诉讼找证据假设检验实质是反证法与概率学小概率理论的一个完美结合什么是假设检验?假设:先预设一种立场,是对总体参数的数值所作的一种陈述例:认为经常参加体育锻炼的男生心率与一般中学男生的没有差异,即µ1=µ;其实质是将样本统计量与已知总体均数µ之间差异的原因归结为抽样误差。X检验:是一种方法,它一定是利用样本提供的信息,从概率的角度来判断这个假设是正确的(是抽样误造成的)?还是错误的(不是抽样误差造成的)?下结论分次/750H0:零假设100/65nX分次t界值t分布图,ν=25a/2a/2-t界值根据P值,得出结论H1:备择假设100/65nX分次),(20N,验证假设建立假设下结论XXt样本检验统计量预设α=0.05P值三个重要概念:检验水准α检验统计量概率P值3.概率P值:就是根据抽样分布的规律,由H0所规定的总体中作一次随机抽样,实际中得到目前这个样本,甚至包括比这个更偏、更极端样本的累积可能性。换言之:在H0成立的前提下,出现目前检验统计量及更不利于H0成立的统计量的累积概率,也就是H0成立的概率。假设检验的P值分布tP≤αP≤α-t界值t界值Pα关于假设检验的几个观点根据P值下结论:当P≤α时,则结论为:按检验水准拒绝H0,接受H1,认为差异有统计学意义(统计结论),可认为…不同或**取值高于##的(专业结论);当Pα时,则结论为:按检验水准不拒绝H0,认为差异无统计学意义(统计结论),还不能认为…不同或**取值高于##(专业结论)。“不拒绝H0”只因为此时拒绝H0的证据不足,绝不等同于接受H0。所以下结论时对H0只能说“拒绝”或“不拒绝”,而对H1只能说“接受”。5.2假设检验的步骤建立假设,确定检验水准及单双侧确定P值计算检验统计量作推断结论拒绝H0,接受H1,认为差异有统计学意义P≤αPα不拒绝H0,认为差异无统计学意义假设检验的步骤:建立假设H0、H1确定检验水准α根据专业知识,确定单、双侧检验5.2.1建立假设检验,确定检验水准:什么是零假设(NullHypothesis)?(1)一般是作没有差别的假设,又称“原假设”或“无效假设”,表示为H0,即H0:=某一数值,如=0(2)该假设将差异的原因归结为抽样误差1.建立假设:提出无效假设和备择假设什么是备择假设(AlternativeHypothesis)?(1)与无效假设相对立有差别的假设,由不等号,或组成,常表示为H1;即H1:某一数值;或某一数值,某一数值。(2)该假设将差异的原因归结为环境因素,或是一种本质差异。2.确定检验水准a由研究者事先确定。表示为a,常用的a值有0.01、0.05;是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。注意:3.根据数据特征和专业知识,确定单、双侧t临界值-t临界值),(2N已知总体问:经常参加锻炼的男生与一般男生心率有何不同?①②双侧检验:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。拒绝域拒绝域a/2a/2接受域1-at临界值),(2N已知总体问:经常参加锻炼的男生是否低于一般男生的?拒绝域接受域1-a2.单侧检验:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。①a一般情况下,如结果不明确时,采用双侧假设H1:某一数值,如0(双侧,包括0和0两方面)如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设H1:某一数值;如0(左单侧)H1:某一数值;如0(右单侧)单侧、双侧检验的描述方法:5.2.2选择检验方法和计算检验统计量:1.假设检验方法的选择:即检验统计量的选择。要依据以下内容,选择最适当的假设检验方法(检验统计量)。分析目的数据类型研究设计方案假设检验方法应用的前提条件分析目的•各种分布的点与区间的参数•生存率、寿命表的分布拟合单果变量估计性分析•随机区组/析因/交叉/重复测量/正交及其它设计的协方差分析•HotellingT2检验•定量:t/Z检验、方差分析、秩和检验•定性:检验、秩和检验、对比性分析多因单果单因多果单因单果•简单线性相关/回归、秩相关、列联相关•曲线相关(曲线拟和)•时间序列分析、数列升降趋势分析•多重线性相关/回归、Logistic、Cox回归•判别分析•典型相关、因子分析、复相关、偏相关相关回归分析趋势性分析多因单果单因多果单因单果多果聚积性分析•聚类分析、主成分分析、通径分析•多元参考值•评分、指数秩和比、层次模型、Topsis法•Meta分析综合评价分析单果或多果•Kappa分析、协调系数协调性分析2有关样本资料的差异性检验定量资料数据类型前提条件t/Z检验四格表R×C表配对四格表设计类型单样本两独立样本配对设计多独立样本方差分析两组二分类配对设计多组多分类单样本两多独立样本配对设计不满足t检验/方差分析条件的等级资料设计类型定性资料设计类型检验2秩和检验随机区组资料析因设计资料重复测量资料前提条件前提条件2.计算检验统计量:各检验方法都有其相应的检验统计量,不同的检验统计量通常都依据于其特定的抽样分布。举例:变量数值变量1.单样本、配对、两样本资料(来自正态分布总体)→t/u检验(t值)→t/u分布2.多组样本资料→方差分析(F值)→F分布3.方差齐性检验→F值→F分布分类变量值)检验(22→分布25.2.3根据检验统计量的结果作出统计推断:在两个对立的检验假设间二取一的规则是:(1)若P≤a,意味着在H0成立的前提下不大可能发生当前,或是更不利的状况拒绝(2)若P>a,意味着在H0成立的前提下,发生当前状况或是更不利的状况的可能性还是比较大的不拒绝95%t分布图SXXt=2.5%2.5%t临界值5.3单组样本资料的假设检验变量变换或秩和检验1nnSXt/0t检验变量变换或秩和检验例数n50σ已知或n=50正态偏态u检验u检验两独立样本假设检验单样本配对资料差值正态偏态1,/0nnsdtd对子数t检验n=50例数正态偏态n50)11(2121nnSXXtc221nn方差不齐方差齐变量变换或秩和检验t’检验22212121'nSnSXXt11)(24142222121nSnSSSxxxxt检验【例5-1】某一般中学男生的心率平均值μ0=75次/分,标准差σ=5.0次/分(大规模调查获得);我们通过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?min/65次X【案例解析】研究目的:差异性比较资料类型:定量资料设计类型:单样本设计单样本资料Z检验总体标准差已知,σ=5.0H0:μ=μ0H1:μ≠μ0α=0.05nXZ/0;000.20100/0.57565/05.0min/75:min/75:00100nXZHHa双侧=)(次)(次统计结论:已知Z(0.05/2)=1.96,则P0.05,故拒绝H0,接受H1,认为μ与μ0的差别有统计学意义,可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率。专业结论:经常参加体育锻炼有助于增强男生的心功能。检验过程:1.建立假设:确定检验水平:2.计算检验统计量:3.确定p值,作出推断结论:某药物100mg溶解在1L溶剂中,溶解后的标准浓度是20.00mg/L。现采用某种测定方法进行溶解实验,重复实验11次获得的药物浓度分别为:20.99、20.41、20.10、…、21.11。请问:用该种方法测得的药物浓度与标准浓度20.0mg/l是否相同?【案例5.2】nSXt/0【案例解析】研究目的:差异性比较资料类型:定量资料设计类型:单样本设计正态性检验单样本资料t检验该样本来自正态分布的总体n=11,样本含量较小H0:μ=20mg/L,仪器正常H1:μ≠20mg/L,仪器不正常α=0.05【电脑实现】—SPSS1.正态性检验:正态性检验结果输出:TestsofNormality.18011.200*.88611.124浓度StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkThisisalowerboundofthetruesignificance.*.LillieforsSignificanceCorrectiona.H0:呈正态分布;H1:不呈正态分布α=0.10有建议:当n≤2000时,结果以Shapiro-Wilk(W检验)为准;当n2000时,结果以Kolmogorov-Smirnov(D检验)为准2.单组样本均数t检验:结果输出:One-SampleStatistics1120.98361.06750.32186浓度NMeanStd.DeviationStd.ErrorMeanOne-SampleTest3.05610.012.98364.26651.7008浓度tdfSig.(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=20.00两总体均数差及95%CI用于比较的已知总体均数5.4假设检验的两类错误和检验功效假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本统计量对总体作出推断,结论具有概率性。结论的风险性—两类错误I类错误(typeIerror)——弃真:I类错误示意图(以单侧t检验为例)ta临界值H0:0正常人1-aa0误诊(假阳性)实事:H0为真II型错误示意图(以单侧t检验为例)ta临界值H0:0正常人1-aa0H1:0β病人1-β1漏诊(假阴性)II类错误(typeIIerror))——存伪:实事:H0为假,H1为真检验功效假设检验中的两类错误:两类错误的意义真实情况根据样本,作假设检验下的结论不拒绝H0拒绝H0H0为真推断正确I类错误犯错误的概率是a,即检验水准H0为假II类错误犯错误的概率是b推断正确正确的概率是1-b,即检验功效1.第一类错误(弃真错误)拒绝了实际上存在的H0第一类错误的概率为a2.第二类错误(纳伪错误)不拒绝实际上不存在的H0第二类错误的概率为b定义:通常把1-β,即拒绝不正确H0的概率称为检验功效,也称把握度。意义是:当两个总体确有差别时,按所规定的检验水准α的水平,能发现这种差异的能力。如1-β=0.80,理论上100次抽样检验中,平均有80次能够得出差别有统计学意义的结论。一般情况下要求1-β在0.80以上。5.4.3检验功效(poweroftest)由于所建立的检验主要是控制犯I类错误α的概率,而对犯II类错误的概率β却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。要谨慎对待“不拒绝H
本文标题:05-假设检验基础(2015研)
链接地址:https://www.777doc.com/doc-5728663 .html