您好,欢迎访问三七文档
第五章参数假设检验构造假设什么是“假设检验”–处理“可信度”的基本概念判断样本统计量值与总体(参数)假设值之间是否存在可以观察到的差值,以及这种差值在统计上是否明显.可以观察到的差值由于随机原因或者存在实质性的差别§5.1假设检验的概念假设检验可分为:参数假设检验和非参数假设检验。1、参数假设检验:已知总体分布,猜出总体的某个参数(假设H0),用一组样本来检验这个假设是否正确(是接受还是拒绝H0)。2、非参数假设检验:猜出总体分布(假设H0),用一组样本来检验这个假设是否正确(是接受还是拒绝H0)。在检验中,我们通常设法保证“弃真”(以真为假)的错误的概率很小,也就是概率P{拒绝H0|H0为真}很小。这是我们在假设检验时,分析问题的主线。原假设(H0)对被研究的总体参数做试探性的假设备择假设(HA)原假设(H0)的对立面H0和HA是两个对抗性陈述-----被观察的样本数据只能支持其中一个陈述.构造假设000:.:AHvsH双尾000:.:AHvsH左侧尾部000:.:AHvsH右侧尾部构造假设举例:一个电灯泡生产商想生产平均寿命为1,000小时的灯泡,如果灯泡寿命太短,他就会失去客户;如果灯泡寿命太长,生产成本则会上升。为此,他从灯泡中抽取了一个样本来观察其平均寿命是否可以达到1,000小时。请构造H0和HA。H0:=1,000HA:1,000vs.构造假设一名销售经理要求其销售人员将每天的交通费用控制在100元之内,为此,他从日常交通费用中抽取了一个样本来检查是否将有关费用控制在规定的范围内。请构造原假设和备择假设。举例:H0:100HA:100vs.统计意义上的“对”与“不对”,就有可能犯错误。当我们认为参数的某个假设H0正确时(接受假设H0时),有可能假设H0本身是错误的,而我们把它当作正确的,称犯了第二类错误(“存伪”的错误),我们应当保证犯这种错误的概率很小,也就是概率=P{接受H0|H0为假}很小。反之,当我们拒绝假设H0时,也可能犯“以真为假”的错误(“弃真”的错误),称为犯第一类错误。当然,我们也希望所犯的“以真为假”错误的概率很小,也就是=P{拒绝H0|H0为真}很小。两类错误实际情况H0为真H0为假结论接受H0第II类错误拒绝H0第I类错误=第I类错误的概率=Pr{拒绝H0|H0为真}显著水平=第II类错误的概率=Pr{接受H0|H0为假}与之间的关系–与之间具有反向关系当进行假设检验时,必须预先确定与哪个更重要为了防止错误拒绝H0尽量减少拒绝H0的机率降低,提高为了防止错误接受H0尽量减少接受H0的机率提高,降低举例:测试一座桥梁是否可以安全地承受至少50吨的运输量a)你是想犯第I类错误还是第II类错误?b)你是采用较低的显著水平还是较高的显著水平?H0:50而HA:50第I类错误=Pr{拒绝H0|H0为真}第II类错误=Pr{接受H0|H0为假}第II类错误会导致非常严重的后果(断定桥梁安全,而事实上它并不安全)提高,降低什么是“检验统计量”?–“检验统计量”是指:样本统计量值与总体参数假设值之间可以观察到的差值,它可以用标准误差来表示。决策原则–临界区域法:什么是“临界值”(CV)–“显著水平”单尾或双尾检验Z分布或者t分布什么是“临界区域”(CR)或拒绝域尾部区域超过了临界值原假设(H0)或备择假设(HA)–检验统计量落在临界区域之外接受H0检验统计量落在临界区域之内拒绝H0构造假设决策原则–p值法:原假设(H0)或备择假设(HA)–什么是“‘p值”–p值显著水平()接受H0p值显著水平()拒绝H0几乎不可能获得样本统计量的值,或者说在研究过程中获得样本统计量值的概率非常小。p值大H0可能为真p值小H0可能为假如果H0为真,与总体均值有关的决策步骤1步骤2步骤3构造H0和HA整理基本信息,确定“抽样分布”(Z分布或t分布)计算检验统计量与总体均值有关的决策步骤4步骤5步骤6确定检验类型(单尾或双尾)以及确定p值或者确定临界值和临界区域做出决定–决定“拒绝”或者“接受”H0H0得出结论并进行解释1、关于正态总体均值的假设检验关于均值的假设检验,可分如下三种情况:(1)已知方差2,假设H0:=0,通过样本观测值x1,x2,···,xn,检验H0是否成立。(2)未知方差2,假设H0:=0,通过样本观测值x1,x2,···,xn,检验H0是否成立。(3)未知方差2,假设H0:0(或0),通过样本观测值x1,x2,···,xn,检验H0是否成立。§5.2一个正态总体下的参数假设检验与总体均值有关的决策已知X服从均值为、标准差为(已知)的正态分布;或者虽然X不服从正态分布,但其样本容量n30,而且已知其均值为、标准差为nXXX服从均值、标准差为的正态分布)1,0(~NXZX检验统计量与总体均值有关的决策一家医院正在使用某种药品,已知药品每包的平均剂量为100cm3,标准差为3cm3。随机抽取36包药品作为一个样本,并得到每包药品的平均剂量为101cm3。检验当=0.01时,每包药品的剂量是否过大。举例:H0:100而.HA:100n=36,=3,而且=101,利用Z分布X5.0363X1.2.3.检验统计量25.01001010XXZ与总体均值有关的决策临界区域99%的面积=0.01CV=2.325ZTS=2.04.5.6.右侧尾部检验,=0.01临界值=2.325325.201.0ZZ检验统计量落在临界区域之外接受H0数据显示:当显著水平=0.01时,每包药品的剂量不大例:已知生产线上生产出来的零件直径服从正态分布,已知方差为0.09(毫米2),现有假设H0:=10(毫米).这个假设可以是生产标准的要求.现有一组样本观测值:10.01,10.02,10.02,9.99(在实际问题样本容量大些更好).请判断这批零件的平均直径=10(毫米)是否正确.解:首先设:原假设H0:=10(毫米)备择假设H1:10(毫米)其次:构造一个统计量,要满足:a.其分布和参数已知;b.在已知条件下,能算出这个统计量.构造统计量为:)1,0(~NnXZ设原假设H0成立,如果原假设H0是正确的,我们希望拒绝H0(犯错误)的概率很小,也就是P(|Z|k)=很小.称为显著性水平./2/2-kk算得该z=0.067,(取=0.05)小于k=z0.025=1.96,所以不应当拒绝假设H0:=10(毫米).与总体均值有关的决策未知–大样本无论X服从什么分布,当样本容量n30时,可以用样本标准差s来估计未知标准差nssXXˆXX近似服从以下参数的正态分布)1,0(~NsXZX检验统计量与总体均值有关的决策一家大型电子商店的信贷经理说,该商店赊购帐户上的平均余额为575元。一名审计人员随机抽取了33名顾客作为一个样本,结果发现赊购帐户上的平均余额为518.5元、标准差为181元。如果信贷经理的陈述得不到数据支持,审计人员将检查所有的赊购帐户。请问当=0.05时,审计人员应当采取什么行动?举例:H0:=$575而HA:$575n=33,=518.5,s=181,而且利用Z分布X51.3133181Xs1.2.与总体均值有关的决策/2=0.025Z95%的面积/2=0.025CV=1.96CV=–1.96TS=–1.793.检验统计量79.15.315755.5180XsXZ4.双尾检验,=0.05临界值=1.9696.1025.02ZZ5.6.检验统计量落在临界区域之外接受H0当=0.05时,数据看来支持信贷经理的陈述审计人员无需审查所有的赊购帐户。与总体均值有关的决策未知–小样本X的分布是正态分布或接近正态分布当样本容量n30时,可以用样本标准差s来估计未知标准差nssXXˆXX近似服从自由度为n–1的t分布1~nXtsXt检验统计量而且与总体均值有关的决策当地一家体育馆新上任的经理被他的前任告知:会员资格的平均年限为8.7年。为此,他随机抽取了15份会员文件,结果发现会员资格的平均年限为7.2年,标准差为2.5年。假设这家体育馆的会员资格年限近似服从正态分布。当显著水平=0.05时,样本结果是否表明这家体育馆的实际会员资格年限小于8.7年?举例:H0:8.7而HA:8.7n=15,=7.2,s=2.5,而且利用t14分布X6455.0155.2Xs1.2.与总体均值有关的决策3.检验统计量4.左侧尾部检验,=0.05临界值=–1.761761.105.0,14,1ttn5.检验统计量落在临界区域之内拒绝H06.数据显示:当显著水平=0.05时,这家体育馆会员资格的平均年限明显小于8.7年32.26455.07.82.70XsXt95%的面积=0.05CV=–1.761t14TS=–2.32CR例:已知生产线上生产出来的零件直径服从正态分布,现有假设H0:=10(毫米).这个假设可以是生产标准的要求.现有一组样本观测值:10.01,10.02,10.02,9.99(在实际问题样本容量大些更好).请判断假设H0:=10(毫米)是否正确.解:首先设:原假设H0:=10(毫米)备择假设H1:10(毫米)其次:构造一个统计量,也要满足:a.其分布和参数已知;b.在已知条件下,能算出这个统计量.构造统计量为:)1(~ntnSXTt由P(|T|t0.025)=,取=0.05.算得|t|=1.414,t0.025=3.182.有|t|t0.025.所以接受原假设.-t4、未知方差2,检验假设H1:0(这是作为备择假设出现)例:已知生产线上生产出来的零件抗剪强度服从服从正态分布,以往的数据表明抗剪强度的均值0=10(毫米).现在改用一种新材料来生产该零件,得到一组零件的抗剪强度的样本观测值:10.01,10.02,10.02,9.99.请问:改用新材料后,零件的平均抗剪强度是否提高?/2/2解:首先作原假设H0:=0=10(毫米)备择假设H1:10(毫米)其次:构造一个统计量,也要满足:a.其分布和参数已知;b.在已知条件下,能算出这个统计量.构造统计量为:)1(~ntnSXT由P(Tt0.05)=,取=0.05.算得t0.05=2.3534由样本点算得t=14.14.有tt0.025.所以接受备择假设.零件的抗剪强度得到提高了.5、关于正态总体的方差2的检验关于正态总体的假设检验,分为如下两种情况:(1)未知均值,假设H0:2=02,通过样本观测值x1,x2,···,xn,检验H0是否成立;(2)未知均值,假设H0:202(反之亦然),通过样本观测值x1,x2,···,xn,检验H0是否成立。第一种情况:未知均值,检验假设H0:2=02是否成立;例:已知生产线上生产出来的零件直径服从正态分布,长期以来直径的根方差=0.3,现材质改进,抽出20个样本,(这里只给出20个样本的方差s2=0.16).请判断该生产线的方差是否改变?解:首先作原假设H0:总体方差2=02=0.09备择假设H1:总体方差202=0.09其次:构造一个统计量,也要满足:a.其分布和参数已知;b.在已知条件下,能算出这个统计量.构造统计量为:)1(~)1(22022nSn在原假设下,由P(22/2)=/2或P(221-/2)=/2取=0.05,算得20.025(19)=32.9,20.975(19)=8.91
本文标题:参数假设检验
链接地址:https://www.777doc.com/doc-3280413 .html