您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > ch09均值比较试验设计和方差分析
均值比较、实验设计和方差分析第九章本章内容两总体均值之差的估计𝜇1−𝜇2的区间估计(𝜎1和𝜎2已知)𝜇1−𝜇2的区间估计(𝜎1和𝜎2未知)两总体均值之差的检验:𝜎1和𝜎2未知𝜇1−𝜇2的假设检验(𝜎1和𝜎2已知)𝜇1−𝜇2的假设检验(𝜎1和𝜎2未知)两总体均值之差的推断:匹配样本试验设计和方差分析简介方差分析和完全随机化设计独立简单随机样本从总体1中抽取一个容量为𝑛1的简单随机样本,从总体2中抽取另一个容量为𝑛2的简单随机样本。由于这两个样本是互相独立抽取的,因此是独立简单随机样本(independentsimplerandomsamples)两个独立样本之差的抽样分布m1s1总体1s2m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布案例HomeStyle家具商店在两家商店销售家具:一家位于市区;另一家地处郊区购物中心。地区经理注意到:在一家商店畅销的商品在另一家商店卖的不一定好。经理认为这种情况可能归因于两个地区顾客人群的差异。假定经理要求我们调查一下这两家商店顾客平均年龄差异。𝜇1−𝜇2的点估计(𝜎1和𝜎2已知)𝜇1=总体1的均值(即在市区商店购物的所有顾客的平均年龄)𝜇2=总体2的均值(即在郊区商店购物的所有顾客的平均年龄)𝑥1为𝑛1名市区顾客组成的简单随机样本的样本平均年龄𝑥2为𝑛2名市区顾客组成的简单随机样本的样本平均年龄𝜇1−𝜇2的点估计值为𝑥1−𝑥2𝜇1−𝜇2的区间估计(𝜎1和𝜎2已知)假定条件两个总体都服从正态分布,s12、s22已知若不是正态分布,可以用正态分布来近似(n130和n230)——(大样本)两个样本是独立的随机样本𝑥1−𝑥2服从正态分布,其标准误差为22212121nnxxsss-𝜇1−𝜇2的区间估计(𝜎1和𝜎2已知)𝜇1−𝜇2区间估计为:𝑥1−𝑥2±边际误差边际误差为:边际误差=则在置信度为𝟏−𝜶情形下,𝝁𝟏−𝝁𝟐区间估计为:2221212/2/21nnzzxxsss-2221212/21nnzxxss-𝜇1−𝜇2的区间估计(𝜎1和𝜎2未知,大样本)𝜎1和𝜎2未知时,用样本标准差𝑠1和𝑠2来估计𝜎1和𝜎2。𝑛1≥30或𝑛2≥30(大样本)此时,𝑥1−𝑥2服从的是t分布,但因大样本近似于正态分布。则在置信度为𝟏−𝜶情形下,𝝁𝟏−𝝁𝟐区间估计为:222121221)(nsnszxx-两个总体均值之差的估计(例题分析)【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表。建立两所中学高考英语平均分数之差95%的置信区间两个样本的有关数据中学1中学2n1=46n1=33S1=5.8S2=7.2861x782x两个总体均值之差的估计(例题分析)解:两个总体均值之差在1-置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为5.03分~10.97分)97.10,03.5(97.28332.7468.596.1)7886()(22222121221--nsnszxx𝜇1−𝜇2的区间估计(𝜎1和𝜎2未知,小样本)𝜎1和𝜎2未知,𝑛130或𝑛230(小样本)此时,𝑥1−𝑥2服从的是t分布,而不是正态分布。区间估计为:自由度为:2221212/21nsnstxx-222222121122221211111--nsnnsnnsnsdf向下取整两个总体均值之差的估计(例题分析)【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排8名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221两个总体均值之差的估计(例题分析)解:根据样本数据计算得自由度为:两种方法组装产品所需平均时间之差的置信区间为0.192分钟~9.058分钟5.321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222--v433.4625.48014.2312996.151604.2)875.275.32(-SPSS的应用两总体均值之差的检验(𝜎1和𝜎2已知)假设的形式𝐷0表示𝜇1和𝜇2之间假设的差mm-120:aHDmm-0120:HDmm-0120:HDmm-120:aHDmm-0120:HDmm-120:aHD左侧检验右侧检验双侧检验常见的假设的形式在许多的研究的问题中𝐷0通常值为0,于是常见的假设的形式为:假设研究的问题没有差异有差异均值1均值2均值1均值2均值1均值2均值1均值2H0m1–m2=0m1–m20m1–m20H1m1–m20m1–m20m1–m20两个总体均值之差的检验(s12、s22已知)假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)检验统计量为)1,0(~)()(2221212121NnnXXZssmm---拒绝法则下侧检验上侧检验双侧检验假设𝐻0:𝜇1−𝜇2≥0𝐻𝑎:𝜇1−𝜇20𝐻0:𝜇1−𝜇2≤0𝐻𝑎:𝜇1−𝜇20𝐻0:𝜇1−𝜇2=0𝐻𝑎:𝜇1−𝜇2≠0检验统计量拒绝法则:p值法如果P≤𝛼,则拒绝𝐻0如果P≤𝛼,则拒绝𝐻0如果P≤𝛼,则拒绝𝐻0拒绝法则:临界值法如果z≤−𝑧𝑎,则拒绝𝐻0如果z≥𝑧𝑎,则拒绝𝐻0如果z≤−𝑧𝑎/2,或者z≥𝑧𝑎/2,则拒绝𝐻02221212121)()(nnXXZssmm---2221212121)()(nnXXZssmm---2221212121)()(nnXXZssmm---EXCEL应用z-检验:双样本均值分析CenterACenterB平均8278已知协方差100100观测值3040假设平均差0z1.6561573P(Z=z)单尾0.048845z单尾临界1.6448536P(Z=z)双尾0.09769z双尾临界1.959964两总体均值之差的检验(𝜎1和𝜎2未知)前提:(1)𝜎1和𝜎2未知时,用样本标准差𝑠1和𝑠2来估计𝜎1和𝜎2。(2)小样本(大样本可以近似正态分布)检验统计量为:自由度为:2221212121)()(nsnsXXt---mm222222121122221211111--nsnnsnnsnsdf向下取整例题研究一款新的软件是否能够有助于系统分析员减少设计、开放、实现信息系统所需要的时间。因此指定12名分析员使用当前技术来开发的信息系统,另外12名分析员使用新软件包来开发系统。EXCEL应用t-检验:双样本异方差假设CurrentNew平均325286方差1599.6361935.818观测值1212假设平均差0df22tStat2.272127P(T=t)单尾0.016602t单尾临界1.717144P(T=t)双尾0.033204t双尾临界2.073873两个总体均值之差的推断:匹配样本匹配样本,又称配对样本,是指两个样本的数据之间存在一一对应的关系。配对样本一般来自配对组或是同对一个样本的两次试验。例如,对某一高血压群体测试某一种药物是否可以降低他们的血压。比较:使用前——使用后两个总体均值之差的估计(匹配大样本)1.假定条件两个匹配的大样本(n130和n230)两个总体各观察值的配对差服从正态分布2.两个总体均值之差md=m1-m2在1-置信水平下的置信区间为nszdd2对应差值的均值对应差值的标准差两个总体均值之差的估计(匹配小样本)1.假定条件两个匹配的小样本(n130和n230)两个总体各观察值的配对差服从正态分布2.两个总体均值之差md=m1-m2在1-置信水平下的置信区间为自由度为n-1nstdd2两个总体均值之差的估计(例题分析)【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差md=m1-m295%的置信区间10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计(例题分析)解:根据样本数据计算得两种试卷所产生的分数之差的置信区间为6.33分~15.67分11101101dniindd53.61)(12--dniidndds67.4111053.62622.2112nstdd匹配样本的t检验(检验统计量)样本差值均值样本差值标准差自由度df=n-1统计量nSDdtd0-nddnii11)(12--nddSniidD0:假设的差值【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的t检验(例题分析)在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102单侧检验样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t检验(例题分析)配对样本的t检验(例题分析)差值均值差值标准差85.9105.981nddnii199.2110525.431)(12---nddSniidH0:m1–m28.5H1:m1–m28.5=0.05df=10-1=9临界值(s):检验统计量:决策:结论:在=0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信配对样本的t检验(例题分析)9413.110199.25.885.90--nSDdtd-1.833t0拒绝域.05匹配样本差的区间估计WorkerMethod1Method2di165.40.6255.2-0.2376.50.546.25.90.3566066.45.80.6EXCEL的应用数据——数据分析t-检验:成对双样本均值分析Method1Method2平均6.15.8方差0.4280.212观测值66泊松相关系数0.876424假设平均差0df5tStat2.195775P(T=t)单尾0.039758t单尾临界2.015048P(T=t)双尾0.079516t双尾临界2.570582两个正态总体参数的检验两个总体的检验Z检验(大样本)t检验(小样本)t检验(小样本)Z检验F检验独立样本配对样本均值比例方差实验设计和方差分析简介观察性研究(observationalstudy),是在自然的状态下
本文标题:ch09均值比较试验设计和方差分析
链接地址:https://www.777doc.com/doc-2904706 .html