您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学第4章用样本推断总体
第4章用样本推断总体主要内容4.1怎样进行推断?4.2总体参数估计24.1怎样进行推断人们通常关心总体的某个特征值:平均成本,平均价格;产品合格率,次品率;一批产品销售价格的标准差,产品成本的标准差等等要得到这些指标,不可能把所有的产品都检测一遍根据样本值推断和估计总体的特征值用估计量估计总体参数估计量:是样本的函数,其中并不含有任何未知参数4.1怎样进行推断用估计量估计总体参数的基本方法1)点估计法估计的结果只是一个确定的值。用样本指标直接替代总体指标。如;2)区间估计法估计的结果是一个区间。该区间由点估计值加上或减去估计误差而得到sPpXx,,点估计法例:设某批产品的寿命服从均匀分布,但是参数未知,随机地抽取五个产品,测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试求总体均值和标准差。解:样本平均寿命和标准差分别是:6.126656333)12661269127612571265(51xn1x8775.66.126612666.126612766.126612696.126612576.1266126541xx1n1s222222区间估计法区间估计法的步骤:1)确定未知总体参数落在某区间内的概率1-,介于0—1之间2)(1-),称为置信水平;是参数不落在区间内的概率3)置信水平1-,通常取值为99%,95%,90%即0.011,0.055,0.1010区间估计法90%样本95%样本99%样本x_nZxxZxX2.581.6451.6452.58XXXXXX96.196.1)nzx,nzx(22影响区间宽度的因素影响因素:1.数据离散程度.数据越离散,区间越宽2.样本容量n。样本容量越大,区间越窄3.置信水平(1-)。置信水平越大,区间越大估计量的优劣标准估计总体参数的估计量有许多个用好的估计量去估计总体参数好的估计量的标准是:1)无偏性:样本均值、样本比例、样本方差是总体特征值的无偏估计2)有效性:在所有无偏估计量中,方差最小的是有效的3)一致性:随着样本量的增大,点估计量的值越来越接近总体参数的真实值4.2总体参数估计1)一个总体均值的区间估计2)两个总体均值之差的区间估计一个总体均值的区间估计1)假设已知总体的标准差总体服从正态分布如果不是正态,可被正态分布逼近(样本n30)2)置信区间:()nZxnZx22,一个总体均值的区间估计总体均值区间估计的计算步骤:1)确定置信水平1-a;2)根据置信水平,确定其临界值Za/2值;3)实际抽样,并计算样本均值和抽样标准误差4)确定置信区间:()例4.1;nzxnzx22,一个总体均值的区间估计(未知且小样本)假设:总体服从正态分布总体标准差未知;用样本标准差s代替总体标准差σ用t分布代替标准正态分布,t分布的自由度为n-1置信区间:()例4.2)1n(,2t为临界值nstxnstxnn)1(,2)1(,2,两个总体均值之差的区间估计221212/212()xxznn独立样本(Independentsample):两个样本是从两个总体中独立地抽取的,即一个样本中的元素与另一个样本中的元素相互独立。1.大样本条件下(1)在两个总体的方差12和22均已知的情况下,两个总体均值之差的置信区间为:两个总体均值之差的区间估计221212/212()ssxxznn1.大样本条件下(2)在两个总体的方差12和22均未知的情况下,可用两个样本的方差s12和s22代替。这时,两个总体均值之差的置信区间为:两个总体均值之差的区间估计2.小样本条件下(1)当两个总体的方差均已知时,可建立两个总体均值之差的置信区间(2)当两个总体的方差12和22均未知,且1222时,可用两个样本的方差s12和s22计算总体方差的合并估计量sp2。221122212112pnsnssnn这时,两个样本均值之差经标准化后服从自由度为的t分布。两个总体均值之差的置信区间为:212/2121211()(2)()pxxtnnsnn两个总体均值之差的区间估计配对样本(Matchedsample),即一个样本中的数据与另一个样本中的数据相对应。1)大样本条件下,两个总体均值之差的置信区间为:2)小样本条件下,两个总体均值之差的置信区间为:_/2ddzn_/21dsdtnn其中,d-为各差值的均值;当总体标准差未知时,可以用样本差值的标准差替代。两个总体均值之差的区间估计为比较分析北京市同一地区不同年份二手房价格的差异,某房地产中介公司从中关村地区2011年第四季度的二手房交易中,抽取了8个交易作为样本;并根据2012年当月市场行情,分别对这8个房源进行重新估价,得到二手房价格如下表所示(单位:万元)。假定二手房价格服从正态分布,且方差相等。试以95%置信水平估计中关村地区2012年第一季度和2011年第四季度的二手房平均价格差值的置信区间。2011年交易价格550.2620540660.8440620.55801030.52012年市场估价640.5690.5640.8780500.2720.16501090差额-90.3-70.5-100.8-110.2-60.2-90.6-70-50.5两个总体均值之差的区间估计已知n=8,总体方差未知;计算得。由于1-0.95,在95%置信水平下的置信区间为:即(-100.172,-60.604)结果表明:在置信水平为95%时,总体平均价格的差异介于-10.17万元~-6.60万元之间。即认为中关村地区2012年第一季度比2011年第四季度的二手房平均价格有显著提高。0.05/2(7)2.365t134.20,388.80,64.710,25.63021dsdxx604.60,172.1008134.20356.2388.8012nstddn总体比例的区间估计1)单一总体比例的区间估计2)两个总体比例之差的区间估计单一总体比例的区间估计1)假设总体服从二项分布可以用正态分布近似估计np5且n(1-p)52)置信区间估计/21pppznP为总体比例。若总体比例未知,用样本比例代替两个总体比例之差的区间估计1)假设–总体服从二项分布–可以用正态分布近似估计•np15且n(1-p1)5;•np25且n(1–p2)52)置信区间估计112212/21211ppppppznn两个总体比例之差的区间估计根据前面的数据,整理得出2012年第一季度与2011年第四季度交易价格在430万元以上的二手房交易数量及所占比例,试在95%置信水平下估计这两个时期,交易价格在43万元以上的二手房交易所占比例的差值的置信区间。整理数据如下:2011年第四季度2012年第一季度样本容量n403643万元以上的交易数量2125所占比例p52.50%69.44%两个总体比例之差的区间估计已知在95%置信水平下的置信区间为:即(-38.5%,4.62%)。结果表明:当置信水平为95%时,两个年份价格在43万元以上的二手房交易所占比例的差异介于-38.50%到4.62%之间。本例中,所求置信区间包含0,说明我们没有足够的理由认为2012年第一季度与2011年第四季度价格在43万元以上的二手房交易所占比例存在显著差异。121240,36;52.5%,69.44%.nnpp112212/2121152.5%(152.5%)69.44%(169.44%)(52.5%69.44%)1.96403616.94%21.56%ppppppznn总体方差的区间估计1)假设–总体服从正态分布2)用分布,自由度为n-13)置信区间:222222/21/211nsns总体方差的区间估计假定二手房的交易价格服从正态分布。试在95%的置信水平下估计二手房交易价格方差的置信区间总体方差的区间估计计算得由0.05在95%置信水平下的置信区间为:即(-191.99%,466.3%);相应地,总体标准差的置信区间为(13.86%,21.59%)。结果表明:当置信水平为95%时,2011年第四季度二手房交易价格的标准差介于130.86万元到210.59万元之间。22221/20.975/20.02513924.433,13959.342nn13.2920,48.4502sx433.2413.2920140342.5913.29201402本章小结参数估计的基本原理点估计区间估计
本文标题:统计学第4章用样本推断总体
链接地址:https://www.777doc.com/doc-3830195 .html