您好,欢迎访问三七文档
第八章、阶段抽样1、(1))ˆ()ˆ(21EEE可以理解为对所有可能样本的平均,可以分两步进行。在给定的一个样本容量为n的初级单元样本中,对所有二级抽样可能的样本估计量进行平均,然后再对所有一级抽样可能的样本估计量进行平均。(2))]ˆ([)]ˆ([)ˆ(2121VEEVV证明:记~)ˆ(E2212)~ˆ()~ˆ()ˆ(EEEV由22222222222~)ˆ(~2)ˆ()]ˆ([~)ˆ(~2)ˆ()~ˆ(EVEEEE对两边求1E,得:221221~)]ˆ([)]ˆ([)ˆ(VEEEV=22121221)]ˆ([)]ˆ([)]ˆ([EEVEEE=)]ˆ([)]ˆ([2121VEEV2、证明:Y的无偏估计及其方差。(1)证明:y是Y的无偏估计)()(21yEEyE由于两个阶段的抽样都是简单随机的,因此由简单随机抽样的性质,有:YYnEyEnEynEEyEEyEniiniinii)1()](1[)]1([)]([)(1112112121(2)方差由于每个初级单元中对二级单元的抽样是相互独立的,因此y的方差)]([)]([)(2121yVEyEVyV)(yV的第一项:2111112121)(111)1()]1([)]([YYNnfYnVynEVyEVNiiniinii2111Snf)(yV的第二项:)](1[)]1([)]([122112121niiniiyVnEynVEyVE)]1(1[]})(111[1{122221211221niiiMjijniSmfnEYYMmfnE2221222122121)1(1)1(1SnmfSNnmfSnEnmfNiinii从而得到:22221111)(SnmfSnfyV3、欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。调查结果如下:样本企业第一日第二日第三日12345573851486259416053556450634954要求:根据这些数据推算100家企业该指标的总量,并给出估计的95%的置信区间。解:N=100;M=30;n=5;m=3。05.01005Nnf1;1.0303Mmf2样本企业iy22is123456043585057133939719n1iiyn1y53.6;2n1ii21)yy(1n1s=49.3;n1i22i22sn1s=23.42212211sf)1(s1)(nmfnfyV=3523.405.0)1.01(3.49505.01=9.4372计算Yˆ和)Yˆ(v:1608006.5330100yNMYˆ849348004372.930100)y(VˆMN)Yˆ(Vˆ22220078.9216)Yˆ(Vˆ)Yˆ(S96.1t则Yˆ的置信区间:921696.1160800,即:[142736.6,178863.4]4、欲调查某个新小区居民家庭装潢聘请专业装潢公司的比例。我们在15个单元中随机抽取了5个单元,每个单元有12户,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户的调查结果如下:样本单元第一户第二户第三户第四户一栋A座二栋C座三栋C座四栋C座五栋B座是否否否是是是否否否否否否否否否否是否否要求:根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。解:记请专业装潢公司的居民户为“1”,否则记为“0”。N=15;M=12;n=5;m=4。155Nnf1;124Mmf2因此,聘请专业装潢公司的比例为:25.041)10112(5111niianmp其方差的估计是:niiiniiqpmnffppnnfpv1221211)1()1()()1(1)(])4141()4140()4141()4141()4142[()15(5155122222+00657.0)43414440434143414242()14(51241(1552抽样误差为:081.0)()(pvps因此,可以以95%的把握认为,居民请专业装潢公司的比例在:081.096.125.0的范围内,即在9.1%~40.9%之间。5、某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间住6位同学。学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查结果如下:调查结果样本宿舍拍照人数样本宿舍拍照人数126120703181429151100试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:已知200N,10n,6M,3m,05.01Nnf,5.02Mmf则:3.0)0110112102(310111niianmpniiiniiqpmnffppnnfpv1221211)1()1()()1(1)(=005941358.0])3.030()3.031()3.030()3.032[()110(1005.012222故标准差为:077.0)(pv6、5题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿舍间的标准差为3261S元,宿舍内同学之间的标准差为1882S元。以一位同学进行调查来计算,调查每个宿舍的时间1c为10分钟,调查每一位学生的时间2c为1分钟,为了调查需要做各方面的准备及数据计算工作,所花费的时间是0c为4小时,如果总的时间控制在8小时内,则最优的样本宿舍和样本学生数为多少?解:根据211ccSSmuopt其中3.1003856188326222221MSSSu则:88.11103.100385188211ccSSmuopt2m,因为)1(2mmmopt,所以取2m进一步计算optn由nmcnccC210optoptnn2106468即得20optn则最优的样本宿舍数为20,样本学生数为2人。7、某服装联合企业,下面有90个缝纫厂,共有缝纫机4500台,据反映由于机器经常出现故障影响生产,管理部门拟用抽样方法调查上月每台机器因故障而停工的平均小时数,现采用二阶段抽样,第一阶段按简单随机抽样抽取10个工厂,第二阶段在抽中的工厂中抽20%的机器作样本,根据样本机器得如下数据:样本机器调查结果样本工厂i机器总数iM样本数imiy22is150105.411.3826513410.6734595.6716.75448104.813.29552104.311.12658123.8314.88742855.14866133.854.3194084.886.13105611511.8要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。解:已知90N,10n,45000M根据公式niiniiiuYnNyMnNY11ˆˆ则8.4)5564.550(1045009010niiiyMnMNy(小时)216008.44500ˆ0yMYu(工时)根据抽样估计平均每台机器上月停工4.8小时,由于机器停工而引起的总时间损失21600工时。计算估计值的相对标准差,先计算均值的方差估计:037094.0)1()1()ˆˆ()1()(1222220201212niiiiiniuimsfMnMNnnMYYfNyv相对标准差为:%01.40401.0)(yyv8、某居委会欲了解居民健身活动情况,如果已知该居委会有500名居民,在所属10个单元中抽出了4个单元,然后在样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间结果如下(以10分钟为1个单位):单元i居民人数iM样本量im健身锻炼时间ijyiy22is13244,2,3,63.752.9224552,2,4,3,63.42.833643,2,5,84.5745464,3,6,2,4,64.172.2试估计居民平均每天用于锻炼的时间,并给出估计的标准差。(1)简单估计量(2)比率估计量(3)对两种估计方法及结果进行评价。解:(1)简单估计niiiniiuYnNyMnNY11ˆˆ=)17.4545.4364.34575.332(410=1650,则3.35001650ˆYˆ0uMYu,又16566041ˆ1Yˆ1uniiYn,所以niiiiiniuimsfMnNnYYf122221212u)1(1)ˆˆ(n1(N)Yˆv()分别计算192635778])165225()165162()165153()165120[(311)ˆˆ(222212nYYniui48.462862.2)5461(5447)3641(3658.2)4551(45492.2)3241(32)1(222212222niiiiimsfM所以,162.0046285.011556.0)1(1)ˆˆ(n1(N1)ˆ(1222212120niiiiiniuiumsfMnNnYYfMYv)所以标准差402.0)ˆ()ˆ(uuYvYs(2)比率估计6.19769532.35005436453217.4545.4364.34575.332500ˆ110niiiniiRMyMMY9532.3ˆˆ110niiiniiRRMyMMYYniiiiiniRiiRmsfMnNnYyMfYv12222122120715.0)1(1)ˆ(n1(N)ˆ()2674.00715.0)ˆ()ˆ(RRYvYs(3)简单估计标准差402.0)ˆ(uYs,比率估计标准差2647.0)ˆ(RYs比率估计更好9、某省卫生部门欲对城市饮食业的卫生状况作一次抽样调查,在全省32个城市中随机抽选了4个城市,在抽中的城市中抽取25%的饮食店进行检查,在检查的各项指标的基础上进行卫生状况是否合格的评估,其评估结果如下:样本城市i饮食店数iM样本数im卫生不合格店数ia比例ip1521340.308220510.200336940.444432820.250试估计这32个城市的饮食店卫生不合格店占总店数的比例,若样本比例近似正态分布,计算其95%的置信区间。解:卫生不合格店占总店数的比例31.014044323620522532444.0362.020308.05211niiiniiMpMpniiiiiiniiimMppfMnNnppMf122212221)1()1()1(11)(Mn1()Pˆv()分别计算:66.109664.3131])31.025.0(32)31.0308.0(52[1411)(2222122nppMniii57143.98775.025.0)832(3212692.0308.0)1352(52)1()1()()1()1()1(122iiiiiiniiiiii
本文标题:08第八章多阶抽样
链接地址:https://www.777doc.com/doc-3119916 .html