您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 13抽样技术与应用课程作业
首都经济贸易大学《抽样技术与应用》作业文档2013年授课对象:统计学(经济分析)学生授课教师:教师:李锋邮箱:lifeng20523@126.com单位:统计学院(参考答案可能存在疏漏,欢迎指正。)平时成绩以100分计,占总评成绩的30%第一部分:考勤及课堂表现(约40%)第二部分作业(约60%)不用抄题,写题号即可,作业要求:写公式、数据代入公式及结果。一、简单随机抽样:1、设总体N=5,其指标值为{3,5,6,7,9}1)计算总体方差2和2S;2)从中抽取n=2的随机样本,直接用公式计算不放回抽样的方差V(y);3)列出不放回抽样的所有可能的样本并计算y。验证E(y)=Y;4)按不放回抽样的所有可能的样本,计算其方差V(y)。并与公式计算的结果进行比较。5)对不放回抽样的所有的可能样本计算样本方差2s。并验证E(2s)=2S。2、如何使用一棵普通的正方体(正六面体)骰子进行入样概率为1/2,1/3,1/4,1/5的随机抽样?3、从一叠单据中用简单随机抽样方法抽取了250张.发现其中有50张单据出现错误。(1)以95%的置信度估计这批单据中有错误的比例。(2)若已知这批单据共1000张,你的结论有何变化?(3)若要求估计的绝对误差不超过1%,则至少应抽取多少张单据作样本?二、分层随机抽样1、一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:(1)若总样本量n=30,试用奈曼分配确定各层的样本量。(2)若实际调查了18个工人,10个技术人员,2个行政人员,其损失的工时数如下:工人技术人员行政管理人员8,24,0,0,16,32,6,0,16,9,5,8,18,2,0,7,4,4,4,5,0,3,2,1,8,24,8,121,8试估计总的工时损失数并给出它的置信度为95%的置信区间。2、某林业局欲估计植树面积,该局共管辖240个林场,按面积大小分为4层,用等比例抽取40个林场,取得下列资料(单位:公顷)试估计该林业局辖区总的植树面积及95%的置信区间。样本数据计算如下:层总量层均值层方差第一层第二层第三层第四层91821963065236265.57183340.56472.4938.429054.1816794.2872376.3合计8541--3、在估计比例问题时:(1)假设P=0.5,W1=W2=0.5,则P1与P2为何值时可以使按比例分配的分层抽样精度可以得益20%(即deff=)。(2)若P=4%,其中W1=0.05,P1=45%;W2=0.2,P2=5%;W3=0.75,P3=1%。则采用按比例分配的分层抽样比简单随机抽样精度得益(1-deff)有多大?三、整群抽样1、汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25辆,其不安全轮胎数如下:不安全轮胎数汽车数0123458723要求估计该运输公司的汽车中不安全轮胎的比例及其估计的标准误。四、系统抽样1、在一条街上13户的户口册中将所有的居民列成下表:M—男性成人,F—女性成人,m—男孩,f—女孩。住户12345678910111213MFfmfMFfmfMFmfMFMFmmfMFfmMFffMFmfmMFmMFmfMFfmMFfMF为估计下列各项指际:a)男性所占的比例;b)孩子所占的比例;c)具有某种职业的住户中人员的比例(第1,2,3,12,13这几户是具有某种职业的住户)。现从每5人中抽1人,取得一系统样本,又按20%的比倒抽取一个简单随机样本,请比较这两种样本的方差。(系统样本的排列方法是每户自上至下依次排列)。2、下表是28个样本村的产量数据,它是按产量由低到高顺序排列后的280个村按种植面积大小成比例的概率抽选的系统样本。样本村平均亩产样本村平均亩产123456789101112131437037938939639740040441041843344545346046215161718192021222324252627284675015035145155415425435625705866016536581)用简单随机抽样的公式计算均值的抽样方差;v12)用合并层的方法计算均值的抽样方差;v23)用连续差的方法计算均值的抽样方差;v34)你认为根据上述资料用哪一种方法计算比较接近实际。样本数据如下:S2=6928.88五、比估计和回归估计1、某县共有123个村,欲估计全县当年的小麦总产量,按简单随机抽样抽取13个村,取得资料如下:样本村上年产量(百斤)当年产量(百斤)123456789101112135507201500102062098092812001350175067072915306107801600103060010509771440157022109808651710(1)若已知上年的小麦总产量为128200(百斤),采用比估计法估计当年的小麦总产量,并求置信度为95%的置信区间。(2)采用差估计估计平均每村的小麦产量和小麦总产量,并估计其方差。(3)采用用样本回归系数的回归估计法估计平均每村的小麦产量和小麦总产量,并估计其方差。(4)比较差估计、回归估计与比估计的效率。去年小麦产量为x,今年为y,样本数据计算如下:均值指标总和方差(协方差)平方和(乘积和)去年小麦产量x今年小麦产量yxy1042.081186.311354715422153875.74231543.0641183570.9981159635252107375418273841附录一:参考答案一、简单随机抽样1、(1)σ2=4,S2=5;(2)不放回1.5(用计算式);(3)不放回E(y)=6;(4)不放回1.5(用定义式);(5)不放回E(s2)=S2=5;2、(略)3、(1)该批单据中有错误的比例估计为20%,95%置信度的近似置信区间为[14.83%,25.17%](2)若单据共有1000张,该批单据中有错误的比例估计为20%,95%置信度的近似置信区间为[[15.50%,24.50%](3)若要求估计的绝对误差不超过1%,应至少抽取6147张单据作为样本。二、分层抽样1、(1)n1=18,n2=10n3=2(2)该公司总的工时损失数估计为1903.9,95%置信度的近似置信区间为[1457.0,2350.8]2、该林业局总的植树面积估计为51246公顷,95%置信度的近似置信区间为[42728.2,59763.8];由于比例分配时样本量四舍五入,而且有些层的样本量较小、各层均值方差之间差异大,用比例分配公式和用分层通用公式计算结果之间差异较大,答案用比例分配公式3、(1)p1=0.7236,p2=0.27648或p1=0.2764,p2=0.7236(2)精度得益为0.237三、整群抽样1、估计该运输公司的汽车中不安全轮胎的比例为40%,估计的标准误为5.8248%四、系统抽样1、(1)男性所占比例估计为48%,系统抽样估计量的方差为2.56%,简单随机抽样估计量的方差为2.04%,简单随机抽样精度高;(2)孩子所占比例估计为48%,系统抽样估计量的方差为5.76%,简单随机抽样估计量的方差为2.04%,简单随机抽样精度高;(3)男性所占比例估计为38%,系统抽样估计量的方差为0.16%,简单随机抽样估计量的方差为1.923%,系统抽样精度高;2、(1)v1=222.71(2)v2=3.141(3)v3=3.846(4)略五、比估计和回归估计1、(1)今年的小麦总产量估计为145943.7809百斤,95%的置信区间近似为[138315.4783百斤,153027.6791百斤](2)采用差估计平均每村的小麦产量估计为1186.51百斤,小麦总产量估计为145940.73百斤;(3)采用样本回归系数的回归估计法平均每村的小麦产量估计为1186.55百斤,小麦总产量估计为145945.65百斤;(4)差估计与比估计相比deff=1.41;回归估计与比估计相比deff=1.05;差估计与回归估计相比deff=1.34(直接与简单估计比也行)
本文标题:13抽样技术与应用课程作业
链接地址:https://www.777doc.com/doc-5634438 .html