您好,欢迎访问三七文档
第五章比估计与回归估计5.1比估计一、使用比估计的两种情况即之比值均值)体的两个指标总量(或所需估计的目标值是总,1.比值(或比率)XYXYR例:绝对贫困以上勉强度日小康富裕最富裕以下消费性总支出金额食品支出金额恩格尔系数所占的比例。即:性总支出金额中指食品支出金额在消费恩格尔系数6.06.0~5.05.0~4.04.0~3.03.0:XYR金额平均每户消费性总支出平均每户食品支出额尔系数一个国家或地区的恩格城乡居民家庭人均收入及恩格尔系数年份城镇居民家庭人均可支配收入(元)农村居民家庭人均纯收入(元)城镇居民家庭恩格尔系数(%)农村居民家庭恩格尔系数(%)1978343.4133.657.567.71980477.6191.356.961.81985739.1397.653.357.819901510.2686.354.258.819954283.01577.750.158.620006280.02253.439.449.120016859.62366.438.247.720027702.82475.637.746.220038472.22622.237.145.620049421.62936.437.747.2200510493.03254.936.745.5200611759.53587.035.843.0元以上)(元)(元)(元)(:的每盒最高价格范围是若会购买,您所能承受)不会()会(,您会不会购买?假如市场上有奶酪出售11410~938~625~41.221.1,其他元高价格范围是人会购买且能承受的最,第,其他人会购买奶酪,第人,设总体有元者所占的比例。能承受的最高价格在要估计会购买的人中,05~41015~4iYiXNii例:“筛选性”问题XYXYRNiiNii11因此,要估计的是例:1802年,法国的Laplace受政府委托进行法国人口的估计与推算。推算方法如下:已知)总体的出生人口数总体的人口总数(XYR2.利用辅助变量的信息改进估计的精度35.28ˆ样本的出生人口总数样本的人口数RRXY即总体的人口总数已知的比估计量:XXRYYR,ˆˆ利用辅助变量的信息改进估计的精度XRYXYR,因此已知的比估计量:XXRYYR,ˆˆ已知的比估计量:XXRYYR,ˆˆXYRˆˆˆ比值估计量已知的比估计量:XXRYYR,ˆˆ计估比比估计的使用条件:(1)调查变量与辅助变量间有正线性相关关系,且大致呈正比例;(如果辅助变量与调查变量间有负线性相关关系,则要采取乘积估计。)(2)估计或Y时,一般要求辅助变量的总体总量或均值是已知的。(3)适用面广,可以用于简单随机抽样,也可用于分层随机抽样、整群抽样、多阶抽样等;Y二、简单随机抽样下的比估计1.比值估计量:XYRˆˆˆxy对于简单随机抽样XxyXRYRˆˆ的比估计量:及YY.2xyRˆ对于简单随机抽样XxyXRYRˆˆ2.比估计的性质:对于简单随机抽样RREnxyR)ˆ(ˆ)1(大时,是有偏的。但当1)(1)ˆ()ˆ()2(122NRXYXnfRVRMSENiii)2(1)2(122222222xyxyxxyySRSSRSXnfSRRSSXnf证明:RREnXXRYXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大时,当)()()()(大时,当ˆ0ˆˆ)1(11)ˆ()ˆ(111001ˆ)ˆ()ˆ()ˆ(ˆ)(ˆ)2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(则,,,对每个总体单元,令)()(又)()()2(1)2(11)())((2)(11))()((11)(1)ˆ()ˆ(2222222212222122122xyxyxxyyNiiiiiNiiiNiiiSRSSRSXnfSRRSSXnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE(3)比估计的方差估计1)(1)ˆ()ˆ(122NRXYXnfRVRMSENiii)ˆˆ2(1ˆ)ˆ(22221xxyysRsRsXnfRvRVX)(的渐近无偏估计为已知时,当NiiiRXYN12)(11估计可用niiixRyn12)ˆ(11)2(12222xxyySRRSSXnf1ˆ1122nxRyXnfniii)()ˆˆ2(11ˆ1ˆ)ˆ(22221221xxyyniiisRsRsxnfnxRyxnfRvRVXxX)()(的渐近无偏估计为,则代替未知时,用当例:某小区有1920户,从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭人口,得数据:试对人均住房面积作点估计和置信度为95%的区间估计。7264.5xy1110x52940.7,y260x1821.4,y701iii701i2i701i2i701ii701ii解:01.72604.1821ˆ701701iiiixyR085.01ˆ1ˆ)ˆ(1222nxRyxnfRvRVniii)()(的渐近无偏估计为:92.5637ˆˆ2)ˆ(7012270170127012iiiiiiiiiixRxyRyxRy58.744.6ˆˆˆˆ%952121,)(,)(的置信区间为:的置信度为RvuRRvuRR3.比估计与简单估计的比较21)()2(ySnfyVyY的方差为:的简单估计)2(1)()1(222xyxyRRSRSSRSnfyVyYn的方差为:的比估计足够大时,当02(12(11)()(21222222)〉))得:()(xyxxyxyyRSRSSRnfSRSSRSnfSnfyVyV单估计更精确。,即比估计较相应的简〉,则特别若〉212/2/2yxyxyxyxCCCCYSXSSRS4.估计R时样本量的确定:VXSnNnnVXNSVXSnRxyNSSXnfRVnVRdddNiiidd2200022221222211111ˆ,ˆ,其中解得:)(,其中)(大时,当的方差上限为如果估计。未知时,也可由)(由的样本,抽一个容量为也可以通过试点调查时计,可以通过以往的资料估,xXxRynsnSniiidd1222ˆ11估计时样本量的确定:2222/10002222/12222/12/1122211ˆ111ˆ,1dSnNnnNdSdSnYVdRxyNSSnfYVnddddRNiiiddR,其中解得:)()(,其中)(大时,当的绝对误差限为如果置信度为Y例:某公司有1000名职工,为了估计职工今年与去年病假工时的比率,要抽一个容量为n的简单随机样本进行调查。先随机抽了10人作试点调查,数据如下:编号去年病假工时今年病假工时1121322425315154303253236626247101281516902101412希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容量为多大的样本?已知公司职工去年病假工时为16300。解:05.1178187ˆ101101iiiixyR4245,4066,4463178,18710110121012101101iiiiiiiiiiixyxyxy由试点调查的数据得:5222/1210122701221011012101210603.296.101.03.1610001630016300474.3)ˆ(91265.31ˆˆ2)ˆ(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:审计员想估计一个医院的财产的现在价值。从计算机存储的记录里查到,医院的财产有2100项,共计价值950000元。为了估计现在的价值,拟在2100项目中随机抽取n项。因为没有信息可用来确定n,先随机抽了15项,获得数据整理如下:试确定n,使估计量的绝对误差不超过500元(置信度为95%)。表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522,5.23754.4706,0.24215115121511512151解:表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522,5.23754.4706,0.2421511512151151215198.00.2425.237ˆ151151iiiixyR406210050415041504)2100500(4444.796.100222222/10NnnndSnd4444.7)ˆ(1412218.104ˆˆ2)ˆ(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy三、分层随机抽样下的比估计在大样本时,1.分别比估计:若各层的样本量比较大时,各层可分别进行比估计,再进行加权平均,所得估计量称为分别比估计。LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhRsLhhhhLhRhhLhhhRsSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)()ˆ(ˆˆˆˆ)(方差2.联合比估计:若某些层的样本量比较小时,可以采用联合比估计。对两个指标先求总体均值或总和的分层估计,然后用它们构造比估计,所得估计量称为联合比估计。LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1ˆ)(方差5.2回归估计Linearregression估计精度就比较高。为常数)。这时,用比(可以认为又比较大,相关系数的回归直线通过原点,关于如果。估计其实质是用,已知的比估计量:简单随机抽样中aaxyxyXYxyXXxyYYiiiiR)(的特征数呢?的信息来估计调查指标如何利用辅助指标,的回归直线不通过原点关于如果yxxyii1.简单随机抽样中的回归估计量:对于简单随机抽样,总体均值和总体总和的回归估计量分别为:lrlrYNYXxXbyYˆˆ)(ˆ已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性质:记为以后)(的回归估计为时,当)(的回归值时,事先给定常数)若(据结构:具有一元线性回归的数与假定ˆˆˆˆ1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性质)(即回归估计为比估计)(时,当计))(即回归估计为差估(时,当计)(即回归估计为简单估时,当)(的回归估计为时,事先给定常数若ˆ1ˆˆ10:00000)()(:性质22002212xxyylrSSSnfyV
本文标题:抽样调查——比估计
链接地址:https://www.777doc.com/doc-418908 .html