您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 投融资/租赁 > 高级社会统计学第五部分参数估计(续).
高级社会统计学闵学勤minxueqin@nju.edu.cn第五部分参数估计(续)一、有关区间估计(Intervalestimation)的几个概念1、区间估计用以一定的概率包含参数的真值的区间来估计未知参数的方法称为区间估计。点估计是利用样本观测值求得参数的真值的一个近似值来估计未知参数,但不知近似的精确程度和可信程度,因此虽有一定参考价值,但还是满足不了人们的一些实际需要。区间估计则确定了一个随机区间,使得该区间包含的真值的概率不小于某给定的值。区间估计不仅提供了的一个估计范围,还给出了估计的精度(效度)与可信度,因此具有广泛的实用意义。第五部分参数估计(续)一、有关区间估计的几个概念2、置信区间(Confidenceinterval)与置信度(Confidencecoefficient)。levelceSignifican。。、。,。QQQQQPQQQQxxxQn不可靠的概率它表示用置信区间估计称为显著性水平可靠性的它表示用置信区间估计置信度或置信系数称作置信概率精确性反映了估计的区间的大小称作置信区间其中区间的关系表达式为之概率为包含参数那么区间的估计值作为未知参数我们用),(1ˆ,ˆ1)ˆˆ(:1ˆ,ˆ,),,(ˆ21第五部分参数估计(续)一、有关区间估计的几个概念3、置信区间与置信度之间的关系;99.01;95.01;90.01,1)ˆˆ(,ˆˆ,,ˆ,ˆ211221:。QQQPQQQQ通常置信度的标准有置信度之间的关系反映了区间估计精度和系表达式置信区间与置信度的关或还可写作单侧区间之外区间置信区间除了写作双侧第五部分参数估计(续)二、区间估计与抽样分布例:为了对某单位员工闲暇时间进行研究。根据一次样本(n=33)的调查,平均每天看电视时间为:试求此单位员工平均每天看电视时间的区间估计(置信度取95%)。假定看电视时间满足正态分布N,其中是未知。QQQQQPˆ,ˆ,1,1)ˆˆ(样分布寻找区间关键是要通过样本的抽是预先给定的置信度中在)(47.0),(96.0小时小时SX),(22第五部分参数估计(续)一、有关区间估计的几个概念3、置信区间与置信度之间的关系解:13.1,79.0%95,13.1,79.0,104.2104.204.204.2,04.20369.25),133(~1:,2/2/2/的置信区间为于是满足置信度代入已知条件计算得和的临界值分布式得代入和将可得查附表分布统计量服从根据抽样分布可知nSXnSXtttttnSXt第五部分参数估计(续)二、正态总体均值的区间估计(一)已知2nXnXnXnXnZXnZXNnXZ58.2,58.2,01.096.1,96.1,05.0,,,),1,0(~,2/2/区间估计为时当区间估计为时当的区间估计为均值经查表若显著性水平为布统计量满足标准正态分根据抽样分布的讨论第五部分参数估计(续)二、正态总体均值的区间估计(一)已知2)99.095.0(,65.2,36).66.0,(:2两种和置信度取的双侧置信区间求小时时间每天平均从事家务劳动人的随机抽样调查根据劳动时间服从正态分布设某小区妇女从事家务例XN93.2,37.23666.058.265.2,3666.058.265.258.2,99.0)287.2,44.23666.096.165.2,3666.096.165.296.1,95.0)1:2/2/代入得置信区间为代入得置信区间为解ZZ第五部分参数估计(续)二、正态总体均值的区间估计(一)未知21,1,,),1(~11,2/2/nStXnStXntnSXTtn的区间估计为均值经查表若显著性水平为分布的统计量满足自由度为根据抽样分布的讨论第五部分参数估计(续)二、正态总体均值的区间估计(一)未知2)01.0(),(6.3),(5.1125),,(,22的双侧置信区间求年年为和平均受教育年限为调查人的随机抽样根据未知从正态分布设某社区受教育程度服例SX:SX,。N52.13,48.9246.380.25.11,246.380.25.11180.2,180.2:,80.27969.2,241,01.0:2/nSXnSXtnK代入置信区间有查表得已知解第五部分参数估计(续)二、正态总体均值的区间估计习题:根据居民区37户抽样家计调查,居民用于食品费用占总收入的比例,平均为75%,比例的标准差为20%,求食品费用占居民总收入比例的区间估计(置信度为95%)。答案:(0.73,0.77)第五部分参数估计(续)三、正态总体方差的区间估计2/2/1)1(~1:1),,(,22/1222/2222222);P()P(,nSnnkN的临界值应满足双侧区间对于给定置信度分布的统计量满足自由度对于正态总体根据抽样分布的讨论2/2/22/22/1第五部分参数估计(续)二、正态总体方差的区间估计22/1222/2222)1(,)1(,,SnSnS的估计区间为分布表可得查已知样本)05.0572584596570570572568570572578,2(。;;;;;;;;;:,。的置信区间和标准差求方差得数据的抽样调查现根据十户平均收入服从正态分布设某村平均家庭月收入例第五部分参数估计(续)二、正态总体方差的区间估计解:44.252,87.3595.044.252)1(87.35)1(7.2,19023.19,,91,05.0)2)6.681(91)(112.5751:)1222/1222/222/122/21212的置信区间为的方差置信度为有查附表自由度和计算SnSnnkXxnSXnXSXniinii第五部分参数估计(续)四、大样本区间估计中心极限定理告诉我们,对于随机变量分布的任何形式,只要n足够大,n个相互独立同分布的随机变量之和或均值的分布都将近似服从正态分布。因此在不知总体分布的情况下,可以通过增加样本容量的方法对总体均值进行区间估计。大样本一般指样本容量,而在社会科学中可取30n50n第五部分参数估计(续)三、大样本区间估计1、大样本总体均值的区间估计代替总体标准差可用样本标准差未知情况下当为总体标准差的点估计值为总体均值其中的区间估计为因此置信度为即满足标准正态分布统计量对大样本而言SXnZXnZXnZXnZXPNnXZZ,,,,,11)(),1,0(~,2/2/2/2/第五部分参数估计(续)四、大样本区间估计1、大样本总体均值的区间估计表面上看,大样本均值的区间估计与正态总体均值区间公式没有区别。但其实不同,大样本区间估计不需要总体为正态分布,其次也不要求总体方差为已知量,由于样本容量,无论用还是S,其分布都将是正态分布。50n第五部分参数估计(续)三、大样本区间估计1、大样本总体均值的区间估计.99.0),(6.3),(5.1150,双侧置信区间的求置信度为年年为及标准差平均受教育年限人的抽样调查结果根据方差未知体分布设某区居民受教育的总例SX:SX,。,81.12,19.1099.0,5.11,50,6.3,58.2,99.01,,50:2/2/2/置信区间为的得置信度为代入区间估计公式查表可得置信度公式可采用大样本区间估计解XnSZnZXnZXsn第五部分参数估计(续)四、大样本区间估计2、大样本总体成数的区间估计在社会学研究中,常会遇到很多定类变量,它的估计不再是均值而是比率、成数问题。例如,根据抽样,需要估计某地区是否已属于老年型人口结构,或需要估计哪些电视节目收看的比例是多少。)1,0(~ˆ,ˆ),5)1(5(,ˆNpPZPpnnpP即分布的分布可近似看作正态和在大样本情况下根据中心极限定理第五部分参数估计(续)三、大样本区间估计2、大样本总体成数的区间估计PpPpnpppPZPZPZPpZPPPPPPPPˆ:ˆ,),()1(.ˆ,ˆ,ˆ:1,1)ˆˆ(:ˆˆ2/ˆ2/ˆ2/ˆ2/代替可用未知情况下当可证明的点估计值为总体成数其中的区间估计为则置信度为的区间估计公式有因此大样本总体成数).95.0(,60,,置信度为的置信区间上网成数求该地居民户经常上网其中有机调查设根据某地一百户的随例p第五部分参数估计(续)三、大样本区间估计2、大样本总体成数的区间估计696.0,504.0)95.0(696.0,504.0096.06.0,096.06.01004.06.096.16.0,1004.06.096.16.095.096.1,5ˆ,5ˆ,4.0ˆ1ˆ,6.010060ˆ60,100:2/05.0为置信度为的置信区间所以该地居民上网成数值区间估计公式得的代入置信度为查表得且已知解pPZqnPnPqPmn第五部分参数估计(续)三、大样本区间估计2、大样本总体成数的区间估计习题:某企业根据200名青年员工的抽样调查,其中60%参加各种形式的培训。求青年员工参加培训比例的区间估计(置信度为0.9)。答案:(0.54,0.66)第五部分参数估计(续)三、大样本区间估计3、大样本二总体均值差的区间估计除了前面介绍的参数估计外,有时我们还要对两个总体均值差或两个总体成数差进行估计。例如根据样本估计两地平均收入的差值有多大(并不需要估计两地各自的平均收入),或者两种教学方法效果的差值等等。第五部分参数估计(续)三、大样本区间估计3、大样本二总体均值差的区间估计1))()((:,50,50,.:;:,;::;,;)(2/2121)(2/2121212121212222112222112121XXXXZXXZXXPnnXXXXSXSX的区间估计公式为大样本二总体均值差则如果也是随机变量显然样本均值的点估计值可以作为总体均值差于是样本均值差来自第二总体的样本来自第一总体的样本抽取一个随机样本现从两总体中独立的各第二个总体的参数为设第一个总体的参数为第五部分参数估计(续)三、大样本区间估计3、大样本二总体均值差的区间估计代替和可用样本方差未知情况下和当其中的区间估计为则置信度为22212221222121)()(2/21)(2/21,)(,)(:1212121SSnnZXXZXXXXXXXX第五部分参数估计(续)三、大样本区间估计3、大样本二总体均值差的区间估计第五部分参数估计(续)三、大样本区间估计3、大样本二总体均值差的区间估计16.19,84.10)95.01(12.296.1)505520(,12.296.1)505520()(,)(,96.112.210005080040::2221212/212221212/212/22222121222121)(21为间估计即两地平均成绩差的区得代入置信区间公式查表知根据题意有解nnZXXnnZXXZnSnSnnXX第五部分参数估计(续)三、大样本区间估计4、大样本二总体成数差的区间估计
本文标题:高级社会统计学第五部分参数估计(续).
链接地址:https://www.777doc.com/doc-1952537 .html