您好,欢迎访问三七文档
第7章参数估计EstimatingPopulationValues样本统计量总体参数(已知)(未知,但可以用样本统计量来估计)用样本统计量推断总体参数推断样本总体总体参数的估计方法点估计(PointEstimate)给出总体参数的一个单个估计值区间估计(IntervalEstimate)给出总体参数的一个估计范围(置信区间)点估计置信区间下限置信区间上限区间估计(置信区间)点估计我们可以用……估计总体参数一个样本统计量(点估计)均值比例ppxμ为何引入区间估计?总体参数是确定的,样本统计量(点估计)是不确定的(随机的)区间估计能够对总体参数与样本统计量的离差给出一个概率度量(置信水平)区间估计(均值,μ,未知)总体随机样本均值x=50样本我有95%的把握相信总体均值μ介于40和60之间置信水平置信水平(ConfidenceLevel)用随机样本重复构造置信区间,所有区间中包含总体参数的比例称为置信水平表示为(1-为总体参数未在区间内的比例常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10重复构造出的20个置信区间点估计值例:95%的置信区间总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计xp2p2s总体均值在1-置信水平下的置信区间为nzxnzx22总体均值估计:正态总体&方差已知样本均值样本容量总体标准差确定,可查标准正态分布表为临界值,xnNzznzx;;;)1,0(~22确定临界值:置信水平=95%Z0.025=-1.96Z0.025=1.9600.95临界值临界值96.10.05.9501025.02ZZ0.0250.025正态分布常用置信水平及临界值ConfidenceLevelCriticalvalue1.281.6451.962.332.573.083.2780%90%95%98%99%99.8%99.9%2z为分析产品重量是否符合标准,某企业从一批产品中随机抽取25袋,测得每袋重量如下。已知产品重量服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋产品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3例题分析例题分析92.336.105251096.136.1052nzx该食品平均重量的置信区间为:101.44g~109.28g例题分析:PHstatPHstatConfidenceIntervalsEstimatefortheMean,sigmaknownDataPopulationStandardDeviation10SampleMean105.36SampleSize25ConfidenceLevel95%IntermediateCalculationsStandardErroroftheMean2ZValue-1.959IntervalHalfWidth3.9199ConfidenceIntervalIntervalLowerLimit101.44IntervalUpperLimit109.27例题分析:PHstat输入样本数据总体均值在1-置信水平下的置信区间为nstxnstx22总体均值估计:正态总体&方差未知体标准差为样本标准差,替代总分布表确定;,可查为临界值,stntttnstx)1(~22t分布t分布是近似正态分布的一种对称分布,但更平坦和分散。t分布依赖于自由度(n-1),随着自由度的增大,逐渐趋近于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z为分析产品重量是否符合标准,某企业从一批产品中随机抽取25袋,测得每袋重量如下。已知产品重量服从正态分布,试估计该批产品平均重量的置信区间,置信水平为95%25袋产品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3例题分析例题分析35.109,37.10199.336.1052566.906.236.1052nstx该食品平均重量的置信区间为:101.37g~109.35g该食品平均重量的置信区间为:101.44g~109.28g例题分析:PHstat输入样本数据PHstatConfidenceIntervalsEstimatefortheMean,sigmaunknownSampleStandardDeviation9.65SampleMean105.36SampleSize25.00ConfidenceLevel0.95IntermediateCalculationstValue2.06IntervalHalfWidth3.99ConfidenceIntervalIntervalLowerLimit101.37IntervalUpperLimit109.35例题分析:PHstatPHstatConfidenceIntervalsEstimatefortheMean,sigmaunknownDataSampleStandardDeviation24.76SampleMean1490SampleSize16ConfidenceLevel95%IntermediateCalculationsStandardErroroftheMean6.19DegreesofFreedom15tValue2.13IntervalHalfWidth13.19ConfidenceIntervalIntervalLowerLimit1476.80IntervalUpperLimit1503.20总体比例的区间估计:大样本总体比例p在1-置信水平下的置信区间为5)1(;5;)1,0(~)-1(22pnnppNzznppzp大样本:为样本比例确定;,可查标准正态分布表为临界值,nppzppnppzp)-1()-1(22某城市想要估计下岗女性职工比例,随机地抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp该城市下岗职工中女性比例的置信区间为:55.65%~74.35%例题分析例题分析:PHstatSampleSize100NumberofSuccesses65ConfidenceLevel95%IntermediateCalculationsSampleProportion0.65ZValue-1.959StandardErroroftheProportion0.0476IntervalHalfWidth0.093ConfidenceIntervalIntervalLowerLimit0.5565IntervalUpperLimit0.7434PHstatConfidenceIntervalsEstimatefortheproportion总体方差的区间估计:正态总体总体方差2在1-置信水平下的置信区间为为样本方差。分布表确定;,查为置信区间下限临界值分布表确定;,查为置信区间下限临界值2222122222122222)1()1()1()1()1()1(snnnsnnsn一家食品企业从某天生产的产品中随机抽取25袋,测得每袋重量如下表所示。已知产品重量的服从正态分布。以95%的置信水平建立食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3例题分析例题分析:PHstatPHstatConfidenceIntervalsEstimateforthepopulationvarianceDataSampleSize25SampleStandardDeviation93.21ConfidenceLevel95%ResultsIntervalLowerLimitforVariance5297.08IntervalUpperLimitforVariance16814.1可使用Excel中的STDEV函数计算两个总体参数的区间估计总体参数符号表示样本统计量均值差比例差方差比2121xx21pp21pp22212221ss假设条件:样本来自两个正态总体,或两个样本均为大样本(n1,n230)时12,22已知时,1-2的置信区间为12,22未知时,1-2的置信区间为222121221)(nnzxx均值差的区间估计:正态分布),()(2221222121221为样本方差ssnsnszxx某地区教育管理部门想估计两所中学高考英语平均分数之差。在两所中学随机抽取两个样本,有关数据如右表。建立两所中学平均分数之差95%的置信区间两个样本的有关数据中学1中学2n1=46n2=33S1=5.8S2=7.2861x782x例题分析解:两个总体均值之差在1-置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为5.03分~10.97分)97.10,03.5(97.28332.7468.596.1)7886()(22222121221nsnszxx例题分析均值差的区间估计:T分布假设条件:样本来自两个正态总体,总体方差未知,两个样本均为小样本(n1,n230)时:1.如果12=22,1-2的置信区间为:),(2)1()1(112222121222211221221221为样本方差其中,ssnnsnsnsnnsnntxxpp均值差的区间估计:T分布假设条件:样本来自两个正态总体,总体方差未知,两个样本均为小样本(n1,n230)时2.如果12≠22,且n1=n2,1-2的置信区间为22212121221)2(nsnsnntxx均值差的区间估计:T分布假设条件:样本来自两个正态总体,总体方差未知,两个样本均为小样本(n1,n230)时3.如果12≠22,且n1≠n2,1-2的置信区间为11,)(2221112122221212221212212)(2)(nnsnnsnsnsnsnsvtxxv均值差的区间估计:匹配样本两总体均值之差d=1-2在1-置信水平下的置信区间为:配对样本差值的标准差配对样本差值的均值各配对样本的差值ddsddnsntd)1(2例题分析10名学生分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差1-2置信水平95%的置信区间10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916两种试卷所产生的分数之差的置信区间为:6.33分~15.67分111nddnii53.61)(12n
本文标题:67参数估计
链接地址:https://www.777doc.com/doc-3143013 .html