您好,欢迎访问三七文档
1第七章————抽样推断2本章教学目的与要求通过本章的教学,学生应达到下列要求:(1)了解抽样推断的内涵、特点、理论基础(2)掌握抽样误差的内涵、主要影响因素(3)掌握抽样估计的内涵(4)掌握抽样平均误差、极限误差与概率度的内涵及相互之间的关系(5)具备基本的抽样方案设计能力3本章教学内容抽样推断的一般问题抽样推断中的几个基本概念抽样误差抽样估计的方法抽样方案设计4本章教学的重点为了实现本章教学目的,在教学过程中应以下列内容作为本章教学重点:1)抽样估计的理论依据2)参数估计的优良标准3)抽样误差的影响因素4)抽样平均误差和极限误差的含义及计算5)各种抽样方案的设计5本章教学难点1)抽样推断的两个理论依据2)抽样平均误差、抽样极限误差与概率度之间的关系及其运用3)如何根据实际情况设计相应的抽样方案6关键词:抽样:sample,sampling;样本:sample;样本统计量:samplestatistic;样本值:samplevalue;样本(平)均值:samplemean;样本平均数:sampleaverage;随机抽样:samplingatrandom;样本方差:samplevariance;抽样误差:samplingerror;样本标准差:samplestandarddeviation7质——量——质现象的数量方面指标统计调查、统计整理和分组总量指标相对指标平均指标现象数量特征的动态对比动态数列、统计指数现象之间关系的分析——相关关系分析通过抽样反映现象的数量特征——抽样推断8第一节抽样推断的一般问题抽样推断的特点:1)是一种由部分推断总体的认识方法2)是建立在随机原则基础上的3)运用的是概率估计的方法样本均值总体均值;xXxaX4)抽样误差可以事先计算并加以控制9抽样推断的理论基础——大数定律、中心极限定理样本单位数样本平均数,大数定律:nxXxpiin1)()1lim1)大数定律——随着试验次数的增多,某事件发生的频率逐渐稳定于某个常数2)中心极限定理——是研究变量和分布的。如果总体变量存在有限的数学期望和方差,无论总体的变量具有怎样的分布,只要满足现有的条件,那么,当n很大时,它们的和就近似地服从正态分布。10总体分布正态分布非正态分布大样本小样本大样本小样本正态分布正态分布非正态分布抽样均值的抽样分布与总体分布的关系11的正态分布,方差为逼近数学期望为则样本平均数),足够大(一般要求只要样本容量的总体,,方差为均数为对任意一个具有总体平nxnn2230),(~2nNx)(xEx样本均值12总体N样本容量为n的所有样本计算出每一个样本的均值xx的抽样分布抽样分布的形成过程13第二节抽样推断中的几个基本概念14总体和样本1、总体(全及总体)——要认识的研究对象的全体。有有限总体和无限总体之分。N——有限总体的总体单位数在时间、地点一定的条件下,被推断的总体是确定的、唯一的。2、样本——从全及总体中随机抽取的部分单位所组成的集合体。用n表示样本单位数。样本不具有唯一性、是不确定的,但样本一旦抽定就是已知的15参数和统计量1、参数——反映总体数量特征的指标就特定的总体,其参数具有唯一性、确定性和未知性特征FXFNXX或总体平均数(均值):常用的统计参数有:FFXXNXX222)()(或总体方差:16QPPXPNNQNNPpp2011;:是非标志的均值和方差;是非标志:2、统计量——根据样本值计算的综合指标,是反映样本数量特征的指标1)统计量是样本变量的函数;2)统计量本身是一个随机变量;3)当抽定一个样本时,就能计算相应的统计量值,所以统计量是已知的(还可根据需要构造统计量)17122*222nxxsffxxnxxsfxfnxx)(样本修正方差:)(或)(样本方差:或样本均值:)1(,21pppnnxpp方差:样本抽样成数的均值、18样本容量和样本个数1、样本容量——一个样本所包含的单位数,用n表示,是有限的常用),称为小样本(试验中用大样本);称为大样本(实际中常30,30nn2、样本个数(样本可能数目)——从一个特定的总体中可能抽出多少个样本。样本个数的多少与样本容量和抽样方法等因素直接相关重复抽样和不重复抽样19第三节抽样误差20一、抽样误差——在随机原则条件下,由于偶然性因素致使样本各单位的结构与总体的单位结构不同而引起的样本指标值与总体值之间的绝对离差。误差登记性误差——存在于全面、非全面调查中。理论上可以消除代表性误差(只存在于非全面调查中)系统性误差——非概率抽样引起的抽样误差——概率抽样(难以消除,但可控制)21二、影响抽样误差大小的主要因素1)样本容量的大小。n越大,抽样误差越小。2)总体各单位变量值离散程度的大小。小,抽样误差就小。3)抽样方式的不同。重复抽样的误差要比不重复抽样的大。4)抽样的组织形式三、抽样平均误差——样本指标的标准差主要介绍抽样平均数和抽样成数的平均误差22抽样平均误差——抽样平均数(成数)的标准差,反映了抽样误差的一般水平1)——是抽样平均数(成数)与其均值之间的平均差异程度2)——反映了抽样平均数(成数)与总体平均数(总体成数)之间的平均离散程度可能的样本数目———抽样平均数的标准差———))(((抽样平均误差)差、抽样平均数的平均误MMxExxx2123间的平均离散程度样本均值与总体均值之———)(,)(由于:MXxXxEx2的平方根成反比与样本容量差成正比;抽样平均误差与总体方———)在重复抽样条件下:(nnx1差位数来控制抽样平均误)可以通过调整样本单的仅为比总体标准差小得多,)抽样平均数的标准差三者的关系:2112n24来代估计量未知时,则用它的无偏注:总体方差)(很大时:当)(不重复抽样条件下:2*22211)2(sNnnNNnNnxx)()()不重复抽样时:()()重复抽样时:()())(((抽样平均误差)——、抽样成数的平均误差NnnPPnPPMPpMpEppppp11211222当总体成数未知时,则用样本成数替代。25四、抽样极限误差(也称允许误差范围)——是按要求确定的误差的可能范围,是个误差区间。ppppppxxxxxxpPpPpPPpxXxXxXXx等价于:表示:抽样成数的极限误差用等价于:表示:用抽样平均数的极限误差26五、概率度txxxxnXxtnXxXNnxnNx;;而)(标准化过程),,(),(根据中心极限定理:10~~求得的t值,查标准正态分布表后可得到相应的概率F(t)27)()();()(tFtPpPtFtXxPpxt=1:F(t)=68.27%;t=1.64:F(t)=90%;t=1.96:F(t)=95%;t=2:F(t)=95.45%;t=3时,F(t)=99.73%28六、抽样估计的精度——抽样误差越大,样本值与总体值之间的误差就大,估计的精度就越低。相同的允许误差范围,对高低水平不同的现象来说,反映的意义是不同的。,,,,,,;表示:或估计精度用;(抽样误差系数)或—误差率—相对误差范围ppxxpxppxxpxAAAApxXxx1129第四节抽样估计的方法一、抽样估计——即以样本的实际资料为依据,计算相应的样本指标(统计量),对总体作出数量上的估计和判断。抽样估计点估计——用样本统计量直接估计总体参数区间估计——用一个区间及其出现的概率来估计总体参数3011.1302122122122)(得:)(其中:)(已知,则:,且总体方差服从正态分布或布定理可知:如果总体由样本平均数的抽样分区间:如:总体平均数的置信xxxxZxXZxPZXxZPXxZZZZPn即用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为100(1-)%311130212212)(得:。其中:而:)(分布:则抽样平均数服从知,,且正态分布的方差未如果xxxxtxXtxPnXxttttPtn即:用同样方法构造的总体参数的多个区间中,有100(1-)%的区间比例包含了总体平均数32二、抽样估计的特点:1)在逻辑上运用归纳推理2)在方法上运用不确定的概率估计方法3)估计的结论存在一定的抽样误差三、抽样估计的优良标准1)无偏性——经过多次反复抽样,则多个样本指标值的平均数应该等于总体指标值如抽样平均数、抽样成数、样本修正方差就是无偏估计量3322*;)()(等于总体方差:样本修正方差的平均数;)(总体成数:样本成数的平均数等于于总体平均数:样本平均数的平均数等sEPpEXxE2)一致性——根据大数定律,当样本容量n充分大时,则样本值无限接近总体值1,lim)(即:具有“一致性”的要求体平均数的估计量如:抽样平均数作为总XxPn343)有效性——用样本指标估计总体时,要求作为优良估计量的方差应比其他估计量(非优良估计量)的方差小更有效比),则称()(,有:对于固定的,都是总体的无偏估计量和如果两个统计量:212121DDn在选择估计量时,一般应首先考虑“无偏估计量”,然后再进一步选择“有效估计量”;对于大样本则考虑选择“一致估计量”样本平均数具有:无偏性、有效性和一致性35四、两种具体的抽样估计方法已知抽样误差范围,求概率保证程度和置信区间计对总体参数进行区间估)(及求:;已知、样本的)2;)12*tFtsxxx例1:对某型号的电子元件进行耐用性能检查,抽查的资料如下表。要求耐用时数的允许误差范围△x=10.5小时。试估计该批电子元件的平均耐用时数。(重复抽样)36耐用时数(小时)元件数(f)组中值(x)900小时以下900~950950~10001000~10501050~11001100~11501150~12001200小时以上126354393187592597510251075112511751225合计100—某电子元件耐用时数统计表37(小时)(小时))((小时)2.510091.5191.515.10551001055502nffxxfxfxx解:1)根据抽样资料计算样本平均数和标准差,由此可得到抽样平均误差2)根据给定的误差范围和平均误差求解t及概率38%66.959566.002.2191.55.10,即概率为)(得:,查标准正态分布概率表根据公式,可得:tFtxx3)根据给定的允许误差范围和平均误差,确定总体参数置信区间的上下限:小时上限小时下限即:10665.105.105510455.105.1055xxxxxx说明:有95.66%的概率保证(或把握程度)认为该批电子元件的平均耐用时数在1045~1066小时之间。39例2:仍利用例1的资料:设该厂的产品质量检验标准规定,元件耐用时数达1000小时与上为合格品,要求合格率估计的误差范围不超过5%。试估计该批电子元件的合格率解:1)计算样本合格率和方差,可得抽样平均误差:%86.21000819.0)1(0819.009.091.0)1(%911009121nppppnnppp40%96%5%91%86%5%91xxpp上限下限限:求出总体合格率的上下已计算的平均误差,根据给定的极限误差和%16.9276.1%86.2%5)(,查表得:求概率:tFtpp说明:有概率92.16%的保证程度认为该批电子元件的合格率在86%~96%之间41
本文标题:第七章 抽样推断
链接地址:https://www.777doc.com/doc-419641 .html