您好,欢迎访问三七文档
第八章抽样推断第一节抽样推断的基本概念一、抽样推断的特点抽样推断是在抽样调查的基础上,根据样本的实际资料推断全及总体数量特征的一种统计方法。它具有以下特点:(一)按随机的原则抽取样本。(二)在数量上,以样本推断总体。(三)抽样推断的误差可以事先计算和控制。二、抽样推断的几个基本概念(一)全及总体和样本总体。(二)总体指标和样本指标。1.总体指标。总体指标也称总体特征数。它是说明总体数量特征或规律性的数字。(1)设总体单位数为N(2)∑X为标志总量(3)X=∑X/N称为总体平均数。(4)P=M/N为总体成数(5)σ2=∑(X-X)2/N总体方差σ=√∑(X-X)2/N总体标准差。2.样本指标(1)样本容量为n(2)∑x称为样本标志总量;(3)x=∑x/n称为总体平均数(4)p=m/n称为具有该特征单位的样本成数。(5)样本方差S2=∑(x-x)2/n–1(6)样本标准差S=√∑(x-x)2/n-1第二节抽样误差一、抽样误差的概念抽样误差是指抽样估计值与被估计的未知的真实参数(总体特征值)之差。抽样误差不包括下面两类误差:一类是调查误差,即在调查过程中由于观察、测量、登记、计算上的差错而引起的误差;另一类是系统性误差,即由于违反抽样调查的随机原则,有意抽选较好单位或较坏单位进行调查,这样造成样本的代表性不足所引起的误差。二、抽样误差大小的影响因素1.总体各单位标志值的变异程度。在其他条件不变的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则愈小。2.样本单位数的多少。在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈大。3.抽样方法。抽样方法不同,抽样误差也不同。一般说来,重复抽样的误差比不重复抽样的误差要大。4.抽样的组织形式。选择不同的抽样组织形式,也会有不同的抽样误差。二、抽样平均误差(一)样本平均数的平均误差以μx表示样本平均数的平均误差,σ表示总体的标准差。1.当抽样方式为重复抽样时μx=σ/√n它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。(二)样本成数的平均误差。总体成数P可以表现为总体是非标志的平均数。即E(X)=P它的标准差σ=√P(1-P)根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。1.在重复抽样下:μp==2.在不重复抽样下:μp=)1(2NnNnnnpp)1(三、抽样极限误差抽样极限误差是指样本和总体指标之间误差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。设Δx与Δp分别表示样本平均数与样本成数的抽样极限误差,则有:|x-X|≤Δx,|p-P|≤Δp上述不等式也可表示成:x-Δx≤X≤x+Δx,p-Δp≤P≤p+Δp例如,根据样本计算得某产品耐用的平均时数为6000小时,抽样极限差为600小时,则相对误差限Δx600Δx'=──=──=0.1x6000估计的精度:Ax=1-Δx'=0.9=90%第三节参数估计参数估计就是以所计算的样本指标来估计相应的总体指标。参数估计有点估计和区间估计两种形式。一、点估计通常评选估计优良有三个标准,即无偏性有效性一致性二、区间估计对于总体的未知指标X,根据样本构造的两个统计量x1、x2(x1<x2),使随机区间(x1,x2)包含X的概率等于给定值1-α(0<α<1),即P(x1≤X≤x2)=1-α则称1-α为置信概率,α为显著水平,(x1,x2)称为X的置信区间,x1,x2分别称为置信下限和置信上限。(一)总体平均数X的区间估计1.重复抽样。在重复抽样条件下,估计量x服从或近似服从N(X,σ2),所以统计量x-XU=───σ/√n服从或近似服从N(0,1),根据附录正态分布表得:P(|u|<t)=1-α式中,t称为可靠性指标,或概率度,它与1-α有关,可通过查表求得。2.不重复抽样在不重复抽样条件下,统计量△x=总体平均数X在可靠性为1-α的置信区间是:(x-tμx,x+tμx))1(2NnNnXxunNnNt2)11((二)总体成数的区间估计。1.在重复抽样条件下,估计量p的误差限为:__________△p=tμp=t√P(1-P)/n2.在不重复抽样条件下,估计量P的误差限为:当N很大时,有:△p=tμp三、样本容量的确定•样本容量的确定,可根据抽样极限误差的计算公式来求得:在重复抽样条件下:σ△x=t─√n可以解得所需抽取的最低样本单位数n0为:tσn0=(──)2△x在不重复抽样条件下:σ2n△x=t√n──(1-──)nN第四节假设检验一、假设检验的意义和程序1.设立假设。2.作检验统计量。3.确定显著性水平α及相应的t值。4.确定拒绝域。5.作出决策。二、假设检验的内容(一)双侧检验(二)单侧检验三、假设检验的两类错误经常性的错误是一类错误是,当原假设成立时,样本观测值落在拒绝域中,因而被拒绝了。二类错误是,当原假设不成立时,样本观测值却不在拒绝域中,因而被接受了。第五节抽样调查的组织形式一、简单随机抽样对于有限总体,从N个总体单位中抽出n个单位组成样本,所有可能的不同样本数为CNn,如果使得其中任何一个样本,都以相同的概率1/CNn被抽取,这种抽样方法,即为简单随机抽样。二、等距抽样等距抽样也称系统抽样或机械抽样,是在全部单位已排有一定顺序的总体中,每隔相等的距离抽取一个单位组成样本的方法。所抽样本称为等距样本。三、类型抽样类型抽样又称分层抽样,是应用最为广泛的一种抽样组织形式。其基本方法是,在总体各单位的性质或标志值大小明显地呈现出层次时,按其层次将总体划分为若干子总体,每一子总体即为一层,而使每层内部总体单位的差异较小,使差异主要存在于各层之间。然后,在每一层都进行随机抽样。四、整群抽样从全部总体单位中,抽取一部分组成样本,进行调查,这在实际中,有时是很难进行的。将全部总体分为若干部分,每一部分称为一个群,把每一群作为一个抽样单位,整群地进行抽样,然后,在被抽中的群中做全面调查,这种抽样叫整群抽样。五、抽样方案的检查(一)准确性检查所谓准确性检查,看是否超过了方案所允许的误差的范围。若误差限小于或等于允许的误差,即:△x≤允许误差,则说明方案的设计符合准确性的要求,可以实施。若,△x>允许误差,则说明方案不符合准确性的要求,就要对方案进行检查和修正,直至符合准确性的要求为止。(二)代表性检查所谓代表性检查,是将方案中的样本指标与过去已掌握的总体同一指标进行对比,看其比率是否超过所规定的要求。
本文标题:第八章抽样推断
链接地址:https://www.777doc.com/doc-419860 .html