您好,欢迎访问三七文档
第三章参数估计重点:1.总体参数与统计量2.样本均值与样本比例及其标准误差难点:1.区间估计2.样本量的确定知识点一:总体分布与总体参数统计分析数据的方法包括:描述统计和推断统计(第一章)推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。总体分布是总体中所有观测值所形成的分布。总体参数是对总体特征的某个概括性的度量。通常有总体平均数(μ)总体方差(σ2)总体比例(π)知识点二:统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断。统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。统计量是样本的函数,如样本均值()、样本方差(s2)、样本比例(p)等。构成统计量的函数中不能包括未知因素。由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。[例题·单选题]以下为总体参数的是()a.样本均值b.样本方差c.样本比例d.总体均值答案:d解析:总体参数是对总体特征的某个概括性的度量。通常有总体平均数、总体方差、总体比例题·判断题:统计量是样本的函数。答案:正确解析:统计量是样本的函数,如样本均值()、样本方差()、样本比例(p)等。构成统计量的函数中不能包括未知因素。[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。答案:错误解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。。(一)样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有nn种抽法,即可以组成nn不同的样本,在不重复抽样时,共有个可能的样本。每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。数理统计学的相关定理已经证明:即样本均值的均值就是总体均值。在重置抽样时,样本均值的方差为总体方的1/n,即在不重置抽样时,样本均值的方差为其中,为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,n比较大而n/n≥5%时,修正系数可以简化为1-n/n,当n比较大,而n/n5%时,修正系数可以近似为1,即可以按重置抽样计算。当总体服从正态分布时,样本均值一定服从正态分布,即有x~n(,)时,~n(,)若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n≥30),样本均值仍会接近正态分布。样本分布的期望值为总体均值,样本方差为总体方差的1/n。这就是统计上著名的中心极限定理。该定理可以表述为:从均值为,方差为的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的分布近似服从均值为,方差为的正态分布。如果总体不是正态分布,当n为小样本时(通常n30),样本均值的分布则不服从正态分布。[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有()个样本a.25b.10c.5d.1答案:a解析:在重置抽样时,共有nn种抽法,共有样本nn个,即52=5×5=25个。[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在不重置抽样时,共有()个样本a.25b.10c.5d.1答案:b解析:在不重复抽样时,共有个可能的样本。即(个)(二)样本比例的抽样分布比例是指具有某种属性的单位占全部单位数的比重。总体比例(通常用π表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据。样本比例(通常用p表示)是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的。描述所有可能样本比例的概率分布就是样本比例的抽样分布。当样本容量比较大时,样本比例p近似服从正态分布,且有p的数学期望就是总体比率π,即σ(p)=π而p的方差与抽样方法有关,在重置抽样下为,在不重置抽样下为即在重置抽样时,p的分布为p~n(,)在不重置抽样时,p的分布为p~n(,)一般讲,当np≥5,并n(1-p)≥5时,就可以认为样本容量足够大。对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,当n比较大,而n/n≤5%时,修正系数会趋向1,这时也可以按重置抽样计算方差。从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高。[例题·单选题]当样本容量比较大时,在重置抽样条件下,样本比例p的方差为()a.b.c.d.答案:a解析:当样本容量比较大时,在重置抽样条件下,样本比例p的方差为[例题·单选题]设一个总体含有3个可能元素,取值分别为1,2,3。从该总体中采取重复抽样方法抽取样本量为2的所有可能样本,样本均值为2的概率值是()a.1/9b.2/9c.1/3d.4/9答案:c解析:在重复抽样下,样本为1,2,3的概率都是1/3。[例题·判断题]样本容量是指从一个总体中可能抽取的样本个数。答案:错误解析:样本容量是样本中个体的数目。一个总体可以有多个样本,各个样本的的容量可以相同可以不同。[例题·判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为0.5。答案:正确知识点三:统计量的标准误差统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。样本均值的标准误计算公式为:当总体标准差σ未知时,可用样本标准差s代替计算,这时计算的标准误差称为估计标准误差。相应地,样本比例的标准误计算公式为同样,当总体比例的方差π(1-π)未知时,可用样本比例的方差p(1-p)代替。[例题·单选题]样本均值的标准误差计算公式为()a.b.c.d.答案:b解析:样本均值的标准误差计算公式为[例题·单选题]样本比例的标准误差计算公式为()a.b.c.d.答案:a解析:样本比例的标准误差计算公式为[例题·单选题]统计量的标准误差也称为标准误,其大小与()。a.样本量的平方根成反比b.样本量的大小成反比c.样本量的大小成正比d.总体的标准差成反比答案:a解析:样本均值的标准误计算公式为:,标准误与标准差成正比,与样本量的平方根成反比。[例题·多选题]在参数估计中统计量的标准误差可用于()a.衡量样本统计量与总体参数之间的差距b.衡量样本统计量的离散程度c.衡量样本统计量的集中程度d.衡量总体参数的离散程度e.衡量总体参数的集中程度。答案:ab解析:统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。第二节参数估计知识点一:点估计与区间估计一.点估计与区间估计参数估计是用样本统计量去估计总体的参数。用样本统计量来估计总体参数有两种方法:点估计和区间估计点估计:是用样本统计量的实现值来近似相应的总体参数。区间估计:是根据估计可靠程度的要求,利用随机抽取的样本的统计量确定能够覆盖总体参数的可能区间的一种估计方法。区间估计是包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。标准正态分布为n(0,1)分布,将概率分布标准化的公式为:=将z所对应的概率称为置信度或置信水平,将表示的范围称为置信区间。几个概率下的置信区间:1.以68.73%的置信水平推断总体参数推断总体参数μ的置信区间为(z=1)()2.以95.45%的置信水平推断总体参数推断总体参数μ的置信区间为(z=2)()3.以99.73%的置信水平推断总体参数推断总体参数μ的置信区间为(z=3)()4.还有一个95%的概率度为z=1.96()[例题·多选题]由样本统计量来估计总体参数的方法有()a.点估计b.区间估计c.假设检验d.近似估计e.抽样估计答案:ab解析:用样本统计量来估计总体参数有两种方法:点估计和区间估计[例题·单选题]以68.27%的置信水平推断总体参数的置信区间为a.b.c.d.答案:a解析:68.27%的置信水平,其置信度为1,则置信区间为知识点二:评价估计量的标准用于估计总体参数的估计量可以有很多,如何选择估计效果最好的那种估计量,评价估计量的好坏的标准具体有:1.无偏性,是指估计量抽样分布的期望值等于被估计的总体参数。e()=2.有效性,是指估计量的方差尽可能小。对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。3.一致性,是指随着样本量的增大,标准误越小,点估计量的值越来越接近被估计总体的参数。[例题·多选题]评价估计量的标准为()。a.一致性b.无偏性c.显著性d.有效性e.综合性答案:abd解析:评价估计量的标准为:一致性、无偏性、有效性。[例题·多选题]样本均值是总体均值的()a.无偏估计量b.一致估计量c.有偏估计量d.无效估计e.近似估计量答案:ab解析:从无偏性和一致性来看,样本均值是总体均值的无偏估计量、一致估计量。知识点三:一个总体均值的区间估计在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知,用于估计的样本是大样本(n≥30)还是小样本(n30)等几种情况。但不管哪种情况,总体均值的置信区间都是由样本均值加减估计误差得到的一般将置信水平表示为1-a,统计量分布两侧面积各为a/2的分位数值,它取决于事先所要求的置信度(或可靠程度)。因此总体均值在1-a置信水平下的置信区间可一般性地表达为:(-分位数值*的标准误差,+分位数值*的标准误差)(一)大样本的估计大样本(n≥30)情况下,当总体方差已知时,总体均值在1-置信水平下的置信区间为()式中:为事先确定的一个概率值,它是总体均值不包括在置信区间的概率;1-为置信水平;为标准正态分布上两侧面积各为/2时的z值;为估计误差。大样本情况下,当总体方差未知时,上式中的可以用样本方差代替,总体均值在1-置信水平下的置信区间为()[例题·单选题]以95.45%的置信水平推断总体参数的置信区间为a.b.c.d.答案:b解析:95.45%的置信水平,其置信度为2,则置信区间为(二)小样本的估计小样本(n30)情况下,对总体均值的估计都是建立在总体服从正态分布的假定前提下。(1)当总体方差已知时,样本均值经过标准化后仍服从标准正态分布,此时总体均值在1-置信水平下的置信区间仍为()(2)如果总体方差未知时,样本均值经过标准化后仍服从自由度为(n-1)的t分布,即。t分布也是对称分布,只不过计算出来的t值对应的概率要查t分布概率表。总体均值在1-置信水平下的置信区间为()总体均值的置信区间是由样本均值和估计误差两部分组成的。[例题·单选题]小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平a.b.c.d.答案:a解析:小样本(n30)情况下,当总体方差已知时,样本均值经过标准化后仍服从标准正态分布,此时总体均值在1-置信水平下的置信区间仍为()[例题·单选题]小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平a.b.c.d.答案:a解析:小样本情况下,如果总体方差未知时,总体均值在置信水平(1-a)下的置信区间为()[例题·单选题]在其他条件不变的情况下,提高抽样推断的置信度,抽样误差范围会()。a.不变b.变小c.变大d.不能确定答案:c解析:估计误差,当抽样推断的置信度提高,为变大,范围会变大。知识点四:一个总体比例的区间估计在大样本(n≥30)情况下,当总体比例已知时,在1-置信水平下,总体比例的置信区间为(,)在大样
本文标题:第三章参数估计
链接地址:https://www.777doc.com/doc-2181720 .html