您好,欢迎访问三七文档
2019/8/201第四章抽样分布从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:•选民人数:每个候选人的支持率是多少?•产品:不合格率是多少?•环境:污染程度如何?•市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。2019/8/202主要内容4.1抽样的一般问题4.2三种不同性质的分布4.3一个总体参数推断时样本统计量的抽样分布4.4两个总体参数推断时样本统计量的抽样分布4.5其他抽样方法█2019/8/2034.1抽样的一般问题4.1.1一个例子4.1.2统计抽样的几个基本概念4.1.3简单随机抽样2019/8/2044.1.1一个例子本例中存栏肉猪10000头组成的集合,则称为总体,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用N表示,称作总体容量。本例中所抽出的100头肉猪组成的集合,则称为样本,它是指在统计抽样中按照“随机原则”从总体N(10000)中抽出的部分单位(每个单位称作样本单位)所组成的整体,又称子样。一般样本的单位总数用n(100)表示,称作样本容量。样本不具惟一性,它的可能个数与N、n及抽样方法有关。通常n30称为小样本,n≥30称为大样本,在抽样调查中取大或小样本会直接影响到抽样分布的特征。[例]某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重(设为),如果将每头肉猪过称去获取数据将是不合算的。我们可以按照“随机原则”从中抽出100头称重量,计算这100头的平均每头毛重,以达到我们期望的目的。2019/8/2051、总体和样本总体:研究对象全体,又称母体。容量用N表示。具备惟一性。样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用n表示。样本不具惟一性。当n<30时,为小样本。当n≥30时,为大样本。4.1.2统计抽样的几个基本概念2019/8/2062、总体参数和样本统计量根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总体参数。如上例中的根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。如上例中的抽出100头肉猪的平均每头毛重4.1.2统计抽样的几个基本概念2019/8/2073、重复抽样与不重复抽样从总体中抽取样本有两种方法:重复抽样和不重复抽样。重复抽样,抽样安排---对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。不重复抽样,抽样安排---对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。4.1.2统计抽样的几个基本概念2019/8/2084.1.3简单随机抽样简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分类或排队,直接从总体中按“随机原则”抽取样本单位的调查方式。为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签式或利用《随机数字表》进行抽取。例如:N=500n=10编码从1-500号在随机数表中随意选取二个数字,假如得到4行,43列。则选取的号码从这个被选中的数开始,由于500是个三位数,则小于500的连续三位数即为中选号码,见表中所示。2019/8/209随机数字表974523894212764659099874763642265930598416765870063489962435986633289080365223647065436387132769087912870877652136217721987876434648908327692164896589707743443114228900120874321123043757596721325779959424252386487990344321776095542148797544753769799703777976849877808423277800686921337687908262130892953544320821489900857065432549065643322324379098546476793243438700534521648784542176590879216760896543657897964358650841934325253443876707694637567488125487698767432198453248906034076543324587078676983286548900808463421243326577907963645324908743432923769876672137860769880052326743797343433874856049325477690732437004352187799990135878700821257497682365879048876598023412688032359323314766236689743176944327679094232155023233793203622123793478794235...............4.1.3简单随机抽样█2019/8/20104.2三种不同性质的分布4.2.1几种常见分布4.2.2总体分布4.2.3样本分布4.2.4抽样分布4.2.5样本推断总体的理论依据这些内容与前面内容有什么关系?2019/8/2011一、分布的含义1、在随机试验中,若X随着试验结果的不同而随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,则称X为一个随机变量。2、随机变量取一切可能值或范围与其相应概率间一一对应的关系,称为概率分布(probabilitydistribution,简称分布)。3、概率分布是关于总体的概念,有了概率分布就等于知道了总体。4、概率分布可以用各种图或表来表示,一些可以用公式来表示。4.2.1几种常见分布2019/8/2012二、正态分布4.2.1几种常见分布定义2019/8/2013正态分布的密度函数图形是一条以均值为中心的对称钟型曲线二、正态分布4.2.1几种常见分布2019/8/2014正态分布密度函数的数学性质()fx二、正态分布4.2.1几种常见分布2019/8/2015标准正态分布及其重要意义二、正态分布4.2.1几种常见分布2019/8/2016标准化法二、正态分布4.2.1几种常见分布2019/8/2017标准化法的几何意义标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数,标准差。0m=1s=二、正态分布4.2.1几种常见分布2019/8/2018正态分布表及上侧分位数二、正态分布4.2.1几种常见分布2019/8/2019准则3s二、正态分布4.2.1几种常见分布2019/8/20203s准则示意图二、正态分布4.2.1几种常见分布2019/8/2021正态分布的重要意义在随机理论中,正态分布是最重要的一种分布,理由如下:⑴它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。⑵在一定的条件下,正态分布是其他分布的近似分布。⑶许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。二、正态分布4.2.1几种常见分布2019/8/2022三、小样本(n30)的精确分布1、2分布2、t分布3、F分布均由正态分布导出的分布4.2.1几种常见分布2019/8/20231、2分布(2distribution)(1)推导说明①由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来。②设,则③构造,则Yi服从自由度为1的2分布,即④当总体,从中抽取容量为n的样本,则),(~2NX)1,0(~NXz2(1,2,...,)iiYzin22~(1),~()iiYYn),(~2NX)1(~1)(222212nSnxxnii4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/20241、2分布(2)性质和特点①由于2分布变量为正态变量的平方和,故分布的变量值始终为正。②可加性:若U和V为两个独立的服从2分布的随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布。③n个独立正态变量平方和称为有n个自由度的2-分布,记为2(n)。2-分布为一族分布,成员由自由度区分。④分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。⑤期望为E(2)=n,方差为D(2)=2n(n为自由度)4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/20251、2分布(3)图示选择容量为n的简单随机样本计算样本方差s2计算卡方值2=(n-1)s2/σ2计算出所有的2值不同容量样本的抽样分布2n=1n=4n=10n=20总体4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/20261、2分布(4)2分布的上分位点分位点设X~2(n),若对于:01,存在2()0n,满足2{()},PXn则称2()n为2()n分布的上分位点。2()n4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/2027①由统计学家哥赛特(W.S.Gosset)于1908年提出,并以其笔名命名。2、t-分布(t-distribution)(1)t分布的构造及性质4.2.1几种常见分布三、小样本(n30)的精确分布②构造:若~N(0,1),~2(n),与独立,则~()./Ttnnt(n)称为自由度为n的t分布。③基本性质:(1)f(t)关于t=0(纵轴)对称。(2)f(t)的极限为N(0,1)的密度函数,即221lim()(),2tnfttex2019/8/2028t(n)分布的图形为2、t-分布(t-distribution)(2)t分布的图示4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/2029-5-4-3-2-101234500.050.10.150.20.250.30.350.4tvalueDensityoft(2)TailProbabilityfort(2)t0.05=2.92P(tt0.05)==0.05P(tt0.05)=1-=0.95对于给定的:01,称满足条件P(tt)=的点t为t(n)分布的上分位点。)(1nt)(nt2、t-分布(t-distribution)(3)t分布的上分位点4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/2030•①由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名•②构造:设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为21nVnUF),(~21nnFF3、F分布(Fdistribution)(1)F分布的构造4.2.1几种常见分布三、小样本(n30)的精确分布2019/8/2031F分布(图示)不同自由度的F分布F(1,10)(5,10)(10,10)3、F分布(Fdistribution)(2
本文标题:统计-抽样分布
链接地址:https://www.777doc.com/doc-420085 .html