您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第四章抽样分布与参数估计
4-1第四章抽样分布与参数估计第一节频率、概率与概率分布第二节抽样分布第三节总体参数估计第四节抽样设计4-2第一节频率、概率与概率分布一、随机事件与概率(一)随机试验与事件随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:(1)每次试验的可能结果不是唯一的;(2)每次试验之前不能确定何种结果会出现;(3)试验可在相同条件下重复进行。4-3在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有n个基本事件,分别记为(i=1,2,…,n)。集合Ω={ω1,ω2,…,ωn}称为样本空间,Ω中的元素就是样本点。i4-4例:投掷一粒均匀的六面体骰子,出现的点数有可能是1、2、3、4、5、6共六种。这六种结果是基本结果,不可以再分解成更简单的结果了,所以Ω={1,2,3,4,5,6}为该试验的样本空间。“出现点数是奇数”这一事件就不是简单事件,它是由基本事件{1},{3}和{5}组合而成的。我们通常用大写字母A,B,C,…来表示随机事件,例如,设A表示“出现点数是奇数”,则A={1,3,5};设B表示“出现点数是偶数”,则B={2,4,6}。4-5(二)概率1.概率的定义概率就是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:P(A)=p。在古典概型场合,即基本事件发生的概率都一样的场合:样本点总数包含的样本点个数AnmAP样本点总数的有利场合数A4-6例:设一个袋子中装有白球2个,黑球3个。(1)从中随机摸出1只球,问刚好是白球的概率有多大?(2)从中随机摸出2只球,一问2只球都是白球的概率有多大?二问2只球一白一黑的概率有多大?三问2只球都是黑球的概率有多大?解:(1)由于摸出的任何1只球都形成一个基本事件,所以样本点总数为n=5。用A表示摸出的是白球事件,则A由两个基本点组成,即A={白球,白球},有利场合数m=2。因此,刚好摸出白球的概率为P(A)=m/n=2/5=0.44-7(2)由于摸出2只球才成一个基本事件,所以样本点总数为故P(A)=P(2只球都是白球)=1/=1/10P(B)=P(2只球一白一黑)=2×3/10=6/10P(C)=P(2只球都是黑球)=3/10NOTE:P(A+B+C)=125C25C4-82.概率的基本性质性质11≥P(A)≥0。性质2P(Ω)=1。性质3若事件A与事件B互不相容,即AB=Ф,则P(A∪B)=P(A)+P(B)。推论1不可能事件的概率为0,即:P(Ф)=0。推论2P()=1-P(A),表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。AA4-9例:袋中装有4只黑球和1只白球,每次从袋中随机地摸出1只球,并换入1只黑球。连续进行,问第三次摸到黑球的概率是多少?解:记A为“第三次摸到黑球”,则为“第三次摸到白球”。先计算P()。由于袋中只有1只白球,如果某一次摸到了白球,换入了黑球,则袋中只有黑球了。所以相当于第一、第二次都是摸到黑球,第三次摸到白球。注意这是一种有放回的摸球,样本点总数为53,有利场合数是42×1。故:P()=,所以AA12516514321251095141132APAPA4-103.事件的独立性定义对事件A与B,若p(AB)=p(B)p(A),则称它们是统计独立的,简称相互独立。例:已知袋中有6只红球,4只白球。从袋中有放回地取两次球,每次都取1球。设表示第i次取到红球。那么,因此,,也就是说,B1,B2相互独立。从题目条件看,这一结论是显然的。iB1263()()105PBPB1221136()3100()3()55PBBPBBPB122111233()()()()()55PBBPBBPBPBPB4-11二、随机变量随机变量X是定义在样本空间Ω={ω1,ω2,…,ωn}上的一个函数,这个函数的取值随试验的结果不同而变化。这个函数还要求满足条件:对任意的实数x,Xx是随机事件。如果随机变量所有可能的取值是有限的,或可排成一列的,这种随机变量称为离散型随机变量;另一种情况是随机变量的取值范围是一个区间或整个数轴,这种随机变量称为连续型随机变量。1.离散型随机变量的概率分布设离散型随机变量X的所有可能取值为x1,x2,…,xn,…,相应的概率为p(x1),p(x2),…,p(xn),…。用表格统一表示出来是:4-12Xx1x2…xn…Pp(x1)p(x2)…p(xn)…这称为离散型随机变量X的概率分布。性质:(1)0≤p(xi)≤1(i=1,2,…);(2)定义:离散型随机变量X的期望值为性质:其中X1,X2都是随机变量,α,β是任意常数。iixp1IiixpxXE2121XEXEXXE4-13定义:离散型随机变量X的方差为方差的平方根σ称为标准差。方差σ2或标准差σ反映随机变量X相对其期望值的离散程度,σ2或σ越小,说明期望值的代表性越好;σ2或σ越大,说明期望值的代表性越差。性质:对于任意的α,D(αX)=α2D(X)成立iiixpxXEXD222)(4-14贝努里试验与二项分布有时我们只对试验中某事件A是否出现感兴趣,如果A发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设A出现的概率为p,我们独立地重复进行n次贝努里试验,称为n重贝努里试验.以Bk表示n重贝努里试验中事件A正好出现k次这一事件,则(k=0,1,2,…,n)该分布称为二项分布(q=1-p).NOTE:knkknkqpCBp1)()(000nknknnkkknnkkqpqpCBP4-152.连续型随机变量的概率分布设X是R.V.,x是一实数.记F(x)=P(Xx)。该函数就是随机变量X的分布函数。分布函数的导数称为密度函数,记作p(x)。性质(1)p(x)≥0(2)(3)1dxxpbaxxpbXapd)()(abxP(a≤xb)4-16定义:连续型随机变量X的期望值为方差为性质:D(αX)=α2D(X)xxxpXEd)(xxpxXEXDd)(2222121XEXEXXE4-17正态分布如果连续型随机变量X的密度函数为则称随机变量X服从均值为μ,方差为σ2的正态分布,记为X~N(μ,σ2)。如果一个正态分布的μ=0,σ=1,则称该正态布为标准正态分布,相应的随机变量称为标准正态随机变量,用Z表示,即Z~N(0,1),相应的分布密度函数为xxpx222e21zzpz22e214-18一般正态分布与标准正态分布的关系:若随机变量X服从正态分布N(μ,σ2),则随机变量Z=服从标准正态分布,即Z~N(0,1)。X4-19例:某大学英语考试成绩服从正态分布,已知平均成绩为70分,标准差为10分。求该大学英语成绩在60—75分的概率。)(.).()(6070707570101010105053286075XpZpXp4-20第二节抽样分布一、抽样的基本概念二、抽样分布(一)重复抽样分布(二)不重复抽样分布三、大数定理与中心极限定理4-21一、抽样的基本概念抽样涉及的基本概念有:总体与样本(见第一章)样本容量与样本个数总体参数与样本统计量重复抽样与不重复抽样这些概念是统计学特有的,体现了统计学的基本思想与方法。4-22总体和样本(参见第1章)1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用N表示。2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用n表示。3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。4-23样本容量与样本个数样本容量:一个样本中所包含的单位数,用n表示。样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(这个概念只是对有限总体有意义,对无限总体没有意义!)4-24总体参数和样本统计量总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。样本统计量:根据样本分布计算的指标。是随机变量。平均数标准差、方差成数参数、2p统计量S、S2P总体样本X22()1xxsn22()1ffxxs4-25重复(置)抽样与不重复(置)抽样重置抽样与不重置抽样(各有3个特点P90)重复抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数=Nn=52=25不考虑顺序时:样本个数=ABACDEBBCDAECBCDAEDBCDAEEBCDAE-(-)!(-)!!nNnNnCNn1114-26重复(置)抽样与不重复(置)抽样ABCDEBCDAECBDAEDBCAEEBCDAn)!-(N!NPnNABCDEBCDECDEDEEn)!n!-(N!NCnN不重复抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数不考虑顺序时:样本个数4-27二、抽样分布抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)包括以下内容重置抽样分布样本平均数的分布样本成数的分布不重置抽样分布样本平均数的分布样本成数的分布4-28重置抽样分布--样本平均数的分布某班组5个工人的日工资为34、38、42、46、50元。=422=32现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。样本样本平均数X样本样本平均数X34,3434,3834,4234,4634,5038,3438,3838,4238,4638,5042,3442,3842,4242,4642,5034363840423638404244384042444646,3446,3846,4246,4646,5050,3450,3850,4250,4650,50404244464842444648504-29验证了以下两个结论:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用表示。重置抽样分布--样本平均数的分布样本平均数X频数343638404244464850123454321合计25()()XfEXXf42元()()()XXfXf22216元X()EX()nX22Xn4-30重置抽样分布--样本平均数的分布由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。)2(,)Nn4-31重置抽样分布--样本成数的分布总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单位总数目是N,总体中有该特征的单位数是N1。设x是0、1变量(总
本文标题:第四章抽样分布与参数估计
链接地址:https://www.777doc.com/doc-419947 .html