您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 本科“统计学”第五章概率分布与抽样分布
2-16-1第五章概率分布与抽样分布第一节随机事件与概率分布第二节抽样分布及其性质2-26-2学习目标1.了解随机事件及概率分布2.理解抽样分布的意义3.了解抽样分布的形成过程4.理解中心极限定理5.理解抽样分布的性质2-36-3第一节随机事件与概率分布2-46-4一、随机试验与随机事件1.必然现象(确定性现象)变化结果是事先可以确定的,一定的条件必然导致某一结果这种关系通常可以用公式或定律来表示2.随机现象(有不确定性,但不等同于偶然现象)在相同条件下可能发生也可能不发生的现象个别观察的结果完全是偶然的、随机会而定大量观察的结果会呈现出某种规律性(随机性中寓含着规律性)——统计规律性十五的夜晚能看见月亮?十五的月亮比初十圆!2-56-5随机试验1.严格意义上的随机试验满足三个条件:试验可以在相同的条件下重复进行;每次试验的可能结果不止一个,但试验的所有可能结果在试验之前是明确可知的;每次试验只能观察到可能结果中的一个,但在试验结束之前不能肯定哪一个结果会出现。2.广义的随机试验是指对随机现象的观察(或实验)实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。2-66-6随机事件(事件)1.随机事件(简称事件)随机试验的每一个可能结果常用大写英文字母A、B、……、来表示2.基本事件(样本点)——中国足球队胜、负、平不可能再分成为两个或更多事件的事件:3.样本空间(Ω)在一项随机试验中,每一个基本事件称为一个样本点,而所有样本点构成这项试验的样本空间。显然,样本空间等同于集合论中的全集,基本事件对应于全集中的元素,满足某些规定性质的随机事件就是集合论中的一个子集。2-76-7随机事件(续)1.随机事件的两种特例必然事件在一定条件下,每次试验都必然发生的事件必然事件发生的概率为1不可能事件在一定条件下,每次试验都必然不会发生的事件不可能事件是一个空集(Φ)2-86-8二、随机事件的概率1.概率用来度量随机事件发生的可能性大小的数值必然事件的概率为1,表示为P()=1不可能事件发生的可能性是零,P()=0随机事件A的概率介于0和1之间,0P(A)12-96-9概率的统计定义当试验次数n很大时,事件A发生频率m/n稳定地在某一常数p上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义p为事件A发生的概率nmpAP)(当n相当大时,可用事件发生的频率m/n作为其概率的一个近似值——计算概率的统计方法(频率方法):贝努利概型2-106-10事件的概率例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数n的增大,出现正面和反面的频率稳定在1/2左右试验的次数正面/试验次数1.000.000.250.500.750255075100125实验次数正面正面/实验次数111.00210.50310.33410.25520.40630.50740.57850.63960.671070.701180.731290.751390.691490.641590.6016100.6317100.5918100.5619110.5820120.6021130.6222140.6423150.6524160.6725160.642-116-11历史上有很多人都曾经做过抛硬币试验:试验者试验次数正面出现的频率蒲丰40400.5069K.皮尔逊120000.5016K.皮尔逊240000.5005罗曼诺夫斯基806400.49792-126-12三、随机变量的概念1.随机变量——表示随机试验结果的变量取值是随机的,事先不能确定取哪一个值一个取值对应随机试验的一个可能结果用大写字母如X、Y、Z...来表示,具体取值则用相应的小写字母如x、y、z…来表示2.根据取值特点的不同,可分为:离散型随机变量——取值可以一一列举连续型随机变量——取值不能一一列举2-136-13离散型随机变量1.随机变量X取有限个值或所有取值都可以逐个列举出来X1,X2,…2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为12-146-14连续型随机变量1.随机变量X取无限个值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00X100X02-156-15四、随机变量的概率分布1.离散型随机变量的概率分布2.连续型随机变量的概率密度3.分布函数不同的随机试验,其样本空间的具体构成千差万别。但是,实质上,如果把具体内容抽象掉,将随机事件数量化,就会发现许多随机试验中概率的计算具有某种共同性,遵循某一种概率分布模型。只要能找到这些概率分布模型,就会为我们计算概率和研究同类随机现象的规律性提供方便。——因此,随机变量及其概率分布是描述随机现象的重要工具。2-166-16概率函数P(X=xi)=pi离散型概率分布的表示:1.离散型随机变量的概率分布1.离散变量X的概率分布——离散型随机变量X的每一个可能的取值xi与其概率pi(i=1,2,3,…,n)之间所确立的对应关系称为这个离散型随机变量的分布。2.概率分布具有如下两个基本性质:(1)pi≥0,i=1,2,…,n;(2)1iipX=xix1x2…xnP(X=xi)=pip1p2…pn2-176-17离散型随机变量的概率分布(实例)【例】如规定打靶中域Ⅰ得2分,中域Ⅱ得1分,中域Ⅲ及中域外得0分。今某射手每100次射击,平均有30次中域Ⅰ,60次中域Ⅱ,10次中Ⅲ及中域外。则考察每次射击得分为0,1,2这一离散型随机变量,求其概率分布。2-186-18射击得分的概率分布表示:分布图0.60.30012xP(x)图3-5例3-9的概率分布X=xi012P(X=xi)pi0.10.60.32-196-192.连续型随机变量的概率密度1.对于连续型随机变量,我们关心的往往不是它取某个特定值的概率,而是该随机变量落在一定区间内的概率;2.连续型随机变量的概率分布只能表示为:数学函数——概率密度函数f(x)和分布函数F(x)图形——概率密度曲线和分布函数曲线3.概率密度函数f(x)的函数值不是概率;而x轴以上、概率密度曲线下方面积才表示概率。dxxfbXaPba)()(f(x)xab随机变量X在一定区间(a,b)上的概率为:2-206-20什么是概率密度?2-216-21连续数据的概率分布:表零件尺寸的分组表按零件尺寸分组频数(个)105~110110~115115~120120~125125~130130~135135~140358141064合计502-226-22频数直方图频数(个)1512963105110115120125130135140零件尺寸图零件尺寸分布频数的直方图问题:曲线下面积为1吗?2-236-23连续数据的概率分布:表零件按尺寸数据的分组表按零件尺寸分组频数(个)频率105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.08合计501频率=频数/总数2-246-24频率直方图频率0.320.240.180.120.06105110115120125130135140零件尺寸图零件尺寸分布频率的直方图问题:曲线下面积为1吗?2-256-25连续数据的概率分布:表零件按尺寸数据的分组表按零件尺寸分组频数(个)频率频率密度105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.080.0120.0200.0320.0560.0400.0240.016合计501-----频率密度=频率/组距2-266-26频率密度直方图频率密度0.0600.0480.0360.0240.012105110115120125130135140零件尺寸图零件尺寸分布频率密度的直方图问题:曲线下面积为1吗?2-276-27频数直方图—频率直方图—频率密度直方图1.在频数分布直方图中,如果按各组的频率密度来测定各直条的高,则第i个直条的面积等于该组的频率,所有直条的面积之和等于1。2.与直方图的直条高为频率密度相仿,曲线上某一点的纵坐标为随机变量在相应横坐标附近的一个狭小区间内(在这个狭小区间的宽度趋近于零的过程中)取值概率的概率密度(即概率/区间宽度)。所以,这条曲线叫做随机变量的(分布)密度曲线。3.今后可以看到,概率密度曲线可以用适当的数学解析式来描述。4.我们把密度曲线以及相应的数据解析式所表达的数学函数关系称作随机变量的(分布)密度函数。密度函数刻画了连续型随机变量的分布规律。5.相对于由频率直方图来描述的随机变量的经验分布来讲,由密度函数所刻画的连续型随机变量的概率分布规律称为它的理论分布。2-286-28连续型随机变量的分布1.综上所述,连续型随机变量X的一系列取值区间和随机变量在该区间取值的概率之间确立的对应关系,称作这个连续型随机变量的分布。2.连续型随机变量的分布可以用密度函数来描述,随机变量X的密度函数记作f(x)。3.频数分布直方图是用各组的频率密度作直条的高来画图的。当分组数无穷多,而组距(即直条的底边长趋近于0时,直方图演变成平滑的曲线。这时,直条的高就成为f(x)。4.连续型随机变量X在某一数值区间[a,b]内取值的概率等于竖立在该区间上的、以密度曲线为上底的曲边梯形的面积。记作:dxxfbXaPba)()(2-296-29概率密度f(x)的性质(1)f(x)≥0。概率密度是非负函数。(2)1d)(xxf即:所有区域上取值的概率总和为1。只要满足上述两条性质,即可认为是一个概率密度。dxxfbXaPba)()(f(x)xab随机变量X在一定区间(a,b)上的概率为:1.密度曲线是把分布加以理想化之后产生的图形,对于描绘大量观测值的时候最为有用。2.密度曲线的结构是利用曲线底下的面积表示落在该区的观测值的比例。因此,必须选择适当的尺度,使得曲线底下的面积恰恰是1,这样就得到一个密度曲线。2-306-303.分布函数1.适用于两类随机变量概率分布的描述2.分布函数的定义:F(x)=P{X≤x}xxiip连续型随机变量的分布函数dxxfxFx)()(=离散型随机变量的分布函数F(x)=f(x)xx0F(x0)分布函数与概率密度2-316-314.随机变量的数字特征随机变量的数学期望随机变量的方差和标准差两个随机变量的协方差和相关系数2-326-32(1)随机变量的数学期望又称均值描述一个随机变量的概率分布的中心位置离散型随机变量X的数学期望:——相当于所有可能取值以概率为权数的平均值连续型随机变量X的数学期望:iiipxXE==)(dxxxfxE)()(=2-336-33数学期望的主要数学性质若k是一常数,则E(kX)=kE(X)对于任意两个随机变量X、Y,有E(X+Y)=E(X)+E(Y)若两个随机变量X、Y相互独立,则E(XY)=E(X)E(Y)2-346-34(2)随机变量的方差方差是它的各个可能取值偏离其均值的离差平方的均值,记为D(x)或σ2公式:离散型随机变量的方差:连续型随机变量的方差:22)()(XEXD==dxxfxxD)(][)(22==iiipxXD22)()(-==2-356-35方差和标准差(续)标准差=方差的平方根方差和标准差都反映随机变量取值的分散程度。它们的值越大,说明离散程度越
本文标题:本科“统计学”第五章概率分布与抽样分布
链接地址:https://www.777doc.com/doc-2323766 .html