您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第三章 概率与概率分布2
第三章概率与概率分布主要内容:概率论基础常用概率分布本章重点掌握常用概率分布的特点附录:常用概率分布数学用表的使用第一节概率论基础一、概率论相关概念1、随机现象指在一定条件下可能发生也可能不发生的现象。***问卷中的项目(标志)、样本统计量(、S、P)的取值是否属于随机现象?2、随机试验指对随机现象取值规律进行观察的过程。***统计调查过程属于随机试验吗?它观察的是什么的取值规律?是对问卷中的项目(标志)、样本统计量(、S、P)的取值规律进行观察吗?xx3、随机事件指随机试验的每一个可能出现的结果。***调查问卷中品质型变量所设计的选择项(如性别:(1)男;(2)女)、数值型变量调查时每份问卷所填写的值属于随机事件吗?4、样本空间指随机试验所有可能结果的集合。***性别={男,女}(一)事件的概率1.事件A的概率是对事件A在试验中出现的可能性大小的一种度量,即表示事件A出现可能性大小的数值2.事件A的概率表示为P(A)3.概率的定义有:先验概率和后验概率二、概率的定义及性质(二)概率的后验定义在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大(当n∞时),该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为例:在家庭人口数频数分布表中,m为频数,n为样本量、p为频率,A表示家庭人口数(事件),则在1000人中家庭人口数为2人的频数为100,频率P=100/1000=10%当样本量为无限大时,概率P(A=2)≈10%(三)概率的先验定义如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为nmAAP=事件个数样本空间所包含的基本所包含的基本事件个数事件)(**例:P733.1(四)概率的性质1.非负性对任意事件A,有0P12.规范性必然事件的概率为1;不可能事件的概率为0。(一)概率分布的定义三、概率分布定义及类型概率分布:指随机变量所有取值的概率所形成的分布数列或分布图。例:500户家庭人口分布人口数户数频率(概率)123456合计201202008060205004%24%40%16%12%4%100%(二)概率分布的表示形式1、表格式:等同于离散型或连续型频数分布表;2、函数式:P(X=xi)xi为每一事件的代表值。**例:家庭人口数为2,表示为P(x=2)3、累积分布函数式:F(X)=P(X≤x)=ΣP(xi)等同于频数分布表中的频率的向下累积值。**例:家庭人口数在4人以下的总概率,表示为P(x≦4)概率分布类型数据类型分分布函数来分数据特征分离散型分布连续型分布经验分布理论分布基本随机变量分布抽样样本分布(三)类型离散型概率分布离散型随机变量的概率分布二项式分布泊松分布超几何分布连续型概率分布指数分布连续型随机变量的概率分布正态分布均匀分布t分布、F分布、分布2x第二节常用概率分布(一)二项试验一、二项分布满足以下条件的试验称为二项试验(伯努利试验):一次试验只有两种可能结果,即“成功”和“失败”;各次试验相互独立,互不影响各次试验中成功的概率相等,其中成功概率用p表示,失败概率用q表示,即q=1-p。**(1)在调查问卷中哪些调查项目属于二项分布?(2)问卷中多项选择的项目如何变为二项分布?(二)二项分布定义:设X为n次二项试验中成功事件发生的次数,则有:记为X~b(n,p)**例:人口调查结果表明,男性比率为50%,求在100份问卷中,男性问卷出现10人的概率?XnXXnXXnqpXnXnqpCXP)!(!!)(9010101005050)10(CXP二、正态分布xxxf,2221e21)(记为X~N(μ,)f(x)=随机变量x的频数=总体方差=3.14159;e=2.71828x=随机变量的取值(-x)=总体均值(一)分布函数(二)正态分布函数的主要性质1、曲线以X=μ为对称轴左右对称,且在X=μ处达到峰值2、正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。决定曲线的高度,决定曲线的平缓程度,即宽度3、正态曲线下的总面积等于1xf(x)和对正态曲线的影响xf(x)CAB(三)标准正态分布)1,0(~NXZ一般正态分布的标准化:若X~N(μ,σ²),则变量Z称为标准正态分布。记为X~N(0,1)例:身高X~N(1.72,0.27²),则身高X的标准分数变量)1,0(~27.072.1NXZ(四)标准正态分布的特点及大小概率事件(1)标准正态分布曲线的均值为0,标准差为1;(2)界于2个标准差内的总概率为95.45%,约等于95%,称为大概率区间,用1-α表示,则小概率α=5%;(3)界于3个标准差内的总概率为99.73%,约等于99%,称为极大概率区间,极小概率区为1%。(4)在标准正态分布中,大、小概率的分界值Z称为临界值,用Zα或Zα/2表示;(5)如果某测量标准分数Z界于-Zα/2Z+Zα/2,则称其为大概率事件;若Z≤-Zα/2,或Z≥+Zα/2,为小概率事件。0=1-2Z-3-1113.59%334.13%22.14%-Zα/2Zα/21-α(五)标准正态分布表及使用附表1(P434):标准正态分布表列:为变量x最小取值的第1位整数与小数;横行:表示变量X最小取值的第2位小数;坐标点值:表示从(-∞,x)的累积概率值;例:求x=1.12的概率,0.868643(坐标点值)大小概率判断:α=0.05时,查坐标点P=0.975,知Zα/2=1.96即大小概率的临界值为±1.96α=0.01时,查坐标点P=0.995,知Zα/2=2.58即大小概率的临界值为±2.58标准正态分布表使用示例例:已知成年男子身高X~N(1.72,0.27²),某同学身高测量值为2.30,试在α=0.05时判断其身高是否为小概率事件?解:该同学身高标准值为Z=(2.30-1.72)/0.27=2.14α=0.05时,Z0.025=1.96该同学身高Z大于临界值,因此为小概率事件。(一)t分布三、t分布也是一类左右对称的分布,形态类似于标准正态分布,但其分布形状随自由度df=n-1的变化而变化。记作:X~t(df)(二)t分布表使用附表2(P436):t分布表左列:为不同的自由度模行:不同的右尾α值,常用0.025、0.005两列。坐标点值:为临界值例:α=0.05,df=12时,t0.025,12=2.1788α=0.01,df=12时,t0.005,12=3.0545即大小概率临界值随自由度不同而不同例:某班有学生28人,有一同学身高测量值的t分数值为-0.77,试在α=0.05时判断其身高是否为小概率事件?解:查表,α=0.05时,t0.025,27=2.0518,即-t0.025,27=-2.0518该同学身高t值大于此值,因此为大概率事件。X2分布是一个正偏态分布,也是一类形状随自由度df变化而变化的分布。记作:X~x²(df)附表3(P437):x2分布表左列:为不同的自由度模行:不同的右尾α值,常用0.05、0.01两列。坐标点值:为临界值例:α=0.05,df=12时,x²0.05,12=21.026α=0.01,df=12时,x²0.01,12=26.217四、X²分布例:某两班学生学习成绩分布的x2值为3.89,在α=0.05,自由度为4下,判断其是否为大概率事件?F=S2n1-1/S2n2-1F分布也是一个正偏态分布,是一类形状随分子自由度df1和分母自由度df2变化而变化的一族分布。附表4(P439):F分布表α=0.05时,大小概率的临界值为F0.05,df1,df2α=0.01时,大小概率的临界值为F0.01,df1,df2例:某两班各有25人和28人,两班学生数学成绩的方差之比F值为2.89,在α=0.05,自由度为24、27下,判断其是否为大概率事件。五、F分布
本文标题:第三章 概率与概率分布2
链接地址:https://www.777doc.com/doc-3187060 .html