您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学概率与抽样分布
第5章概率与抽样分布ProbabilityandSamplingDistributions想过下面的问题吗?购买一张彩票中奖的可能性有多大?购买一只股票明天上涨的可能性有多大?你投资一个餐馆盈利的可能性有多大?一项工程按期完成的可能性有多大?明天降水的可能性有多大?第5章概率与概率分布•§5.1随机事件及其概率•§5.2概率的性质与运算法则•§5.3离散型随机变量及其分布•§5.4连续型随机变量及其分布学习目标•1.了解随机事件、随机试验、含义、几种概率•2.掌握随机变量的定义、分布特征及数学期望•3.掌握样本均值与成数的抽样分布§5.1随机事件及其概率一.事件及其运算二.事件的概率三.概率计算的几个例子事件及其运算事件的概念1.事件(event):随机试验的每一个可能结果(任何样本点集合)–例如:掷一枚骰子出现的点数为32.随机事件(randomevent):每次试验可能出现也可能不出现的事件–例如:掷一枚骰子可能出现的点数3.必然事件(certainevent):每次试验一定出现的事件,用表示–例如:掷一枚骰子出现的点数小于74.不可能事件(impossibleevent):每次试验一定不出现的事件,用表示–例如:掷一枚骰子出现的点数大于6•例解–随机试验:抛掷两颗骰子,观察出现的点数–试验的样本点和基本事件Ω={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),...,(6,1),(6,2),...,(6,6随机事件–A=“点数之和等于3”={(1,2),(2,1)}–B=“点数之和大于11”={6,6}–C=“点数之和不小于2”=Ω–D=“点数之和大于12”=Φ事件的关系和运算(事件的包含)ABBA若事件A发生必然导致事件B发生,则称事件B包含事件A,或事件A包含于事件B,记作或AB或BA事件的关系和运算(事件的并或和)事件A和事件B中至少有一个发生的事件称为事件A与事件B的并。它是由属于事件A或事件B的所有的样本点组成的集合,记为A∪B或A+BBAA∪B事件的关系和运算(事件的交或积)ABA∩B事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为B∩A或AB事件的关系和运算(互斥事件)ABA与B互不相容事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称两个事件是相容的。显然,事件A与事件B互斥的充分必要条件是事件A与事件B没有公共的样本点事件的关系和运算(事件的逆)AA一个事件B与事件A互斥,且它与事件A的并是整个样本空间,则称事件B是事件A的逆事件。它是由样本空间中所有不属于事件A的样本点所组成的集合,记为A事件的关系和运算(事件的差)A-BAB事件A发生但事件B不发生的事件称为事件A与事件B的差,它是由属于事件A而不属于事件B的那些样本点构成的集合,记为A-B什么是概率?(probability)1.概率是对事件发生的可能性大小的度量你购买一只股票明天上涨的可能性有多大明天降水的概率是80%。这里的80%就是对降水这一事件发生的可能性大小的一种数值度量2.一个介于0和1之间的一个值3.事件A的概率记为P(A)事件的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。一、频率与概率frequencyandprobability概率•1.古典概率——是指在每次试验中事件等可能出现的条件下,于试验前计算的比率。设事件A是样本空间Ω中的一个随机事件,若样本空间Ω中的基本事件数为n,事件A包含m个基本事件,则事件A的概率为:•P(A)=m/n•【例】掷一枚的硬币,得到正面的概率为多少?•2.试验概率——是指在确定的条件下,事件A在大量的n次试验中出现m次,则事件A的频率m/n可作为事件A的概率p(A)的近似比率。这种概率是根据统计试验后的大量数据整理所得,故称试验概率,也称后验概率和统计概率。记为:nmAp)(nfPAPAnlim)(•3.主观概率——是指人们凭个人经验对某一事件发生的可能性大小作出的估计。•例如,天空看上去阴沉沉的,估计下雨的可能性有多大;股价指数在未来一周内上升的可能性有多大;一种新产品在未来市场上畅销的可能性有多大等。1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越接近概率。频率与概率的关系:调查株数(n)52550100200500100015002000受害株数(a)212153372177351525704棉株受害频率(a/n)0.400.480.300.330.360.3540.3510.3500.352表在相同条件下盲蝽象在某棉田危害程度的调查结果一、频率与概率frequencyandprobability一、频率与概率frequencyandprobability小概率原理若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的0.05或0.01称为小概率标准,农业试验研究中通常使用这两个小概率标准。二、随机变量事先不知道会出现什么结果投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好一般用X,Y,Z来表示根据取值情况的不同分为离散型随机变量和连续型随机变量离散型和连续型随机变量随机变量的可能取值是离散的数字,如计数型或分类型等,称为离散型随机变量(discreterandomvariable)。{0,1,…,9}。20次实验中成功的次数,二项式分布。随机变量的可能取值是某一实数的区间,如“大于0”或“-2~2之间”等,称为连续型随机变量(continuousrandomvariable)。正态随机变量三、随机变量三、离散型随机变量(discreterandomvariables)1.随机变量X取有限个值或所有取值都可以逐个列举出来x1,x2,…2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1离散型数学期望和方差(例题分析)【例】一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表次品数X=xi0123概率P(X=xi)pi0.750.120.080.05每100个配件中的次品数及概率分布求该供应商次品数的数学期望和标准差43.005.0308.0212.0175.00iiipx8397.07051.0)(22iiipx三、离散型随机变量的概率分布X=xix1,x2,…,xnP(X=xi)=pip1,p2,…,pn101iniipp列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示P(X=xi)=pi称为离散型随机变量的概率函数连续型随机变量(continuousrandomvariables)1.可以取一个或多个区间中任何值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00X100X0连续型随机变量的期望和方差1.连续型随机变量的期望值•2.方差xxxfXEd)()(2d)()()(xxfXExXD四、连续型随机变量的概率密度若观察资料数量够大,则直方图(组数适当增加)的整体形态可用一近似的平滑曲线显示。直方图中纵轴改为次数比例,则该平滑曲线称为密度曲线(densitycurve)。概率密度曲线00.020.040.060.080.10.120.14234567891011密度曲线的性质曲线都在水平线上(密度函数=0)。曲线下所涵盖的全部面积正好为1(所有可能性为1)。曲线下任何范围所涵盖的面积,为观察值落在该范围的比例(概率)。密度曲线可视为是观察变量的理论分布图形。四、连续型随机变量的概率密度()iiEXxp随机变量X的一切可能取值的完备组中,各可能取值xi与其相对应的概率pi乘积之和描述随机变量取值的集中程度计算公式为五、随机变量的数学期望2()()iiDXxEXp随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)描述离散型随机变量取值的分散程度计算公式为六、随机变量的方差5.2TheBinomialDistributions二项分布(了解)一、二项分布设定TheBinomialSetting固定的观察次数n。n次的观察都独立,每次的观察都不会对其他观察提供任何信息。每次的观察都只有两种可能的结果,多假设为“成功”或“失败”两种。每次的观察“成功”的概率都一样,设定为p。二、二项分布BinomialDistribution满足二项分布设定的试验,以X记录n次观察中“成功”的次数,则称X的分布为参数为n与p的二项分布(binomial),记为B(n,p)。X的所有可能取值为{0,1,…,n}。对应的概率函数为P(X=x)=P(x)。()(1)forx=0,1,&,nxxnxnPXxCpp[例1]某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少?按上述二项分布概率函数式计算7头愈好,3头死去概率:8头愈好,2头死去概率:9头愈好,1头死去概率:10头全部愈好的概率:21499.0)60.0()40.0()3(73310CP12093.0)60.0()40.0()2(82210CP04031.0)60.0()40.0()1(91110CP00605.0)60.0()40.0()0(100010CP【例】若问10头中不超过2头死去的概率为多少?则应该应用累积函数,即16729.012093.004031.000605.0)2()1()0()()2(20PPPyPF四、二项分布的期望值与标准差期望值:E(X)=np方差:Var(X)=np(1-p)标准差:)1(pnp5.3NormalDistributions正态分布(掌握)(连续型变量的概率分布)一、特点正态曲线所有正态曲线都有相同的外型•具有对称、单峰及钟形的特性。正态曲线所代表的分布即为正态分布(normaldistribution)每一正态分布都有其平均值与标准差一、特点正态曲线较大一、特点正态曲线的拐点拐点落在一个处拐点落在-处一、特点二、P117规则正态分布有其特定的数据分布规则:平均值为,标准差为σ的正态分布68%的观察资料落在的1σ之内95%的观察资料落在的2σ之内99.7%的观察资料落在的3σ之内0123-1-2-3232368%的资料95%的资料99.7%的资料三、P117规则四、变量标准化(Standardization)令观察值x服从平均值为μ,标准差为σ的分布,则x的标准化值(standardizedvalue)定义为标准化值又称为z-值(z-score)。xz标准化变量可以证明•z的平均值为0•z的标准差为1四、变量标准化(Standardization)xz五、标准正态分布变量X服从平均值为μ,标准差为σ的正态分布,简记为X~N(μ,σ2)。X经过标
本文标题:统计学概率与抽样分布
链接地址:https://www.777doc.com/doc-420120 .html