您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 概率论基础知识及其在matlab中的实现
第三章概率论基础知识及其在matlab中的实现概率论与应用数理统计十就是研究随机现象统计规律性的一门科学,本章学习随机及其发生的概率,多维随机变量的分布规律,参数估计与假设检验,方差分析与回归分析等概率统计的基本方法以及它们在MATLAB中实现方法。3.1随机时间及其概率3.1.1古典概率及其模型由古典概率的定义知,古典概率基于这样两个原则:(1)所有可能发生的结果只有有限个;(2)每一种可能出现的结果机会是相同的。在MATLAB中提供了一个在[0,1]区间上均匀分布的随机函数rand,其命令格式为:命令格式1:rand(N)功能:返回一个NN的随机矩阵命令格式2:rand(N,M)功能:返回一个MN的随机矩阵命令格式2:rand(P1,P2,…,Pn)功能:返回一个nPPP21的随机矩阵可以用计算机模拟掷硬币这一过程,为了模拟硬币出现正面或反面,规定随机数小于0.5时为反面,否则为正面,可以用round()函数将其变成0—1矩阵,然后将整个矩阵的各元素值加起来再除以总的原始个数即为出现正面的概率。round()函数的命令格式为:命令格式:round(x)功能:对向量或矩阵x的每个分量四舍五入取整。现以联系掷10000次硬币为例,重复做100次试验模拟出现正面的概率。在matlab中的程序如下:fori=1:100a(i)=sum(sum(round(rand(100))))/10000;endmx=max(a);mn=min(a);ma=mean(a);a,mx,mn,ma在该程序输出的四项中,a为实验100次中每次出现正面的频率,mx和mn分别为100次实验中出现正面频率的最大值和最小值,ma为100次试验出现正面的平均频率。运行结果如下:这里要输入结果下面介绍MATLAB中取整的几个函数命令:(1)命令格式:fix(x)功能:对x朝零方向取整(2)命令格式:floor(x)功能:对x朝负无穷大方向取整(3)命令格式:ceil(x)功能:对x朝正无穷大方向取整3.1.2统计概率及其模型由于古典概率是建立在事件发生的等可能基础上的概率,而现实生活中许多现象的出现并不是等可能的。例如某品种的玉米,当种下一粒后,其发芽与不发芽的机会并不相同。那么,这个概率就不能建立在等可能基础上,即不能使用古典概率的定义。而统计概率的定义是建立在频率基础上的,就是说某事件出现频率如果稳定在某数值附近,则称数值为该事件出现的概率。由于统计概型中的概率是一个理论上的数值,实际问题中根本无法直接得到该数值,因而通常在试验次数充分多时,利用频率值近似代替概率值。在掷硬币的试验中,在试验次数充分多的情况下,掷硬币出现正面和反面的频率均在0.5左右,故出现正面和反面的概率均为0.5。下面来看掷硬币时,当样本容量分别为n=10,100,1000,10000,100000,1000000时频率的变化。在MATLAB中实现时程序代码如下:forI=i:6a(i)=sum(round(rand(1,10-i)))/10^I;end运算结果为:这里输入运算结果从上面运行的结果中可以看出,当样本容量不够大时,其频率的波动范围很大,即频率不够稳定,即使有时达到0.5,但最大时已达到0.9,然而随着样本容量的增加,频率的波动范围越来越小,相差仅有310左右。3.1.3条件概率、全概率公式与伯努利概率若事件B的发生会影响到事件A的发生,则事件B发生的条件下,事件A发生的概率称为条件概率,条件的概率的计算公式为:)()()|(BPABPBAP若事件A的发与事件B的发生与否没有关系,即事件B发生与否不会影响到事件A的发生,反之亦然,则称事件A与事件B是相互独立的,这时有:)()()(BPAPABP例1袋中有10只球,其中白球7只,黑球3只。分有放回和无放回两种情况,分三次取球,每次取一个,分别求:(1)第三次摸到了黑球的概率,(2)第三次才摸到黑球的概率,(3)三次都摸到了黑球的概率。解当有放回地摸球时,由于三次摸球互不影响,因此三次摸球相互独立,从理论上可以求得:(1)第三次摸到黑球的概率为3.0103;(2)第三次才摸到黑球的概率为147.0103107107;(3)三次都摸到黑球的概率为027.0103103103。在MATLAB中模拟这一过程时,可在[0,1]区间上产生三次随机数来模拟三次摸球,当随机数小于0.7时可认为摸到了白球,否则认为摸到了黑球。重复610次分别求上述三种情况出现的概率。程序如下:a=round(rand(1000000,3)–0.2);fori=1:6b=a(1:10^i,3;c(i)=sum(b)/(10^i);endcfori=1:6b=(~a(1:10^i,1))&(~a(1:10^i,2))&a(1:10^i,3);d(i)=sum(b)/(10^i);enddforI=1:6b=a(1:10^i,1)&a(1:10^i,2)&a(1:10^i,3);e(i)=sum(b)/(10^i);ende运行结果为:这里加入运行结果执行结果中c为第三次摸到黑球的概率,d为第三次才摸到黑球的概率,e为三次都摸到黑球的概率.可以看到,随着试验次数的增加,其频率都会逐渐稳定在理论值附近.当无放回地摸球时,由于第二次摸球会受到第一次的影响,而第三次摸球又会受到前两次的影响,因而三次摸球相互影响,并不独立.从理论上可求得:(1)第三次摸到黑球的概率为3.08192103829710382931078396107,(2)第三次才摸到黑球的概率为175.08396107(3)三次都摸到了黑球的概率为008.08192103用计算机模拟该过程时,在[0,1]区间模拟第一次摸球,当值小于0.7时认为摸到了白球,否则认为摸到了黑球;第二次摸球时由于少了一个球,故可在区间长度为0.9的区间上模拟,若第一次摸到白球,可将区间设为[0.1,1],否则区间设为[0,0.9];第三次摸球可依次类推,其模拟程序如下:a=rand(1000000,3);a(:,1)=round(a(:,1)–0.2);a(:,2)=round(a(:,2)*0.9–0.2–0.1*((a:,1)–1));a(:,3)=round(a(:,3)*0.8–0.2–0.1*(a(:,1)–1)–0.1*(a(:,2)–1));fori=1:6b=a(1:10^i,3);c(i)=sum(b)/(10^i);endcfori=1:6b=(~a(1:10^i,1))&(~a(1:10^i,2))&a(1:10^i,3);d(i)=sum(b)/(10^i);enddfori=1:6b=a(1:10^i,1)&a(1:10^i,2)&a(1:10^i,3);e(i)=sum(b)/(10^i);ende运行结果为上面在理论上计算第三次摸到黑球的概率时,用到了全概率公式:若nAAA,,,21构成一个完备事件组,且事件B的发生总是伴随着事件),,2,1(niAi中的某一个发生而发生,则)|()()(1iniiABPAPBP下面将用到伯努利概型,所谓伯努利概型是指:在相同条件下,进行n次独立重复试验,每次试验只有事件A发生或不发生两种结果,且,)(pAPqpAP1)(这里第三次摸到黑球的四种情况分别是:{白,白,黑},{白,黑,黑},{黑,白,黑},{黑,黑,黑}.这四种情况构成了完备事件组.现考虑下面问题:(1)当不放回时,已知第三次摸到了黑球,问前两次是黑球的概率为多少?(2)若有放回地连续摸10次,则恰有三次摸到黑球的概率是多少?第一问是一逆概率问题,由逆概率公式即贝叶斯公式得到其概率应为0278.03611038192103第二问则属伯努利概型,这里A为{摸到的是黑球},故3.0)(AP,7.0)(AP.于是由二项概率公式有,10次有放回摸球中,恰有三次摸到黑球的概率为2668.07.03.073310C在MATLAB中实现这两个过程的程序如下:a=rand(100000,3);a(:,1)=round(a(:,1)–0.2);a(:,2)=round(a(:,2)*0.9–0.2–0.1*a(:,1)–1));a(:,3)=round(a(:,3)*0.8–0.2–0.1*(a(:,1)–1)–0.1*(a(:,2)–1));fori=1:6b=a(1:10^I,3);c(i)=sum(b);b=a(1:10^i,1)&a(1:10^i,2)&a(1:10^i,3);d(i)=sum(b);e(i)=d(i)./c(i);end这里添加运行结果a=round(rand(1000000,10)–0.2);forI=1:6b=sum(a(1:10^i,:),2)–3;c(i)=sum(-b)/910^I);endc3.2随机变量的分布及其数字特征随机变量的统计行为完全决定于其概率分布,按随机变量的取值不同,通常可将其分为离散型\连续型和奇异型三大类.由于奇异型在实际应用中很少遇到,因此只讨论离散型和连续型两类随机变量的概率分布及其数字特征.3.2.1离散型随机变量的分布及其数字特征如果随机变量X的所有可能取值为有限个或无穷可列个,则称X为离散型随机变量.设X的所有可能值为,,21XX,并且X取这些值的概率为kkpXXP}{,,2,1k则称其为随机变量X的概率分布.它满足下面的性质:(1)0kp,,2,1k,(2)11kkp称xxkkpxF)(为累积概率分布.在研究随机变量时,主要就是研究随机变量的概率分布、累积分布和分布的数字特征。常用的离散型随机变量的分布有:二项分布、泊松分布和超几何分布。1、超几何分布若随机变量X的所有可能取值为0,1,…,n,其概率分布为knkknqpCkXP}{,nk,,2,1,0其中pq1,则称X服从参数为n和p的二项分布,记作),(~pnBX。二项分布的数学期望为npXE)(,方差为npqXD)(。在MATLAB中提供的二项分布的统计函数有:binopdf()、binocdf()、binoinv()、binornd()以及计算二项分布均值和方差的函数binostat(),它们命令格式如下:命令格式:binopdf(X,N,P)功能:计算二项分布的密度函数。其中X为随机变量,N为独立试验的重复数,P为事件发生的概率。命令格式:binocdf(X,N,P)功能:计算二项分布的累积分布函数。其中X为随机变量,N为独立试验的重复数,P为事件发生的概率。命令格式:binoinv(X,N,P)功能:计算二项分布的逆累积分布函数。其中X为随机变量,N为独立试验的重复数,P为事件发生的概率命令格式:binornd(N,P,m,n)功能:产生服从二项分布的nm阶随机矩阵。其中N为独立试验的重复数,P为事件发生的概率,m和n分别是所产生随机矩阵的行数和列数。若不指定m和n,则返回一个随机数;若指定m和n,则返回一个服从二项分布的nm阶随机矩阵。命令格式:binostat(N,P)功能:求二项分布的数学期望与方差。N为独立试验的重复数,P为事件发生的概率。例1x=0:0.1:1binoinv(x,10,1.7)ans=binoinv(x,10,0.3)ans=binoinv(x,50,0.7)ans=binoinv(x,50,0.3)ans=例2生成一个或多个服从二项分布的随机数binornd(10,0.7)ans=6binornd(10,0.7,5,10)ans=这里都需要给出答案例3求二项分布的数学期望(e)和方差(d)[ed]=binostat(10,0.3)e=3d=2.1000[e,d]=binostat(20,0.7)e=14d=4.20002、泊松分布如果随机变量的概率分布为)exp(!}{kkXPk,,2,1,0k其中0为常数,则称X服从参数为的泊松分布,记作)(~PX,泊松分布的
本文标题:概率论基础知识及其在matlab中的实现
链接地址:https://www.777doc.com/doc-2362638 .html