您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > Matlab笔记数值计算—概率篇017
17.数值计算—概率篇一、计算组合数、排列数!n——factorial(n)或prod(1:n)knC——nchoosek(n,k)knA——factorial(n)/factorial(n-k)二、生成随机数1.rand(m,n)——生成m×n的服从[0,1]上均匀分布的随机数;用a+(b-a).*rand(m,n)生成m×n的服从[a,b]上均匀分布的随机数。2.二项分布与正态分布随机数binornd(N,P,m,n)——生成m×n的服从二项分布B(N,P)的随机数;normrnd(MU,SIGMA,m,n)——生成m×n的服从正态分布N(MU,SIGMA2)的随机数;3.通用格式:分布缩写+rnd(分布参数,m,n)或random(‘分布名或缩写’,分布参数,m,n)可以用来生成m×n该分布的随机数。各种分布名见下图:表1一维随机变量概率分布名称表分布缩写、分布名称函数说明'beta'或'Beta'Beta分布'bino'或'Binomial'二项分布'chi2'或'Chisquare'卡方分布'exp'或'Exponential'指数分布'f'或'F'F分布'gam'或'Gamma'GAMMA分布'geo'或'Geometric'几何分布'hyge'或'Hypergeometric'超几何分布'logn'或'Lognormal'对数正态分布'nbin'或'NegativeBinomial'负二项式分布'ncf'或'NoncentralF'非中心F分布'nct'或'Noncentralt'非中心t分布'ncx2'或'NoncentralChi-square'非中心卡方分布'norm'或'Normal'正态分布'poiss'或'Poisson'泊松分布'rayl'或'Rayleigh'瑞利分布't'或'T'T分布'unif'或'Uniform'均匀分布'unid'或'DiscreteUniform'离散均匀分布'weib'或'Weibull'威布尔分布4.使用randsample和randsrc函数生成指定离散分布随机数X=randsample(N,k,replace,w)N相当于[1:N],也可以是具有确定值的向量;k表示生成k个随机数;replace=’true’表示可重复,或’false’表示不可重复(默认);w是权重向量。X=randsrc(m,n,[x;p])生成m×n的随机矩阵,服从取值为向量x,对应概率为向量p的离散分布。例1设离散型随机变量X服从如下分布:X-2-1012P0.050.20.50.20.05生成服从3×5的该分布的随机数。代码:xvalue=[-2-1012];xp=[0.050.20.50.20.05];%调用randsample函数生成100个服从指定离散分布的随机数x=randsample(xvalue,15,true,xp);reshape(x,[35])%调用randsrc函数生成10*10的服从指定离散分布的随机数矩阵y=randsrc(3,5,[xvalue;xp])运行结果:ans=00100000-1-111001y=-1-111-1-10020-10-1005.已知概率密度函数,生成服从该分布的随机数例2设随机变量X的概率密度函数为(抛物线分布):6(1),01()0,xxxfx其他调用crnd函数(来自《MATLAB统计分析与应用40个案例分析》作者:谢中华),生成3×5个服从该分布的随机数。代码:pdffun='6*x*(1-x)';%密度函数表达式x=crnd(pdffun,[01],3,5)运行结果:x=0.31600.68660.27240.28160.12680.26810.84390.19480.79990.53830.73770.20400.49320.19480.69096.生成多元分布的随机数mrnd(N,P,m)——多项分布,P为概率向量;mvnrnd(mu,sigma,m)——多元正态分布,mu,sigma为n元向量;mvtrnd(C,df,m)——多元t分布;wishrnd(sigma,df,m)——Wishart分布;iwishrnd(sigma,df,m)——逆Wishart分布;例3利用mvnrnd函数生成3组的二元正态分布随机数,其中分布的参数为1013==20316,代码:mu=[1020];sigma=[13;316];xy=mvnrnd(mu,sigma,3)运行结果:xy=11.833625.73859.034717.80269.603019.5821三、随机变量的概率密度函数及其图像概率密度函数,描述随机变量X在点x附近取值的可能性。1.通用格式:pdf(‘分布名或缩写’,x,分布参数)——返回该分布在X=x处的概率密度值;例如,Pk=pdf('bino',3,10,0.4)2.专用函数分布名缩写+pdf(x,分布参数)例如,binopdf(k,n,p)例4绘制卡方分布密度函数在自由度分别为1、5、15的图形。代码:x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,':')holdony2=chi2pdf(x,3);plot(x,y2,'+')y3=chi2pdf(x,10);plot(x,y3,'o')axis([0,30,0,0.2])运行结果:四、随机变量的分布函数分布函数定义为:F(x)=P{X≤x},表示随机变量X的取值落在(-∞,x)范围内的概率。引入分布函数的目的,就是可以计算随机变量X的取值落在任意区间内的概率,例如,P{aX≤b}=F(b)-F(a)1.通用格式:cdf(‘分布名或缩写’,x,分布参数)——返回该分布的分布函数;例如,Pk=cdf('bino',3,10,0.4)2.专用函数分布名缩写+cdf(x,分布参数)例如,binocdf(k,n,p)05101520253000.020.040.060.080.10.120.140.160.180.2五、逆分布函数已知F(x)=P{X≤x}的值,求x点。1.通用格式:icdf(‘分布名或缩写’,p,分布参数)——返回该分布的分布函数F(x)=P{X≤x}=p的x值;例如,Pk=icdf('bino',3,10,0.4)2.专用函数分布名缩写+inv(p,分布参数)例如,binoinv(p,N,P)3.分位数N(0,1)的上α分位数:P{Xuα}=α,故uα=norminv(1-α,0,1)其它分布的上分位数也是类似的。N(0,1)的双侧α分位数:P{|X|uα/2}=α,故uα/2=norminv(1-α/2,0,1)注意:-uα/2=u1-α/2(-uα/2右侧的面积为1-α/2),其它对称分布也成立,例如,t1-α(n)=-tα(n).六、随机变量的数字特征注:若要X中除NaN(非数)之外的数进行操作,加前缀nan,例如nanmean(X).1.几种平均(1)算术平均值(样本均值)适用于性质相同、单峰,且近似服从正态分布的定量数据;代码:mean(X)(若X为矩阵,返回每列的均值)(2)中位数代码:median(X)(3)几何平均值11nniiGx适用于对比率数据的平均,并主要用于计算数据平均增长(变化)率;服从正偏态分布(较长右尾),特别是对数正态分布数据(取对数变换后服从正态分布)。代码:geomean(X)(4)调和平均值11niinHx即先取倒数,再取算术平均值,再取倒数回来。例如前半段时速60公里,后半段时速30公里(两段距离相等),则其平均速度为两者的调和平均数时速40公里。在实际中,往往由于缺乏总体单位数的资料而不能直接计算算术平均数,这时需用调和平均法来求得平均数。代码:harmmean(X)(5)众数出现次数最多的数,代码:mode(X)2.期望和方差(1)样本数据mean(X)——样本均值11niixxnvar(X)或var(X,0)——样本方差2211=()1niiSxxnvar(X,1)——方差211()niiDxxnstd(X)或std(X,0)——样本标准差Sstd(X,1)——标准差D(2)常见分布的期望和方差通用格式:[E,D]=分布名缩写+stat(分布参数)返回E为期望,D为方差;例如,[E,D]=normstat(MU,SIGMA)(3)已知离散型随机变量的分布律,求期望和方差例5设离散型随机变量X服从如下分布:X-2-1012P0.30.10.20.10.3求E(X),E(X2-1),D(X).代码:X=[-2-1012];p=[0.30.10.20.10.3];EX=sum(X.*p)%或EX=X*p’Y=X.^2-1;EY=sum(Y.*p)XX=X.^2;EXX=sum(XX.*p);DX=EXX-EX^2运行结果:EX=0EY=1.6000DX=2.60003.极差、偏度、峰度极差,数据的最大值与最小值之差。代码:range(X)偏度,是数据关于均值不对称的指标。若偏度为负,说明均值左边的数据比右边的数据更散;若偏度为正,说明均值右边的数据比左边的数据更散,正态分布的偏度为0.代码:skewness(X)峰度,是用来反映数据的分布曲线顶端尖峭或扁平程度的指标。代码:kurtosis(X)4.矩k阶中心矩——m=moment(X,k)k阶原点矩——可以使用下面自编的OriginMoment.mfunctiony=OriginMoment(X,k);%X为样本矩阵[n,m]=size(X);y=zeros(1,m);forii=1:m;y(ii)=sum(X(:,ii).^k)/n;end5.协方差(矩阵)、相关系数(矩阵)对于样本数据矩阵:11121212221212nnnmmmnmnxxxxxxXXXXxxxMatlab将矩阵X的每一列Xj,j=1,…,n作为一个随机变量的样本,每一行[xj1,xj2,…,xjn],j=1,2,...,m作为n个随机变量的联合分布的一个样本。由于矩阵X给出的只是随机变量的样本数据,并不知道这些随机变量的(联合)概率分布,因此是不能计算出这些随机变量的总体期望、方差或协方差的,而只能计算出它们的一个无偏估计,即样本均值、样本方差与样本协方差。样本协方差公式:11(,)()()1niiiCOVXYxxyyn111212122212nnnnnnnnccccccccc,其中(,)ijijcCOVXX称为随机变量X1,…,Xn的协方差矩阵(实对称、非负定)。协方差矩阵是一维随机变量方差、二维随机向量协方差向高维随机向量的推广,常应用于在主成分分析中。相关系数(矩阵)是协方差(矩阵)的标准化,反映了随机变量两两之间的线性关系的强弱程度。代码:cov(X)——返回样本矩阵X的协方差矩阵;corrcoef(X)——返回样本矩阵X的相关系数矩阵;例6随机生成样本数据矩阵X,计算X的协方差矩阵、相关系数矩阵。代码:M=5;N=3;X=10.*rand(M,N)CovX=cov(X)Cov12=cov(X(:,1),X(:,2))Cov11=cov(X(:,1),X(:,1))var(X(:,1))RhoX=corrcoef(X)运行结果:X=1.06658.68694.31419.61900.84449.10650.04633.99781.81857.74912.59872.63808.17308.00071.4554CovX=19.6061-6.38125.3900-6.381211.6214-5.58945.3900-5.58949.7937Cov12=19.6061-6.3812-6.381211.6214Cov11=19.606119.606119.606119.6061VarX1=19.6061RhoX=1.0000-0.42270.3890-0.42271.0000-
本文标题:Matlab笔记数值计算—概率篇017
链接地址:https://www.777doc.com/doc-2887713 .html