您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > matlab > Matlab统计工具箱
Matlab中的统计功能StatisticsToolboxinMatlabAppliedStatisticsTopicList1.ProbabilityDistributions(概率分布)2.DisplayingProbabilityDistributionsandRandomSamples(描述性统计)3.StatisticalPlots(统计作图)4.HypothesisTests(假设检验)1.ProbabilityDistributions(概率分布)随机变量的统计行为取决于其概率分布,而分布函数常用连续和离散型分布。Matlab统计工具箱提供20多种分布。每种分布有五类函数,分别为:1:概率密度(pdf);2:累积分布函数(cdf);3:逆累积分布函数(icdf);4:随机数产生器;5:均值和方差函数;以正态分布为例说明这些函数在Matlab里的实现。1.1概率密度函数一般概率密度函数x=[-3:0.5:3];f=normpdf(x,0,1);其中normpdf为正态分布的Matlab分布实现函数,可由可选分布的概率密度函数代替。可选分布的概率密度函数格式:Y=pdf(‘name’,X,A1,A2,A3)说明:‘name’为特定分布的名称,如‘Normal’,’Gamma’等。X为分布函数的自变量X的取值矩阵,而A1,A2,A3分别为相应的分布参数值。Y给出结果,为概率密度值矩阵。举例:p=pdf('Normal',-2:2,0,1)给出标准正态分布在-2到2的分布函数值,而p=pdf('Poisson',0:4,1:5)给出Poisson分布函数。1.2累积分布函数与逆累积分布函数同样地,累积分布和逆累积分布对每个分布都有特定的Matlab实现函数,这里只介绍通用的cdf,icdf。---cdf,icdf功能:计算可选分布的累积分布函数和逆累积分布函数。格式:P=cdf(‘name’,X,A1,A2,A3)X=icdf(‘name’,X,A1,A2,A3)说明:cdf和icdf中的参数使用和pdf中的相同,只是计算结果不同。举例:p=cdf('Normal',0:5,0,1)x=icdf('Normal',0.1:0.2:0.9,0,1)1.3随机数产生器在Matlab里和pdf、cdf与icdf一样,随机数的产生也有通用函数random。功能:产生可选分布的随机数。格式:y=random(‘name’,A1,A2,A3,m,n)说明:random函数产生统计工具箱中任一分布的随机数。‘name’为相应分布的名称。A1,A2,A3为分布参数,意义同pdf参数。m,n确定了结果y的数量,如果分布参数A1,确A2,A3为矢量,则m,n是可选的,但应注意,它们给出的长度或矩阵行列数必须与分布参数的长度相匹配。举例:rn=random('Normal',0,1,2,4)1.4均值和方差和以上其他函数不同的是均值和方差的运算没有通用的函数,只能用各个分布的函数计算。对应于正态分布的计算函数为normstat()。它返回两个参数的向量,分别为均值和方差。举例:[m,n]=normstat(mu,sigma)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn如:设XN(1,3),计算P(X2)如果计算P(2X4),则在Matlab中输入如下语句:具体以下面一个例子说明这些函数在Matlab中如何运用在Matlab中输入如下语句:normcdf(2,1,3)可得计算结果ans=0.6306normcdf(4,1,3)-normcdf(2,1,3)可得计算结果ans=0.2108Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.DisplayingProbabilityDistributionsandRandomSamples(描述性统计)人们希望用少数样本来体现样本总体的规律。描述性统计就是收集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。根据统计量特征性质的不同,工具箱提供了位置度量、散布度量、自助法以及在缺失数据情况下处理方法等方面的描述性统计工具函数。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.1中心位置度量数据样本中心度量的目的在于对数据样本的数据分布线上分布的中心予以定位,即中心位置的度量。均值是对位置的简单和通常的估计量。但野值的存在往往影响位置的确定。而中位数和修正的均值则受野值的干扰很小。中位数是样本的50%分位点。而修正的均值所蕴涵的思想则是剔除样本中昀高值和昀低值来确定样本的中心位置。以下介绍位置度量几个常用的函数。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.1.1平均值(mean)功能:样本数据的平均值。说明:平均值定义为举例:∑==niijjxnx11x=normrnd(0,1,100,5);xbar=mean(x)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.1.2几何平均数(geomean)功能:样本的几何均值。格式:m=geomean(X)说明:几何均值的定义为m=geomean函数计算样本的几何均值。X若为矢量,它返回X中元素的几何均值;X若为矩阵,它的结果为一个行矢量,每个元素为X对应列元素的几何均值。举例:nniix11⎥⎦⎤⎢⎣⎡∏=x=exprnd(1,10,6);geometric=geomean(x)average=mean(x)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.1.3中位数(median)功能:样本数据的中值。说明:中值即数据样本的50%中位数。中位数对野值出现的影响较小。举例:xodd=[1:4,8]modd1=median(xodd)modd2=mean(xodd)结果?33.6Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.2散布度量散布度量可以理解为样本中的数据偏离其数值中心的程度,也称离差。极差,定义为样本昀大观测值与昀小观测值之差。标准差和方差为常用的散布度量,对正态分布的样本描述是昀优的。但抗野值干扰能力较小。平均绝对值偏差对野值也敏感。四分位数间距为随机变量的上四分位数和下四分位之差。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cnMatlab里有关散布度量计算的函数在Matlab里,有关散布度量计算的函数为:1:计算样本的内四分位数间距的iqr(x)。2:求样本数据的平均绝对偏差的mad(x)。3:计算样本极差的range(x)。4:计算样本方差的var(x,w)。5:求样本的标准差的std(x)。6:求协方差矩阵的cov(x)。这些函数的详细说明可以参见Matlab的帮助文档。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.3中心矩中心矩是关于数学期望的矩。对于任意的r,称为随机变量x的r阶中心矩。一阶中心矩为0,二阶中心矩为方差:函数moment计算任意阶中心矩。格式:m=moment(x,order)说明:order确定阶。()rrExExυ=−DX=2υZhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn2.4相关系数相关系数是两个随机变量间线性相依程度的度量。可用函数corrcoef计算它。格式:R=corrcoef(x)说明:输入矩阵x的行元素为观测值,列元素为变量,R=corrcoef(x)返回相关系数矩阵R。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.StatisticalPlots(统计作图)统计工具箱在Matlab丰富的绘图功能上又添加了图形表现函数:BoxPlots(box图)用于展现样本及其统计量的内在规律,也用于通过图形来比较多个样本的均值。DistributionPlots(概率图)用于展现样本的分布情况。ScatterPlots(散点图)以下介绍在统计中几种常用的作图函数的用法。Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.1盒形图(boxplot)如有如下数据:x=[normrnd(4,1,1,100)normrnd(6,0.5,1,200)];均值标准差1x100矩阵在Matlab中输入如下语句:x=[normrnd(4,1,1,100)normrnd(6,0.5,1,200)];boxplot(x)可得下图(见下页)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn盒形图(boxplot)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.2DistributionPlots(分布图)卡方分布f分布标准正态分布t分布(与标准正态分布比较)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.2.1卡方分布在Matlab中输入:x=0:0.2:15;y=chi2pdf(x,4);plot(x,y)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.2.2f分布在Matlab中输入:x=0:0.01:10;y=fpdf(x,5,3);plot(x,y)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.2.3标准正态分布在Matlab中输入:x=-5:0.01:5;y=normpdf(x,0,1);plot(x,y)Zhisheng(James)Zhang,SchoolofMechanicalEngineering,SoutheastUniversity,oldbc@seu.edu.cn3.2.4t分布(与标准正态分布比较)在Matlab中输入:x=-5:0.1:5y=tp
本文标题:Matlab统计工具箱
链接地址:https://www.777doc.com/doc-7028214 .html