您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 专题二数据的统计分析
Lxy,ChinaJiliangUniversty数学建模专题二数据的统计分析数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。本专题的主要目的是:熟悉各种常见分布的概率密度函数及其曲线,会利用数据分布的形态猜测其分布类型;能够对密度函数进行参数估计;进行简单的正态假设检验。引言数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty内容提纲1.Matlab相关命令介绍2.常见概率分布3.频数直方图与频数表4.参数估计5.假设检验数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)基本统计量数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty偏度和峰度的说明表示分布形状的统计量—偏度和峰度偏度:niiXXsg1331)(1峰度:niiXXsg1442)(1偏度反映分布的对称性,g10称为右偏态,此时数据位于均值右边的比位于左边的多;g10称为左偏态,情况相反;而g1接近0则可认为分布是对称的.峰度是分布形状的另一种度量,正态分布的峰度为3,若g2比3大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一.数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍pdf概率密度函数y=pdf(name,x,A)y=pdf(name,x,A,B)或y=pdf(name,x,A,B,C)返回由name指定的单参数分布的概率密度,x为样本数据name用来指定分布类型,其取值可以是:'beta'、'bino'、'chi2'、'exp'、'ev'、'f'、'gam'、'gev'、'gp'、'geo'、'hyge'、'logn'、'nbin'、'ncf'、'nct'、'ncx2'、'norm'、'poiss'、'rayl'、't'、'unif'、'unid'、'wbl'。返回由name指定的双参数或三参数分布的概率密度数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍例:x=-8:0.1:8;y=pdf('norm',x,0,1);y1=pdf('norm',x,1,2);plot(x,y,x,y1,':')注:y=pdf('norm',x,0,1)y=normpdf(x,0,1)相类似地,y=pdf('beta',x,A,B)y=betapdf(x,A,B)y=pdf('bino,x,N,p)y=binopdf(x,N,p)…………数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍normfit正态分布中的参数估计[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)对样本数据x进行参数估计,并计算置信度为1-alpha的置信区间alpha可以省略,缺省值为0.05,即置信度为95%hist绘制给定数据的直方图hist(x,m)数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍table=tabulate(x)绘制频数表,返回值table中,第一列为x的值,第二列为该值出现的次数,最后一列包含每个值的百分比。ttest(x,m,alpha)假设检验函数。此函数对样本数据x进行显著性水平为alpha的t假设检验,以检验正态分布样本x(标准差未知)的均值是否为m。数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty总体方差sigma2未知时,总体均值的检验使用t-检验[h,sig,ci]=ttest(x,m,alpha,tail)检验数据x的关于均值的某一假设是否成立,其中alpha为显著性水平,究竟检验什么假设取决于tail的取值:tail=0,检验假设“x的均值等于m”tail=1,检验假设“x的均值大于m”tail=-1,检验假设“x的均值小于m”tail的缺省值为0,alpha的缺省值为0.05.返回值h为一个布尔值,h=1表示可以拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间.ttest说明数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty例Matlab统计工具箱中的数据文件gas.mat.中提供了美国1993年一月份和二月份的汽油平均价格(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差未知,试检验一月份油价的均值是否等于115.解作假设:m=115.首先取出数据,用以下命令:loadgas然后用以下命令检验[h,sig,ci]=ttest(price2,115)返回:h=1,sig=4.9517e-004,ci=[116.8120.2].检验结果:1.布尔变量h=1,表示拒绝零假设.说明提出的假设油价均值115是不合理的.2.95%的置信区间为[116.8120.2],它不包括115,故不能接受假设.3.sig-值为4.9517e-004,远小于0.5,不能接受零假设.ttest举例数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍normplot(x)统计绘图函数,进行正态分布检验。研究表明:如果数据是来自一个正态分布,则该线为一直线形态;如果它是来自其他分布,则为曲线形态。wblplot(x)统计绘图函数,进行Weibull分布检验。数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyMatlab相关命令介绍其它函数cdf系列函数:累积分布函数rnd系列函数:随机数发生函数stat系列函数:均值与方差函数例:p=normcdf(-2:2,0,1)n=normrnd(0,1,[15])例:计算标准正态分布的概率P{-1X1}.命令为:P=normcdf(1)-normcdf(-1)结果为:P=0.6827数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty常见的概率分布二项式分布Binomialbino卡方分布Chisquarechi2指数分布ExponentialexpF分布Ff几何分布Geometricgeo正态分布Normalnorm泊松分布PoissonpoissT分布Tt均匀分布Uniformunif离散均匀分布DiscreteUniformunid数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty连续分布:正态分布正态分布(连续分布)如果随机变量X的密度函数为:22X2e()2(1)fx0,x则称X服从正态分布。记做:2~(,)XN标准正态分布:N(0,1)正态分布也称高斯分布,是概率论中最重要的一个分布。如果一个变量是大量微小、独立的随机因素的叠加,那么它一定满足正态分布。如测量误差、产品质量、月降雨量等数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty正态分布举例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,':')例:标准正态分布和非标准正态分布密度函数图形-8-6-4-20246800.050.10.150.20.250.30.350.4数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty连续分布:均匀分布均匀分布(连续分布)如果随机变量X的密度函数为:则称X服从均匀分布。记做:~[,]XUab均匀分布在实际中经常使用,譬如一个半径为r的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置X是服从[0,2r]上的均匀分布。1)0,(,axbfxba其他数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty连续分布:指数分布指数分布(连续分布)如果随机变量X的密度函数为:则称X服从参数为的指数分布。记做:~Exp()X在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布。如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常常假定服从指数分布。,00,0()xfxexx0指数分布具有无记忆性:{|}{}PXstXsPXt数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty指数分布举例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:=4时的指数分布密度函数图数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty离散分布:几何分布几何分布是一种常见的离散分布在贝努里实验中,每次试验成功的概率为p,设试验进行到第次才出现成功,则的分布满足:其右端项是几何级数的一般项,于是人们称它为几何分布。11kkpq1()1,2,kpqPkkx=0:30;y=geopdf(x,0.5);plot(x,y)例:p=0.5时的几何分布密度函数图数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty离散分布:二项式分布二项式分布属于离散分布如果随机变量X的分布列为:则称这种分布为二项式分布。记做:~(,)Xbnp(1()0,1,,)knknppPXkkknx=0:50;y=binopdf(x,500,0.05);plot(x,y)例:n=500,p=0.05时的二项式分布密度函数图数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty离散分布:Poisson分布泊松分布也属于离散分布,是1837年由发个数学家Poisson首次提出,其概率分布列为:记做:~()XP!()0,1,2,,0kPekkXk泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系。如:单位时间内,电话总机接到用户呼唤次数;1平方米内,玻璃上的气泡数等。数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniverstyPoisson分布举例x=0:50;y=poisspdf(x,25);plot(x,y)例:=25时的泊松分布密度函数图数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty离散分布:均匀分布如果随机变量X的分布列为:21()1,,,PXkknn则称这种分布为离散均匀分布。记做:~[1,2,,]XUnn=20;x=1:n;y=unidpdf(x,n);plot(x,y,'o-')例:n=20时的离散均匀分布密度函数图数学建模专题二-数据的统计分析Lxy,ChinaJiliangUniversty抽样分布:2分布设随机变量X1,X2,…,Xn相互独立,且同服从正态分布N(0,1),则称随机变量n2=X12+X22+…+Xn2服从自由度为n的2分布,记作,亦称随机变量n2为2变量。22~()nnx=0:0.1:20;y=chi2pdf(x,4);plot(x,y)例:n=
本文标题:专题二数据的统计分析
链接地址:https://www.777doc.com/doc-2778131 .html