您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 数学建模实验报告数据的统计分析
wilyes11收集博客(与学习无关):数据的统计分析一、实验目的及意义本实验旨在通过对一些常见分布的概率计算和概率密度函数、分布函数曲线的直观认识、对数据分布的形态猜测、对某些概率分布的密度函数的参数估计(以正态为例)以及进行简单的正态假设检验,来揭示生活中的随机数据的一些统计规律.二、实验内容1.常见的分布的概率计算、密度函数、分布函数及其图形;2.参数估计;3.正态假设检验。三、实验步骤1.开启软件平台——MATLAB,开启MATLAB编辑窗口;2.根据求解步骤编写M文件3.保存文件并运行;4.观察运行结果(数值或图形);5.根据观察到的结果和体会写出实验报告。四、实验要求与任务根据实验内容和步骤,完成以下实验,要求写出实验报告。1.某人向空中抛硬币100次,落下为正面的概率为0.5,设这100次中出现正面向上的次数为X,试分别计算X=45和X≤45的概率,并画出分布函数的图形.(用到的matlab函数:binopdf,binocdf)2.设2(2,)XN,用MATLAB编程计算:(1)当0.5时,求(1.82.9),(3),(21.5)PXPXPX;(2)若(1.8)0.25,PXxx求;(3)分别绘制0.2,0.5,0.9时的概率密度函数图形.(用到的matlab函数:norminv,normpdf,normcdf)3.随机产生1000个服从参数为100的指数分布的样本数据,画出直方图,并求参数的估计值和置信水平为99%的置信区间.(用到的matlab函数:hist,exprnd,expfit)4.已知数据如下表X234578111415161819Y106.42108.2109.58110109.93110.49110.59110.6110.9110.76111111.2试建立Y与X之间的函数关系,并检验残差r是否服从均值为0的正态分布.(用到的matlab函数:polyfit,polyval,normplot或ttest或lillietest)五.程序代码及运行结果(经调试后正确的源程序)1.某人向空中抛硬币100次,落下为正面的概率为0.5,设这100次中出现正面向上的次数为X,试分别计算X=45和X≤45的概率,并画出分布函数的图形.(用到的matlab函数:binopdf,binocdf)程序代码:(prog1.m)x=0:100;y=binopdf(x,100,0.5);p1=binopdf(45,100,0.5);p2=binocdf(45,100,0.5);disp(['P(X=45)=',num2str(p1)])disp(['P(X≤45)=',num2str(p2)])plot(x,y,'b-','LineWidth',2);title('X~b(100,0.5)');holdonplot(45,p1,'go','MarkerEdgeColor','k','LineWidth',2,'MarkerFaceColor','g','MarkerSize',8)str1='P(X=45)=';str2=num2str(p1);str=strcat(str1,str2);text(10,0.05,str);str1='P(X≤45)=';str2=num2str(p2);str=strcat(str1,str2);text(10,0.04,str);运行结果:P(X=45)=0.048474P(X≤45)=0.1841010203040506070809010000.010.020.030.040.050.060.070.08X~b(100,0.5)P(X=45)=0.048474P(X≤45)=0.18412.设2(2,)XN,用MATLAB编程计算:(1)当0.5时,求(1.82.9),(3),(21.5)PXPXPX;(2)若(1.8)0.25,PXxx求;(3)分别绘制0.2,0.5,0.9时的概率密度函数图形.(用到的matlab函数:norminv,normpdf,normcdf)程序代码:(prog2.m)fprintf('(1)\nX~N(2,0.25)\n')p1=normcdf(2.9,2,0.5)-normcdf(1.8,2,0.5);p2=1-normcdf(-3,2,0.5);p3=1-normcdf(3.5,2,0.5)+normcdf(0.5,2,0.5);disp(['P(1.8<X<2.9)=',num2str(p1)])disp(['P(X>-3)=',num2str(p2)])disp(['P(|X-2|>1.5)=',num2str(p3)])fprintf('(2)\nX~N(2,0.25)\n')x=norminv(normcdf(1.8,2,0.5)+0.25,2,0.5);disp(['P(1.8<X<x)=2.5,x=',num2str(x)])fprintf('(3)如图')x=0:0.05:4;y1=normpdf(x,2,0.2);y2=normpdf(x,2,0.5);y3=normpdf(x,2,0.9);holdonplot(x,y1,'b-',x,y2,'r-',x,y3,'g-','LineWidth',2);legend('σ=0.2','σ=0.5','σ=0.9');运行结果:(1)X~N(2,0.25)P(1.8<X<2.9)=0.61949P(X>-3)=1P(|X-2|>1.5)=0.0026998(2)X~N(2,0.25)P(1.8<X<x)=2.5,x=2.1197(3)如图00.511.522.533.5400.20.40.60.811.21.41.61.82σ=0.2σ=0.5σ=0.93.随机产生1000个服从参数为100的指数分布的样本数据,画出直方图,并求参数的估计值和置信水平为99%的置信区间.(用到的matlab函数:hist,exprnd,expfit)程序代码:(prog3.m)x=exprnd(100,1,1000);[a,b]=expfit(x,0.01);disp(['估计值λ=',num2str(a)])disp(['λ的置信水平为99%的置信区间为:[',num2str(b(1)),',',num2str(b(2)),']'])hist(x,20)title('参数为100的指数分布-1000个随机数直方图')运行结果:估计值λ=101.3767λ的置信水平为99%的置信区间为:[93.3096,109.8247]0100200300400500600700800900050100150200250300350参数为100的指数分布-1000个随机数直方图4.已知数据如下表X234578111415161819Y106.42108.2109.58110109.93110.49110.59110.6110.9110.76111111.2试建立Y与X之间的函数关系,并检验残差r是否服从均值为0的正态分布.(用到的matlab函数:polyfit,polyval,normplot或ttest或lillietest)程序代码:(prog4.m)X=[2,3,4,5,7,8,11,14,15,16,18,19];Y=[106.42,108.2,109.58,110,109.93,110.49,110.59,110.6,110.9,110.76,111,111.2];p=polyfit(X,Y,3);fprintf('Y=(%dX^3)+(%dX^2)+(%dX)+(%d)\n',p(1),p(2),p(3),p(4))h=ttest(mean(Y)-Y,0,0.05);fprintf('H0:残差r服从均值为0的正态分布\nH1:残差r不服从均值为0的正态分布\n')ifh==0fprintf('经过检验,不拒绝H0假设,残差r服从均值为0的正态分布')elsefprintf('经过检验,拒绝H0假设,残差r不服从均值为0的正态分布')endy1=polyval(p,X);plot(X,Y,'k*');holdon;plot(X,y1,'r-','LineWidth',2);title('X-Y函数关系曲线');运行结果:H0:残差r服从均值为0的正态分布H1:残差r不服从均值为0的正态分布经过检验,不拒绝H0假设,残差r服从均值为0的正态分布2468101214161820106107108109110111112X-Y函数关系曲线六.实验总结本实验通过对一些常见分布的概率计算以及概率密度函数、分布函数曲线的绘制,使我们更加直观认识到数据的统计分析的重要。其中通过对数据分布的形态猜测、对某些概率分布的密度函数的参数估计以及进行简单的正态假设检验,来揭示生活中的随机数据的一些统计规律。同时在实验中还通过对数据集的简单处理,我们可以基本确定数据集是否符合某些特殊的分布,从而就可以用点估计,区间估计等方法来确定这个分布的参数。学生签名:七.教师评语及成绩教师签名:年月日年月日
本文标题:数学建模实验报告数据的统计分析
链接地址:https://www.777doc.com/doc-2426888 .html