您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 制造加工工艺 > 数学建模——刀具寿命的测定
200实验十二刀具寿命的测定【实验目的】1.了解数理统计中数据描述和分析的基本概念和方法。2.通过对实际数据的分析、统计,初步培养统计推断解决问题的建模思想。3.学习掌握用MATLAB命令进行参数估计、假设检验和统计推断问题的求解。【实验内容】一道工序用自动化车床连续加工某种零件,由于刀具损坏等原因,该工序会出现故障,工序出现故障是完全随机的,假定在生产任一零件时出现故障的机会均相同。工作人员通过检查零件来确定工序是否出现故障。现积累有100次刀具故障记录,故障出现时该刀具完成的零件数如下表:100次刀具故障记录(已完成的零件数)459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851试确定刀具的平均寿命,同时判断该刀具出现故障时完成的零件数属于何种分布。【实验准备】在现代社会中,数据是事物现象的反映,是科学推断的依据,起着至关重要的作用。由于各种随机因素的影响,实验数据往往带有一定的误差,这时需要从数据中分离出随机因素的成分,从而挖掘出事物规律性的成分,以此对所研究总体的性质作出推测性的判断。进行这样的分析建立在收集大量数据的基础之上,称为统计分析。1.概率统计的基本概念总体是人们研究对象的全体,又称为母体,而组成总体的每个单元叫做个体。任何一个总体都可以用一个随机变量来描述它。所以,总体就是一个带有确定概率分布的随机变量,常用X,Y,Z等表示总体。一般情况下,总体的数目非常大,对于总体X分布规律进行研究就必须对总体抽样观察,并分析推断,这种研究过程称为抽样。从总体X中,随机地抽取n个个体1x,2x,…,nx(例如在10000件灯管中抽取100件检查次品数量),这样取得的(1x,2x,…,nx)称为总体X的一个样本容量为n的样本或子样。统计推断就是根据样本来对总体进行分析、推断。通常的作法,依据某种理由或经验来假定总体服从已知形式的概率分布,只要由样本来推断总体概率分布中的若干参数。所以样201本的获取会直接影响统计推断的结果,理想的样本是随机、相互独立且与总体同分布。抽取样本后,我们并不直接利用样本的n个观察值进行推断,需要对这些值进行加工、提炼,把样本中包含的对我们研究推断有用的信息、特征找出来,这便要针对不同问题构造样本的某种函数,这种不带未知参数的样本的函数称为统计量,几个最基本的统计量是:均值(平均值、数学期望):x=n1niix1,反映了样本取值的中心;中位数:将样本1x,2x,…,nx从小到大排序后位于中间位置的那个数;标准差:s=21121)(11nixxn,它是各个样本数据对于均值的偏离程度;方差:标准差的平方;协方差:),cov(yx=11nniiiyyxx1))((,样本相关系数),(yxr=yxssyx),cov(,反映了样本1x,2x,…,nx与样本1y,2y,…,ny的线性相关关系。若|r|接近1,说两样本线性关系密切,若|r|接近0说明两样本取值大小无线性关系。当n足够大时,样本均值和样本标准差结合起来可大致描述数据的分布结构。统计量的概率分布称为抽样分布,最常用的概率分布形式有正态分布、指数分布、2分布、t分布、F分布等。一个随机变量的p分位数px定义为P(<px)=p,0≤p≤1(1)一组样本数据往往是杂乱无章的,可以通过作频数表和直方图的方式,大致描绘出分布密度曲线,并对总体的分布函数作出假设判断。将数据的取值范围划分为若干个小区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取舍为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图(频数分布图)。X是否符合该假设的分布规律,我们通过对分布密度的参数估计的基础上用假充检验来加以验证。2.统计推断方法在统计推断中,总体概率分布的某些参数未知,需要根据样本1x,2x,…,nx估计的值,称为参数估计。参数估计分为两类:点估计和区间估计。点估计就是直接给出的估计值,如“大约等于某个数”,点估计缺乏对估计精度的说明。区间估计给出的估计值区间,并附加一个概率,如“的95%置信区间是[5.2,6.3]”,含意是:在[5.2,6.3]内的概率为0.95。设有总体),(xF,其中参数未知,现有来自),(xF的一个样本1x,2x,…,nx,要估计的值。如有区间CI=[1,2],使得P(1<<2)=1-a(2)称CI为的100(1-a)%置信区间。设为正态总体),(2N,,未知,1x,2x,…,nx为样本,那么,的点估计分别为=x,=s(3)它们的100(1-a)%的置信区间分别为))1(,)1((2121nsntxnsntxaa(4)))1()1(,)1()1((2222212nxsnnxsnaa(5)202许多统计推断常涉及对假设、估计的正确性作出“是”与否的判决,例如产品是否合格,某数学模型是否与现实相符等等。对于总体X分布函数中的参数作出某种假设或估计,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设或估计是否正确,从而决定接受假设或拒绝假设,这就是假设检验。假设检验依问题的性质常分为两大类型:参数检验:如果观测的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验,其目的往往是对总体的参数及有关性质作出明确的判断。非参数检验:如果所检验的假设并非是对某个参数作出明确的判断,因而必须要求构造出的检验统计量的分布函数不依赖观测值的分布函数类型,这种检验叫做非参数检验。如果要判断总体分布类型的检验就是非参数检验。假设检验的一般步骤:(1)根据实际问题提出原假设0H与备择假设1H,即说明需要检验的假设的具体内容;(2)选择适当的统计量,并在原假设0H成立的条件下确定该统计量的分布;(3)按问题的具体要求,选取适当的显著水平a,并根据统计量的分布查表,确定对应于a的临界值,一般a取0.05,0.01,0.10。(4)根据样本观测值计算统计量的观测值,并与临界值进行比较,从而在检验a水平条件下对拒绝或接受原假设0H作出判断。3.MATLAB统计分析工具箱MATLAB统计工具箱中有20多种概率分布,常见的几种分布的命令为:正态分布:norm分布:betaF分布:F指数分布:exp2分布:chi2t分布:t泊松分布:poiss威布尔分布:weib工具箱对于每一种分布提供了五类函数,其命令字符分别为:概率密度:pdf概率分布:cdf逆概率分布:inv均值与方差:stat随机数生成:rnd当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符连接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可。给出数组data的频数表的命令为:[n,X]=hist(data,k);此命令将区间[min(data),max(data)]分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X。参数估计采用下面命令形式:[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)在显著性水平alpha下,求正态分布的数据X的点估计及其区间估计,返回值muhat是X均值的点估计,sigmahat是标准差的点估计,muci是均值的区间估计,sigmaci是标准差的区间估计;[muhat,muci]=expfit(x,alpha)在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计;[lambdahat,lambdaci]=poissfit(X,alpha)在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计;[phat,pci]=betafit(x,alpha)在显著性水平alpha下,求分布的数据X的参数a和b的点估计及其区间估计;[phat,pci]=weibfit(x,alpha)在显著性水平alpha下,求weib分布的数据X的参数a和b的点估计及其区间估计;有关上述命令的详细内容可以查阅MATLAB帮助。203在总体服从正态分布的情况下,可以用以下命令进行假设检验:[h,sig,ci,zval]=ztest(x,m,sigma,alpha,tail)总体方差sigma2已知用z-检验;[h,sig,ci]=ttest(x,m,alpha,tail)总体方差sigma2未知t-检验;[h,sig,ci]=ttest2(x,y,alpha,tail)检验抽样数据x,y的关于均值的某一假设是否成立以上两个命令均是检验数据x的关于均值的某一假设是否成立,其中sigma为已知方差,alpha为显著性水平,究竟检验什么取决于tail的取值;tail=0,检验假设“x的均值等于m”;tail=1,检验假设“x的均值大于m”;tail=-1,检验假设“x的均值小于m”;tail的缺省值为0,alpha的缺省值为0.05;返回值h为一个布尔值,h=1表示可以拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间;查阅MATLAB帮助可以获得上述命令更详细的内容。对于非参数检验,即对总体分布类型的判断,MATLAB工具箱提供了两个检验命令:h=normplot(x)此命令显示数据矩阵x的正态概率图,如果数据是来自于正态分布,则图形显示出直线性形态,而其它概率分布函数显示出曲线形态;h=weibplot(x)此命令显示数据矩阵x的Weibull概率图,如果数据是来自于Weibull分布,则图形显示出直线性形态,而其它概率分布函数显示出曲线形态;有关上述命令的详细内容可以查阅MATLAB帮助。【实验方法与步骤】1.引例问题的分析求解由问题提供的100次刀具故障记录,我们通过作直方图来近似判断刀具寿命所服从的概率分布,首先在MATLAB命令框中录入数据:x1=[459362624542509584433748815505];x2=[612452434982640742565706593680];x3=[9266531644877346084281153593844];x4=[527552513781474388824538862659];x5=[77585975549697515628954771609];x6=[402960885610292837473677358638];x7=[699634555570844166061062484120];x8=[447654564339280246687539790581];x9=[621724531512577496468499544645];x10=[764558378765666763217715310851];x=[x1x2x3x4x5x6x7x8x9x10];接着用以上输入数据作刀具寿命的频数直方图:hist(x,10)从图12.1中我们可以看到,该刀具使用寿命近似服从正态分布(有关各类概率分布密度、函数的图形大家可以查阅概率统计类书籍,这里不一一给出)2040200400600800100012000510152025图12.1刀具寿命频数直方图对于近似推断刀具总体寿命的概率分布形式,我们用MATLAB非参数检验命令来加以验证其总体分布类型,以提供初步结论成立的更加可靠的依据:normplot(x)得到
本文标题:数学建模——刀具寿命的测定
链接地址:https://www.777doc.com/doc-4569378 .html