您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学基本术语与常用抽样分布
退出退出()tnt12(,)FnnF2()n2五一四二三退出退出返回0.描述统计学与推断统计学随机现象应如何观测和试验,才能获得有代表性的观测数据?对已取得的观测数据,应如何进行整理、分析,才能通过它们对整体的规律性作出正确的推断和决策?前者由名为描述统计学的数学分支专门研究,后者由名为推断统计学的数学分支专门研究.本章仅对推断统计学的基本知识进行简要介绍.统计学总体X的分布及其数字特征.分布参数在许多时退出返回1.总体与个体随机变量X全部可能取值的集合称为该随机变量的统计学总体,并依然用X加以标记.因此,随机变量X的分布及其数字特征也被称做相应总体X内包含的任一具体取值都称做总体的一个个体.总体所含个体的总数称为总体的容量.容量有限的总体叫有限总体,容量无限的总体叫无限总体.候,都被广泛而形象地命名为“自由度”.12.(,,,)()nnfxxxfx2.样本与简单随机样本设总体X的分布函数为F(x).若随机变量X1,X2,…,Xn随机变量所组成的整体(X1,X2,…,Xn)是取自相应总体X相互独立,而且各自的分布函数也都是F(x),那么就称这n个或取自相应分布F(x)的、容量为n的简单随机样本.在不致造成误解的情况下,总体容量为n的简单随机样本常n个随机变量,已强制性地附加了独立和同分布的含义.被简称为总体容量为n的样本.因此,统计学样本内所保含的由于这一原因,容量为n的样本(X1,X2,…,Xn),作为n维随机变量,其分布函数和概率密度等,都可表为总体分布12,(,,,)()nnFxxxFx退出返回函数和概率密度的乘幂形式,并被称为“似然函数”:3.统计量与统计值若X1,X2,…,Xn构成总体X的一个样本,且该样本的函数g(X1,X2,…,Xn)完全不含总体中的未知分布参数,那么这种完全不含总体未知参数的样本函数就被称作统计量.因为统计量依然是随机变量,所以统计量的具体取值也用与该统计量同名的小写字母表示,而且被称为该统计量的统计值.退出返回退出返回11niiXXn1.样本均值(算术平均量)其中,(X1,X2,…,Xn)是总体X中的容量为n的样本.是该样本的样本均值.()2111niinXXS,2.样本方差与样本标准差2S()21211niiXSXn,SX其中,(X1,X2,…,Xn)是总体X中的容量为n的样本,()22211nniiiiXX=XnX离差平方和简化计算恒等式实践中最常使用的统计量(含统计值)有如下三种:3.样本原点矩与样本中心矩kAkB退出返回11(),1,2,3,nkiikXXBkn其中,(X1,X2,…,Xn)是总体X中容量为n的样本.11,1,2,3,nkikiXkAn离差平方和简化计算恒等式()22211nniiiiXX=XnX实践中最常使用的统计量(含统计值)有如下三种:离差平方和简化计算恒等式的证明()21niiXX证毕.()2212niiiXXXX22212niiXnXnX221niiXnX推论:离差平方的和等于平方的和减去均值平方的等量和()22211nniiiiXX=XnX退出返回例1设Xi~N(μi,σ2),i=1,2,…,10,其中各μi不尽相等.问X1,X2,…,X10是否为简单随机样本?为什么?例2设X1,X2,…,X9是来自正态总体的简单随机样本,且6111,6iiYX9271,3iiYX990307答不是:由于期望值不全等,因而分布不同;而且无法得知彼此间是否独立!识别要点有三:来自同一总体同分布且相互独立若记总体的方差为σ2,那么随机变量12/2YY服从什么分布?分布参数为多少?答服从N(0,1).退出返回例3设X1,X2,…,X100是来自正态总体X的样本.那么,在以下的样本函数中,谁可能不是统计量?max,,,12100(1){}XXXmin,,,12100(2){}XXX10011(3)100iiX1122100100(4)aXaXaX答⑷,理由是其中含有具体大小不明的许多未知参数ai.退出返回1.独立正态量算术平均量的分布2.标准正态量平方和的χ2分布3.标准正态量与之商的t分布4.量与量之商的F分布(基于标准正态量的统计学常用分布)X222退出返回均值不变,方差等于原方差的容量(n)分之一.1.独立正态算术平均量的分布indiXin2~N(,),1,2,,nX~N(),1/0则算术平均量若独立正态量的算术平均量仍是正态量:niiXXn1~1从而n2N(,)X相互独立退出返回(基于标准正态量的统计学常用分布)量是独立标准正态量的平方和.2.分布(独立标准正态量平方和的分布)可以证明自由度().Dn22(),En2相互独立niidXinN(0,1),1,2,,~(~)niiXn22121)若则平方和变量22退出返回(基于标准正态量的统计学常用分布)(基于标准正态量的统计学常用分布)3)分布具有可加性,即若(,)~n2112(,)~n2222且二者相互独立,则~()2221212nn2)还可证明,的密度函数()n2nnxxexfxxn12221,0()2()20,0密度函数的图象是位于第一象限的非对称曲线:n≥3时曲线单峰,峰体前倾;n=1或2时曲线无峰,形如双曲线.2.分布(独立标准正态量平方和的分布)2退出返回并可证明自由度11niiXXn与niiSXXn2121()1相互独立indiXin2N(,),1,2~,,~()()niiXXn2212114)若则平方和变量即()~()nSn22211相互独立(证略).2.分布(独立标准正态量平方和的分布)2退出返回(基于标准正态量的统计学常用分布)3.分布(标准正态量与量方根之商的分布)可以证明自由度().)DTnnn2(2(),ET0相互独立XN(0~,1),~()XtYtnn1)若则商变量t2Yn2~(),二者相互独立,标准正态量与量除以其自由度的平方根的商是变量:2t退出返回(基于标准正态量的统计学常用分布)()()lim()lim()()nnnntftnnn1221212以及()tet2212,因而,当n较大时,其概率密度()()ftt2)还可证明,的概率密度()tnnnnnntftt(1)221()2()(1),()2概率密度的图象与标准正态曲线极其相似3.分布(标准正态量与量方根之商的分布)t2退出返回(基于标准正态量的统计学常用分布)其中自由度niiXnX11,niiSXXn2121()1相互独立indiXin2N(,),1,2~,,3)若则商变量~/()XnStn13.分布(标准正态量与量方根之商的分布)t2退出返回(基于标准正态量的统计学常用分布)的证明显然,且二者相互独立.()~(),22211nSYn所以,依T变量的定义/)(~()11ZTnYnt证毕.01~N(,),/XZn即/~()//1XXntnSSn~/()XnStn1退出返回4.分布(两独立量之商的分布)可以证明()().()())nnnDFnnnn2212212222224(4(()),nEFnn22222相互独立nV,22~()~,()UVnFnnnF11221)若则商变量2FnU21~(),二者相互独立,分子自由度分母自由度两独立量除以各自自由度的商是变量:2F退出返回(基于标准正态量的统计学常用分布)不难看出,若,,~()FnnF12则必有()~,nFnF2112)的概率密度(),Fnn12nnnnnnyyfynnnnynn1112122221212121()()2,0()()()[1()]220,其它概率密度曲线是非对称的单峰曲线,峰体前倾.4.分布(两独立量之商的分布)2F退出返回(基于标准正态量的统计学常用分布)4.分布(两独立量之商的分布)2F※但当二者的方差相同时,即若21222,wXnnSnnYt121212()()~(2),11indjYjn2222N(,),1,~2,,3)若则商变量/,)/(~SnnSF222111222211indiXin1112N(,),1,~2,,分子自由度分母自由度其中则有wnSnSSnn221122221()()112退出返回(基于标准正态量的统计学常用分布)证毕.的证明此外,且二者相互独立,~(,),122221NXYnn所以,依T变量的定义121212N(0,()~1())nnnnXY2111~N(,),Xn12112112()()~(2)wnntYXnSn12112112()()~(2)wnntYXnSn退出返回2222~N(,),Yn21222,211212222112)()()~(SnSnnnt))(~(22211111nSn,~()()22222211nSn,且依分布的可加性,可知二者的和2要使,问正常数α应取什么值?例5总体X~N(0,0.25).X1,X2,…,X10是来自总体的一个样本.而10221~(10)iiX10221~(10),iiX~N(0,1),iYX退出返回问随机变量服从什么分布?例4总体X~N(0,0.32).抽取容量为10的样本X1,X2,…,X10.1021iiYX解~N(0,1),0.3iX10221()~(10).0.3iiX201~N(,()1)iYX解1N(0,).~N(0,0.25),iX10.25,4.退出返回例6试证:若X~t(n),则X2~F(1,n).证∵~()Xtn,∴可设ZXZNYnYn2,~(0,1),~(),/其中Z与Y相互独立.又~()Z,221(标准正态量的平方是χ2量)~()Yn,2∴依F统计量的定义即知/~(,)/.2ZXFnYn211证毕.(两χ2量与各自自由度相除所得的商是F量)退出返回例7若X~t(n)(n1),Y=1/X2,则有().()~()21Yn()~()221Yn()~(,)31YFn()~(,)41YFn030104(3)例8设样本X1,X2,…,Xn来自N(μ,σ2),且940303niiXXn11,niiSXXn22111(),1niiSXXn22211(),niiSXn22311(),1niiSXn22411().那么以下随机变量中服从分布t(n-1)的是().2B./1XSn3C./XSn4D./1XSn1A./1XSnB函数,并且还不难看出:随机变量在α临界值处的FPXxxPXx(){}11{}分布函数值恰好等于1-α,即换言之,α临界值或说α上(侧)分位点是概率α的xC是X所服从分布的α临界值[或说α上(侧)分位点],并将取值C特别地记成的形式;Cx则称实数1.若随机变量X的取值概率PXC{}(01)从而显然有PXx{}(01)退出返回退出返回函数,并且还不难看出:随机变量在α临界值处的FPXxxPXx(){}11{}分布函数值恰好等于1-α,即换言之,α临界值或说α上(侧)分位点是概率α的xxxXXFfudu=PX=xxxPX()(){}1}1{{}xPXO()XfxxxXXFfudu=PX=PXxxx1111()(
本文标题:统计学基本术语与常用抽样分布
链接地址:https://www.777doc.com/doc-420115 .html