您好,欢迎访问三七文档
第二章数理统计的基本知识在概率论中,随机变量的分布列或者分布函数全我们总是假设它们已那么,如何知道随机变量的统计规律呢?即使知道了其分布规律,还需要知道分布中所含的参数.都是数理统计要解决的问题.面描述了随机变量的统计规律.知.引言数理统计概述这些例1如何估计产品的寿命?这是工业产品质量管理中极重要的问题.寿命试验是破坏性试验,少量产品做试验,只能抽取为了评价某批电子设备的使用寿命,随机抽取了17台做试验,测得寿命数据如下(单位:小时):17,29,50,68,100,130,140,270,280,问:整批电子设备中,寿命超过200小时的设备回答该问题需要解决下列问题:占的比例?一、寿命分布类型;二、分布类型中的未知参数.例2在研究某批灯泡的质量时,假如我们关心若把合格品记为0,不合格的仅是其质量是否合格.记为1,那么所有产品由0和1组成.换言之,所有产组成的随机变量X.品可以看作由0和1若令不合格品率为p,显然X是一个分布未知的随机变量.的任务是:对未知参数p进行统计推断或估计.我们数理统计是数学的一个重要分支.它研究怎样有340,410,520,620,190,210,800,1100效地收集整理和分析带有随机性的数据,以对所考察提供依据和建议.若不考虑随机性,则是统计学的研究范围.数理统计学的最基本概念是:量、估计、假设检验、统计决策等.的问题作出推断或预测,直至为采取一定的决策和行总体、样本、统计具体做法:试验以取得信息然后对得到的信息整理、加工、提炼从研究的对象的全体中抽取一部分观测或从而对整体作出推断.由于观察或试验是随机现象,依据有限个观测或试验对整体所作出的推论不可能绝对准确,带有不确定性,我们用概率来表示这种不确定性.概率大,推断就比较可靠;概率小,推断就比较不可靠.这种伴随有一定概率的推断称为统计推断.2.1随机样本2.2.1总体与个体在数理统计中,把研究对象的全体所组成的集合称为总体,把组成总体的每个元素称为个体.然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.所以,体具有的数量指标的全体就是总体.每个成员具有的数量指标就是个体.总体中个体的个数容量为有限的总体称为有限总体.容量每个个称为总体容量.为无限的总体称为无限总体.所以,总体可以看做是某随机变量的取值.随机变量(向量)X,Y,Z,…,等表示总体.通常用随机变量X的分布称为总体的分布.总体X的分布就完全描述了总体中所研究的数量指标的分布情况.2.1.2样本为推断总体分过程称为“抽样”,所抽取的部分个体称为样本,样本由于所研究总体的分布情况未知,布及各种特征,按一定规则从总体中抽取若干个体的中所包含的个体数目称为样本容量.从总体X中抽取的样本常表示为X1,X2,…,Xn.称为取自总体X的容量为n的样本.也可以记为).,,,(21nXXX),,,(21nXXX的取值为),,,,(21nxxx称为样本观测值.了使抽取的样本能很好地反映总体的信息,必须考虑由于抽样的目的是为了对总体进行统计推断,为抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点(定义)2.1定义2.1设X是具有分布函数F的随机变量,若nXXX,,,21是具有同一分布函数F的相互独立的随机变量,则称),,,(21nXXX为从总体X得到的容量为n的简单随机样本,简称样本.样本的联合分布(函数)设总体X的分布函数为F(x),则样本nXXX,,,21的联合分布函数为,)(),,,(121niinnxFxxxF(4.1)称之为样本分布.特别地,若总体X为离散型随机变量,其概率分布为,2,1),()(ixpxXPiixi取遍X所有可能取值,则样本的概率分布为若总体X为连续型随机变量,其密度函数为f(x),则样本的密度函数为.)(),,,(121niinnxfxxxf(2-3)(2-2)),,,(2211nnxXxXxXP.)(1niixp2.1.3统计量本中所含的(某一方面)的信息集中起来.由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,样本的函数能把样定义2.2不含任何未知参数的样本),,,(21nXXX的函数几个常见统计量.),,,(21的一个样本为总体设XXXXn称为样本的统计量.),,,(21nXXXg,1.11niiXnX样本均值212)(11.2niiXXnS样本方差,)(11212niiXnXn.)(1-121niiXXnS样本标准差,2,1,11kXnMnikik3.样本的k阶(原点)矩.2,1,)(11kXXnMnikik4.样本的k中心矩),,,(21nxxx的观测值将),,,(21nXXX代入以上统计量就得相应的统计量的观测值.性质2.1(样本和方差的分布)设X1,X2,…,Xn是取自正态总体的X样本,2SX和分别为样本均值和样本方差,且X期望和方差分别为;)()1(XE则,,2DXEX;)()()2(2nnXDXD.)()()3(22XDSE2.2经验分布与直方图设是取自分布函数为的母体中),,,(21nxxx)(xF的一个简单随机子样的观测值,若把子样观测值由小到,)()2()1(nxxx2.2.1经验分布函数大排列得到)1(x这里是子样观测值),,,(21nxxx中最小的一个,)(ix是子样观测值中第i个小的数等,则下列函数称为经验分布函数是一非减右连续函数,且满足)(xFn,0)(nF1)(nF(子样分布函数).)()1()()1(1,0)(nkknxxxxxnkxxxF当当当1,,2,1nk由此可见,是分布函数,)(xFn称作经验分布函数或显然,对于每一固定的x,)(xFnx是事件它是一个随机变量.当n固定时,由伯努利大数只要n充分大发生的频率,定律,依概率收敛于)(xFn).(xF即对于任意的,00))()((limxFxFPnn2.3抽样分布统计学中泛称统计量的分布为抽样分布.为了使用统计量进行统计推断,通常需要知道统计量的分布,但是一般情况下,要求出抽样分布是相当困难的.下面介绍三种常用的分布.2.3.1三种常用的分布1)分布2设是n个相互独立的随机变量,且nXXX,,,21则称统计量),1,0(~NXi,,,2,1ni22221nXXXX是服从自由度为n的分布,记作2).(~2nX其密度函数为(2-10)0,00,2Γ21)(2122yyeynyfynn(其中表示咖玛函数),)(Γ0,d)(01xexΓx分布密度函数图形)(2n.)(2质分布密度函数的详细性n相互独立,与且若YXnYmX),(~),(~)1(22).(~2nmYX则.2,),(~)2(2nDXnEXnX则若称满足条件xxfnPnnd)()}({)(222(3)分布的上分位点,2,10)(2n的点为分布的上分位点.)(2n2)t分布设若随机变量X与Y相互独立,且有)(~),1,0(~2nYNX则称nYXT为自由度为n的t分布,记作).(~ntTt分布又称学生分布的概率密度函数为)(ntxnxnπnnnxtn,1221);(212氏(Student)分布.t分布的密度函数如下图显然图形是关于t=0对称的,当n充分大时,其图,π21)(lim22xnext.)1,0(,分布相差很大分布与但对于较小的Ntn当n很大时t分布近似标准正态分布N(0,1)形类似于标准正态变量概率密度的图形.因为称满足条件xxfntTPntnd)()}({)(t分布的上分位点,,10)(nt的点为分布的上分位点.)(nt)(~),(~2212nVnU设21nVnUF3)F分布且U与V相互独立,则称统计量服从自由度为(n1,n2)的F分布,记为).,(~21nnFF0001))(()()()(),;(222212xxxxnmxfnmnmnmnmnmnmmF分布的密度函数为称满足条件xxfnnFFPnnFnd)()},({),(2121F分布的上分位点,,10),(21nnF的点为分布的上分位点.),(21nnF由F的定义可见,),(121nnF).,(~12nnF所以F分布的上分位点,有下列性质:),(121nnF),(121nnF2.3.2来自正态总体的常用统计量的分布1)来自单一正态总体的统计量的分布),(2N),(2N2SX和分别为样本均值和样本方差,则有),,(~)1(2nNX)1,0(~NnX即定理2.1设X1,X2,…,Xn是取自正态总体的的样本,);1(~)1()2(222nSn.)4(2相互独立和SX);1(~)3(ntnSX2)来自两个正态总体),(),,(22NN的统计量的分布定理2.2(两总体样本均值与样本方差的分布),,设),(~),(~2221NYNXYX和分别是这两个样本的样本均值,是取自X的样本,是取自Y且X与Y独立,),,,(121nXXX),,,(221nYYY的样本,和21S22S分别是这两个样本的样本方差,则有)1,0(~)()1(22212121NnnYX)1,1(~)2(2122212221nnFSSF时,当22121)3().2(~11)(212121nntnnSYXT.212122212212112SnnnSnnnS其中(证明略)例2.3设在总体中抽取一容量为21的样),(2N本,其中均未知,求2,.7085.122SP解由)1(~)1(222nSn知,).20(~20222S于是7085.122SP7085.1202022SP17.342022SP17.3420122SP.975.0025.01例2.4设是来自总体的样本,),,,(21nXXX)2,0(2N问统计量)(22152122112102221XXXXXXY解因),2,0(~2NXi所以,),1,0(~202NXXii.15,,2,1i所以,221022212XXX).10(~222152122112XXX).5(~2)(22152122112102221XXXXXXY52102221521221122102221XXXXXX).5,10(~F定理2.1-2.2的说明:niiXnX11是正态分布X1,X2,…,Xn的线性组合,所以还是正态分布.niiEXnXE11nin1.1niiDXnXD121ninn1222.1nX是标准化X).1,0(~NnX22)1(Sn212)()1(niiXXSn221)(niiXXniiXX12~).1(2n)1(~)3(ntnSXT)1()1(22nSn)1()1(2nn,22SSnX)1()1(22nSnnXS)1(~ntnSX
本文标题:医学数理统计第2章
链接地址:https://www.777doc.com/doc-3076725 .html