您好,欢迎访问三七文档
Ch5抽样与抽样分布统计学原理§5.1随机抽样(new)§5.2随机变量的分布(new)§5.3抽样分布(new)§5.4抽样方法与抽样误差(new)主要介绍:随机抽样,随机变量的分布,抽样分布,抽样方法与抽样误差。Ch5主要内容•Ch5抽样与抽样分布•§5.1随机抽样(new)•§5.2随机变量的分布(new)•§5.3抽样分布(new)•§5.4抽样方法与抽样误差(new)Ch5学习目的1,掌握随机抽样及其性质2,掌握抽样方法与抽样误差的关系•Ch5抽样与抽样分布•§5.1随机抽样(new)•§5.2随机变量的分布(new)•§5.3抽样分布(new)•§5.4抽样方法与抽样误差(new)Ch5抽样与抽样分布统计学原理§5.1随机抽样(new)§5.2随机变量的分布(new)§5.3抽样分布(new)§5.4抽样方法与抽样误差(new)§5.1随机抽样§5.1.1现象的随机化§5.1.2样本空间、事件、概率、分布函数§5.1.3随机抽样§5.1.4样本统计量•Ch5抽样与抽样分布•§5.1随机抽样(new)•§5.2随机变量的分布(new)•§5.3抽样分布(new)•§5.4抽样方法与抽样误差(new)返回■在前面的几章里,我们用统计整理和统计描述的方法,研究了现象总体的数量特征和数量关系,比如计算总体平均数、总体的标准差、总体的方差和总体的分布,通过对这些指标的计算,我们得到了研究现象的规律性认识。■我们亦可以用同样的方法,去研究样本的平均数、样本的标准差、样本的方差和样本分布,并且还可以利用样本的平均数、样本的标准差、样本的方差和样本分布,去反推总体的数量特征和数量关系,从而得到现象总体规律性的认识。■用样本的资料去估计总体的方法,就是抽样估计。§5.1.1现象的随机化•Ch5抽样与抽样分布•§5.1随机抽样(new)■探索客观规律的过程§5.1.1现象的随机化•Ch5抽样与抽样分布•§5.1随机抽样(new)随机理论总体内在的数量规律性,F(x;)统计整理和统计描述总体数据样本数据图5-1探索客观规律的统计过程抽样估计和统计推断反映客观现象的统计数据样本数据■抽样估计是一种比较经济的估计方法。它的特点是利用随机抽样的理论,用比较少的数据及比较小的误差去达到处理大量数据的目标,从而得到现象总体规律性的认识。它是一种数据处理的优化方法■为保证抽样理论的完整性和科学性,从这一节开始,我们将对所研究的现象进行随机化处理,即用概率的理论去研究现象的规律性。■§5.1.1现象的随机化•Ch5抽样与抽样分布•§5.1随机抽样(new)§5.1.1现象的随机化■抽样估计的过程•Ch5抽样与抽样分布•§5.1随机抽样(new)图5-1探索客观规律的统计过程ˆ可靠性总体分布函数F(x;)样本数据X样本统计量样本分布函数F(X;)随机样本可靠性总体参数样本参数ˆ抽样分布F()ˆE(X)=E(x)=D(x)=2D(X)=S2ˆˆD()E()=|-|ˆX■数据变量的规律。■样本数据样本变量的规律F(X;)。■总体数据总体变量的规律F(x;)。■样本统计量数据样本统计量的规律F((X))。■样本分布函数及样本统计量(样本参数)的计算方法。■总体分布函数及总体参数的计算方法。■样本统计量分布函数及样本统计量参数的计算方法。■表5-1是现象随机化一揽表。§5.1.1现象的随机化•Ch5抽样与抽样分布•§5.1随机抽样(new)ˆˆ§5.1.1现象的随机化数理统计概率统计数学表示客观现象试验抽样试验试验的结果、样本组成单位、个体基本事件、样本点、元素i;i=1,2,3,…,N。样本的所有可能结果、样本空间S、总体基本事件全集S={i;i=1,2,3,…,N。}。频率、事件A在S中出现的频率、fn(A)=n/N概率、事件A在S中出现的可能性、Pro(A|S)=Pro{A()|S}数据X变量XX事件A量化为数据X、样本数据X(A)随机变量X(A)X(A)←A={i;i=1,2,3,…,n。nN}事件S量化为数据X、总体数据X(S)随机变量X(S)X(S)←S={i;i=1,2,3,…,N。}基本事件i量化为数据Xii→Xi()如果i=1,2,3,…,n。则Xi()表示样本数据,X={Xi();i=1,2,3,..,n};如果i=1,2,3,..,N。则Xi()表示总体数据,x={Xi();i=1,2,3,..,N}。X,xR统计分布概率分布总体F(x;);样本F(X;)特征指标分布参数总体特征指标总体分布参数样本特征指标样本统计量、分布参数变量(X)•Ch5抽样与抽样分布•§5.1随机抽样(new)表5-1现象随机化一揽表ˆˆ返回§5.1.2样本空间、事件、概率、分布函数•Ch5抽样与抽样分布•§5.1随机抽样(new)随机现象在个别试验中其结果呈现不确定性;在大量的重复试验中其结果又具有规律性的现象,我们称为随机现象。比如我们感兴趣的现象总体,如果具有上述特征,那么这个现象总体就是一个随机现象。通常,我们所研究的总体都是随机现象。随机现象总体表现记为X。随机事件(试验)在某种随机现象里,在一定条件下,可能发生也可能不发生的事件,就是随机事件。比如,在总体中的某个样本,在一定条件下,可能被抽取出来,也可能没有抽取出来,那么这个样本是否能够出现,就是一个随机事件。随机事件一个偶然事件,通常用表示。反之,在同样条件下不可能出现的事件,叫不可能事件;不可能事件用V表示。在同样条件下一定出现的事件,叫必然事件;必然事件用U表示。在概率统计里,U和V本身也是一个随机事件。VU。§5.1.2样本空间、事件、概率、分布函数•Ch5抽样与抽样分布•§5.1随机抽样(new)样本空间随机事件的所有可能结果所组成的集合,称为样本空间。样本空间记为S,S={}或S={X()}或者S={Xi;i=1,2,3,..,N}。样本空间的每个结果,称为样本点。对于样本空间S,满足给定性质的样本点集合A,就是事件A。事件A是样本空间的一个样本。样本A由若干个样本点组成。显然,样本空间S是一个必然事件,S=U;空集是一个不可能事件,=V。于是,也有S。当然,AS。样本空间,随机事件的变化范围是。随机变量在抽样过程中,每次抽取出来的样本结果都是不可预知的。因此,常常把样本叫做随机样本;这个样本的特征表现,就叫一个随机变量。比如我们抽取的样本数据,其数据结果就是一个随机变量。随机变量是随机事件数量化的结果,常常用X()表示。如果建立事件与数量序数i的对应关系,则随机变量又可用Xi表示。在大多数情况下,随机事件和随机变量是等同使用的。§5.1.2样本空间、事件、概率、分布函数•Ch5抽样与抽样分布•§5.1随机抽样(new)概率在相同条件S下随机实验N次,事件出现n次,nN,于是比值n/N就称为事件发生的频率,并且随着N的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,则这个稳定的频率值就是概率。记为(5.1.1)因此,概率是指随机事件发生的可能性大小。它是定义在样本空间所有的集合上的实值函数。是对事件频率可能观察到的规律性所做的数学概括。因为nN,所以0Pro{|S}1,(5.1.2)对不可能事件V和必然事件U,由于S,有Pro{=V=|S}=0,Pro{=U=S|S}=1。(5.1.3)由于→X(),则随机事件的概率表示一般又为Pro{|S}=Pro{X()|S}=Pro{X=Xi|S};i=1,2,3,..,N(5.1.4).其中,最常见的表示为Pro{X=Xi|S};i=1,2,3,..,N.(5.1.5)..lim}|{PrpNnSoN§5.1.2样本空间、事件、概率、分布函数•Ch5抽样与抽样分布•§5.1随机抽样(new)概率分布函数随机变量X的所有可能结果,与其相应的概率Pro{X()|S}排列,就是X的概率分布。如Pro{X=xi|S};i=1,2,3,..,N.(5.1.6)定义:由X所决定的概率函数Pro{X()|S}为一个分布函数,记为F(x)=Pro{Xx}.(5.1.7)其中:x表示Xi中的任何一个值,它既表示X的所有可能变化范围,又表示样本观察值的全集;Xx表示一个X在一个相对固定的数量集x上的变化;而F(x)则表示X的概率在某个范围Xx上的连续累积,它反映了X在某个值域上的概率变化规律,是对随机变量X统计规律性的完整描述。§5.1.2样本空间、事件、概率、分布函数•Ch5抽样与抽样分布•§5.1随机抽样(new)概率分布函数(续)当Xi是分离的值时,F(x)是离散分布函数,离散分布函数表示为(5.1.8)如果Xi是连续的变量,F(x)则是连续分布函数,F(x)为(5.1.9)其中,f(X)是连续分布函数的概率密度函数。对于一个具体的分布函数F(x),决定F(x)值的因素,除了随机变量X外,还有分布的参数,是决定分布形状的重要指标,因此,分布函数常常又表示为F(x;)。比如(5.1.10).},..,2,1;{Pr}{Pr)(xxiiNixXoxXoxF.)(}{Pr)(xdXXfxXoxF.);(}{Pr);(xdXXfxXoxF返回§5.1.3随机抽样•Ch5抽样与抽样分布•§5.1随机抽样(new)所谓抽样,就是从总体中按一定的抽样技术抽取若干个体,所抽取的若干个体称为一个样本;样本的抽取过程就称为抽样。样本中所含个体的数量称为样本容量。样本中每个个体的值就叫样本观察值。其一般数量表示是:设X1,X2,X3,…,Xn是从总体X得到的一个容量为n的简单样本;如果X是具有分布函数F的随机变量,则样本X1,X2,X3,…,Xn就是一个具有同一分布F的、相互独立的随机变量,随机变量组X1,X2,X3,…,Xn就为从总体X得到的容量为n的简单随机样本;样本的观察值x1,x2,x3,…,xn称为样本值,又称为X的n个独立的观察值。■抽样(续)因此,若X1,X2,X3,…,Xn为F的一个样本,则X1,X2,X3,…,Xn的联合分布函数为(5.1.11)如果X具有概率密度f,则X1,X2,X3,…,Xn的联合概率密度函数为(5.1.12)这个结论,从分布的特征表示角度理解,就是样本与总体应该具有相似性与独立性。抽样的目的是为了推断总体的某些重要特征,即利用样本推测总体分布特征和分布函数。具体地说,就是求F(x;)和。§5.1.3随机抽样•Ch5抽样与抽样分布•§5.1随机抽样(new).);();,...,,,(1321*niinxFxxxxF.);();,...,,,(1321*niinxfxxxxf返回■样本统计量样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的函数,利用这些样本函数进行统计推断。这些与样本有关的函数,就是样本统计量。样本统计量定义为:设X1,X2,X3,…,Xn是来自总体X的一个样本,Z(X1,X2,X3,…,Xn)是X1,X2,X3,…,Xn的函数,若Z是连续函数且Z中不含任何未知参数,则称Z(X1,X2,X3,…,Xn)是一样本统计量,简称统计量。样本统计量统一简记为Zn=Z(X1,X2,X3,…,Xn)。下面列出的是几个常用的统计量。§5.1.4样本统计量•Ch5抽样与抽样分布•§5.1随机抽样(new)样本平均值(5.1.13)样本方差(5.1.14)样本标准差(5.1.15)样本k阶原点矩(5.1.16)样本k阶中心矩(5.1.17)§5.1.4样本统计量•Ch5抽样与抽样分布•§5.1随机抽样(new);11niiXnX);(11)(11212122XnXnXXnSniinii;)(11122niiXXnSS,....;2,1;11kXnA
本文标题:05抽样与抽样分布
链接地址:https://www.777doc.com/doc-4376448 .html