2--理论分布和抽样分布

1、1第二章理论分布和抽样分布教学基本要求：了解几种主要的理论分布和概率分布类型；理解小概率事件实际不可能性原理、样本平均数的抽样分布概念、t分布的概念；掌握正态分布标准化的方法以及正态分布概率的计算。教学重点难点：重点：小概率事件实际不可能性原理的概念，正态分布标准化的概念和方法及正态分布的概率计算方法。难点：正态分布标准化。教学建议：先复习概率论中有关内容第二章理论分布和抽样分布2.1概率的统计学意义2.2小概率事件实际不可能性原理2.3理论分布2.4抽样分布2.5t分布3第二章理论分布和抽样分布为了便于理解统计分析的基本原理，正确掌握和应用以后各章所介绍的统计分析方法，在上章样本分布及其特征的基础上本章将讨论总体的分布及其特征。本章在介绍概率论中最基本的两个概念——事件、概率的基础上，重点介绍生物科学研究中常用的几种随机变量的概率分布：间断性变数总体的理论分布：二项分布、泊松分布；连续性变数总体的理论分布，即正态分布；从这两类理论分布中抽出的样本统计数的分布，即抽样分布和t分布。42.1概率的统计学意义一、事件1.必然现象与随机现象在自然界与生产实。

2、践和科学试验中，人们会观察到各种各样的现象，归纳起来大体上分为两大类：必然现象：在保持条件不变的情况下，重复进行试验，其结果总是确定的，必然发生（或必然不发生），可预言其结果。随机现象：在保持条件不变的情况下，重复进行试验，其结果未必相同，不可预言其结果。这类现象在个别试验中其结果呈现偶然性、不确定性现象。5一、攻关目标2.1概率的统计学意义随机现象有如下特点：在一定的条件实现时，有多种可能的结果发生，事前人们不能预言将出现哪种结果；对一次或少数几次观察或试验而言，其结果呈现偶然性、不确定性；但在相同条件下进行大量重复试验时，其试验结果却呈现出某种固有的特定的规律性——频率的稳定性，通常称之为随机现象的统计规律性。62.1概率的统计学意义2.随机试验与随机事件随机试验通常我们把根据某一研究目的，在一定条件下对自然现象所进行的观察或试验统称为试验。而一个试验如果满足下述三个特性，则称其为一个随机试验：随机现象有如下特点：（1）试验可以在相同条件下多次重复进行；（2）每次试验的可能结果不止一个，并且事先知道会有哪些可能的结果；（3）每次试验总是恰好出现这些可能结果中的。

3、一个，但在一次试验之前不能肯定这次试验会出现哪一个结果。例如在一定孵化条件下，孵化6枚种蛋，观察其出雏情况，具有随机试验的三个特征。7一、攻关目标2.1概率的统计学意义2.随机试验与随机事件随机事件随机试验的每一种可能结果，在一定条件下可能发生，也可能不发生，称为随机事件，简称事件。（1）基本事件把不能再分的事件称为基本事件。例如，在编号为1、2、3、…、10的十头猪中随机抽取1头，有10种不同的可能结果：“取得一个编号是1”、…，这10个事件都是不可能再分的事件。由若干个基本事件组合而成的事件称为复合事件。如“取得一个编号是2的倍数”是一个复合事件，它由5个基本事件组合而成。82.1概率的统计学意义2.随机试验与随机事件随机事件（2）必然事件把在一定条件下必然会发生的事件称为必然事件。例如，在严格按妊娠期母猪饲养管理的要求饲养的条件下，妊娠正常的母猪经114天左右产仔，就是一个必然事件。（3）不可能事件把在一定条件下不可能发生的事件称为不可能事件。例如，在满足一定孵化条件下，从石头孵化出雏鸡，就是一个不可能事件。必然事件与不可能事件实际上是确定性现象，即它们不。

4、是随机事件，但是为了方便起见，我们把它们看作为两个特殊的随机事件。92.1概率的统计学意义二、概率（一）概率的统计定义研究随机试验，仅知道可能发生哪些随机事件是不够的，还需了解各种随机事件发生的可能性大小，以揭示这些事件的内在的统计规律性，从而指导实践。这就要求有一个能够刻划事件发生可能性大小的数量指标，这指标应该是事件本身所固有的，且不随人的主观意志而改变，人们称之为概率（probability）。事件A的概率记为P（A）。102.1概率的统计学意义事件发生的可能性(概率)是在大量的实验中观察得到的，例如棉田发生盲椿象为害的情况，并不是所有的棉株都受害，随着观察的次数增多，我们对棉株受害可能性程度大小的把握越准确、越稳定，棉株受害为随机事件。下表为一个调查结果：112.1概率的统计学意义从棉株受害情况调查结果看，频率在n取不同的值时，尽管调查田块是相同的，频率p却不同，只有在n很大时频率才比较稳定一致。因而，调查株数n较多时的稳定频率才能较好地代表棉株受害的可能性。统计学上把通过大量实验而估计的概率称为实验概率或统计概率，用n较大时稳定的p近似代表概率，称为随机事件A的。

5、概率：P（A）=p≈m/n(n→∞)此处P代表概率，P(A)代表事件A的概率。122.1概率的统计学意义然而，正如此试验中出现的情况，尽管频率比较稳定，但仍有较小的数值波动，说明观察的频率只是对棉株受害这个事件的概率的估计。132.1概率的统计学意义（二）概率的古典定义对于某些随机事件，用不着进行多次重复试验来确定其概率，而是根据随机事件本身的特性直接计算其概率。有很多随机试验具有以下特征：1、试验的所有可能结果(基本事件数)只有有限个；2、各个试验的可能结果出现的可能性相等，即所有基本事件的发生是等可能的；3、试验的所有可能结果两两互不相容。具有上述特征的随机试验，称为古典概型。142.1概率的统计学意义对于古典概型，概率的定义如下：设样本空间由n个等可能的基本事件所构成，其中事件A包含有m个基本事件，则事件A的概率为m/n，即P（A）=m/n这样定义的概率称为古典概率。152.1概率的统计学意义例如，在有两个孩子的家庭中，孩子性别的组成有四种类型。即：男男、男女、女男、女女。它们是四个基本事件，而且是互不相容且等可能的，那么两个男孩的事件A1为四个基本。

6、事件(n)中的一个(m)，A1的概率P（A1）=1/4=0.25第一个是男孩的事件A2，包括男男，男女两个基本事件。A2的概率P（A2）=2/4=0.50162.1概率的统计学意义概率的古典定义是在概率论发展史上早期提出来的，它存在严重缺点。首先，它要求各基本事件是等可能的，即等概率的。在尚未给出概率的定义之前，利用概率的概念定义概率是不可取的。其次，它存在很大的局限性，只适用于基本事件数是有限的一类试验，对于基本事件数是无限的一类就无能为力了。虽然如此，在实际应用中，它还是被广泛地使用。172.1概率的统计学意义例在N头奶牛中，有M头曾有流产史，从这群奶牛中任意抽出n头奶牛，试求:(1)其中恰有m头有流产史奶牛的概率是多少？(2)若N=30，M=8，n=10，m=2，其概率是多少？182.1概率的统计学意义我们把从有M头奶牛曾有流产史的N头奶牛中任意抽出n头奶牛，其中恰有m头有流产史这一事件记为A，因为从N头奶牛中任意抽出n头奶牛的基本事件总数为；事件A所包含的基本事件数为；因此所求事件A的概率为：nNmnMNmMCCCAp.)(nNCmnMNmMC。

7、C19一、攻关目标2.1概率的统计学意义将N=30，M=8，n=10，m=2代入上式，得=0.0695即在30头奶牛中有8头曾有流产史，从这群奶牛随机抽出10头奶牛其中有2头曾有流产史的概率为6.95%。103021083028.CCCAp）（202.1概率的统计学意义（三）概率的性质1、对于任何事件A，有0≤P（A）≤1；2、必然事件的概率为1，即P（Ω）=1；3、不可能事件的概率为0，即P（ф）=0。21一、攻关目标2.2小概率事件实际不可能性原理随机事件的概率表现了事件的客观统计规律性，它反映了事件在一次试验中发生可能性的大小，概率大表示事件发生的可能性大，概率小表示事件发生的可能性小。若随机事件的概率很小，例如小于0.05、0.01、0.001，称之为小概率事件。22一、攻关目标2.2小概率事件实际不可能性原理在统计学上，把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理，亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验（显著性检验）的基本依据。这里的0.05或0.01称为小概率标准，生物试验研究中通常。

8、使用这两个小概率标准。232.3理论分布事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验，则必须知道试验的全部可能结果及各种可能结果发生的概率，即必须知道随机试验的概率分布(probabilitydistribution)。为了深入研究随机试验，我们先引入随机变量(randomvariable)的概念。242.3理论分布第一节、随机变量随机变量就是在随机试验中被测定的量。例如，观察10只新生动物的性别是一随机试验，而其中雄性动物出现的只数Y，就是在随机试验中被测定的量，Y可取0，1，…，10中的任何值。但是它究竟取何值，在试验结束之前是不能确知的。一般来说，在随机试验中，被测定的量是可取不同值的变量，而且它究竟取何值具有随机性，我们称这样的量为随机变量。随机变量所取得的值称为观测值。252.3理论分布有时随机试验结果本身就是数量，如测量我国男青年身高本身就是数量。有时，随机试验的结果本身不是数量，但可以表示为数量。如观察每10只新生动物的性别，本身并不是数量，但可以记为10只动物中雄性动物的只数或雌性动物的只数，即试验结果可以表示为数量。这个数量的具体值，。

9、同样是由随机试验的结果而确定。262.3理论分布根据随机变量可能取得的值，可将随机变量分为离散型随机变量和连续型随机变量：如果随机变量可能取得的数值为有限个，或可数无穷个孤立的数值，且以各种确定的概率取这些不同的值，则称为离散型随机变量。例如，每10只新生动物中，雄性动物的只数。如果随机变量可取某一(有限或无限)区间内的任何数值，且Y其取值范围内的任一区间中取值时，其概率是确定的，则称为连续型随机变量。例如我国男青年身高即为一连续型随机变量。272.3理论分布随机变量可能取值的全体称为总体，其n次独立观测值，称为样本。本书均以大写的拉丁字母，如X，Y，U等表示随机变量，而以小写字母如、等表示第i次观测值。有了随机变量的概念，事件就可以用随机变量的关系式表示。如在10只动物中，出现3只和3只以下雄性动物的事件即可写为Y≤3。ixiy282.3理论分布离散型随机变量的概率分布要了解离散型随机变量Y的统计规律，就必须知道它的一切可能值yi及取每种可能值的概率pi。如果将离散型随机变量Y的一切可能取值y的概率P(Y=y)写成y的函数称为随机变量Y的概率函数：p(y)=P(Y=。

10、y)(2.16)概率函数应满足p(y)≥0，(2.17)1)(yp29第二章理论分布和抽样分布将Y的一切可能值，，…，以及取得这些值的概率、…，排列起来，就构成了离散型随机变量的概率分布(probabiitdistribution)。表2-2离散型随机变量的概率分布表。1y2y)(1yp)(2ypY…P(yi)…1y2y)(1yp)(2yp302.3理论分布连续型随机变量的概率分布连续型随机变量(如体长、体重、)的概率分布不能用上述分布表来表示，因为其可能取的值是不可数的。我们改用随机变量Y在某个区间内取值的概率P(a≤Yb)来表示。下面通过频率分布密度曲线予以说明。312.3理论分布如由140行水稻产量资料的频数分布方柱形图(图3—1)，图中纵座标取频数与组距的比值。可以设想，如果样本取得越来越大(n→∞)，组分得越来越细(i→0)，某一范围内的频率将趋近于一个稳定值──概率。这时，频率分布方柱形图各个方柱上端中点的联线──频率分布折线将逐渐趋向于一条曲线，换句话说，当n→∞、i→0时，频数分布折线的极限是一条稳定的函数曲线。32第二章理论分布和抽样分布33第二章。