您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第四章正态分布体育统计学
1第四章正态分布如果将第二章中的(表2—1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4—1)当分组数很多,组距很小时,频数多边形就趋于类似(图4—2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。12345678910fx图4—1频数多边形图第一节正态分布曲线的形式如果随机变量X的概率密度函数为y=21e222)(x(x)(4—1)2则称随机变量X是服从正态分布的由上式绘出的图形叫做正态曲线。(图4—2)X的变动范围在至+间。YX0μ图4—2正态分布曲线正态分布曲线中有两个参数:均值及方差2。为了应用方便,对式(4—1)中的随机变量经过一个称为标准化的变换,即令u来代替原式中的x,寻这时的随机变量u的概率密度函数成为:y=21e22u(4—2)按照(4—2)式绘出的图形,称作标准正态曲线。(图4—3)Y00.40.30.20.1-1-2-3123μ3图4—3标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以1的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1.00。五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4—4)由式(4—1)和(4—2)知,标准正态曲线的=0,=1,即标准正态曲线是关于纵轴对称;它在=0时,有最大值,它近似等于0.4,如(图4—3)所示。4YX0μσ=0.5σ=1σ=2图4—4三种不同形式的正态分布曲线第三节正态分布表从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到X=168.40厘米,S=6.13厘米。假定该市17岁男生身高服从正态分布,试估计身高在16.40—172.40厘米之间的人数。求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a,b)上的概率。这个概率在标准正态曲线下就是曲线、X轴、直线X=a和X—b所围成的面积。(图4—5)当概率P求得后,要求的人数约等于总人数乘以P值。Y00.1-1-2-3123μ0.20.40.3ab5图4—5随机变量X在区间(a,b)内取值的概率示意图表的左边第1列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即u=x(4—3)表上边的第1行为u值的第2位小数。表的主体部分是各u值与均数(u=0)之间所对应的单侧面积(或概率)。一、知U值求对应的面积例4—1求u值为-1至+2之间对应的面积。解:由于标准正态曲线是关于x=u对称的均数处的u值为零,所以u值在-1至0这间对应的面积与它在0至+1之间的对应面积相等。查书后附表1得u值在-1至0的对应面积是34.13%;u值在0至+2之间的面积是47.72%。前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。(图4—6)即:34.13%+47.72%=81.85%0-12=+81.85%34.13%47.72%00-12图4—6例4—2本节开始提出的问题,即试估计身高在160.40—172.40厘米之间的人数。解:首先要求出身高为160.40厘米和172.40厘米的u值,按式(4—3)有(当u和未知时,可用X和S近似代替):6u1=13.640.16840.160=-1.31u2=13.640.16840.172=0.65查书后附表1求u1、u2所对应的面积。u1=-1.31所对应的面积是40.49%,u2=0.65所对应的面积是24.22%。u值-1.31至0.65所对应的面积为40.49%+24.22%=64.71%,见(图4—7)所示,于是身高在160.40—172.40厘米之间的人数约为205×64.71%133(人)。0-1-212μ24.22%40.49%172.40米160.40米0.65-1.31图4-7估计身高在160.40-172.40厘米间的人数百分数二、已知面积求对应的U值例4—3试求从+1向右到什么位置对应的面积为14.15%?解:设从+1向右到+k对应的面积为14.15%。查标准正态分布表知+1对应的面积是34.13%。24.13%+14.15%=48.28%,就是u值从0到+k之间对应的面积。查书后附表1和K=2.11,即从+1向右到+2.11之间对应的面积为14.15%。(图4—8)从标准正态分布表中,可以找出标准正态曲线下面的分布规律。在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。7μ+1б+2.11б图4—8从+1—+2.11对应的面积表4—1正态曲线下的概率分布u该范围具有的概率168.26%1.9695.00%295.44%2.5899.00%399.73%第四节统计资料的正态性检验正态分布的理论适用于正态或近似正态分布的资料。对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分8布的规律刻划的。使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。例4—4广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布?组限频数累计频数累计频率(%)732110.8442675.6152152217.6852204233.6503276955.2213259475.29132111592.0623612196.8333212398.40432125100.0由样本计算得:X=2303,S=421然后根据每组的下限值和相应的累计频率,将它们分别标在图上。根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。由(图4—9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。90.010.11510203040506070809095992′51″2′2′2′3′3′3′3′3′37″44″58″05″12″19″26″33″μ15.872′50″3′02″8′91图4—9当样本资料符合正态分布时,籍助正态概率纸做图,还可以对和作出近似地估计。从正态分布理论知道累积频率为50%的位置应在中点,即接近均数位置。从纵轴50%的位置画横线与钭线交于a点,由不得a点向横轴做垂线交于点,其值为8203,即为估计均数,它与计算值2203仅相差50。又知均数减一个标准差位置的面积为34.13%,故在纵轴上的应是50%-34.13%=15.87%(b点),以此划横线交于钭线上c点,向横灿做垂线交于9052处,此点距均数的长度应为,故估计标准差的值为:91190528203。计算值为421,仅相差50。只要图做得准确,这些估计值也还是比较精确的。10第五节可疑数据的舍取在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。人们把来自非同一总体的极端值,称为异常数据。样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。设x1,x2……,xn来自正态分布的总体,将它们按大小重新排列,记为x(1)≤x(2)≤……≤x(n)。首先计算出可疑数据的gn值,其公式为:gn=s|xx|(4—4)式中x表示可疑数据值,若计算得gn值大于(表4—2)中的临界值an,则认为x是异常数据,应舍弃。若小于临界值,则x为正常数据,应保留。表4—2戈罗伯斯检验临界值(an)表=0.05nannannannannan31.15122.29212.58302.96402.8741.46132.33222.60313.03502.9651.67142.37232.62323.09603.0361.82152.41242.64333.14703.0971.94162.44252.64343.18803.141182.03172.47262.75353.21903.1892.11182.50272.82363.231003.21102.18192.53282.87373.241103.23112.23202.56292.92383.251203.24例4—5为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:n=100人x=1.31米s=0.09米假定这些学生跳高成绩的分布呈正态分布。其中有一名学生的成绩是1.65米,这个成绩超出平均水平三个标准差以上,是个可疑数据。试检验它是否为异常数据。按公式(4—4)计算gn=s|xx|=09.0|31.165.1|3.78查(表4—2)n=100对应的an值是3.21,现计算值是3.78,大于临界值,故1.65米是异常数据应舍弃。据了解,该学生是少体校学生,受过专项训练,不属于一般高中学生跳高水平研究的总体。第六节正态分布理论在体育中的两个应用一、制定测验标准制定测验标准是体育教学和训练中的一项重要工作,一般是根据学生原有的基础和不同阶段教学目的与要求,事先规定达到各标准的人数比例,并将这个比例数看作正态分布曲线下的面积,然后利用标准下正态分布表去推算相应标准的具体成绩。例4—6某学校某年级在进行跳高教学之前,从该年级随机抽出一部分学生测验其跳高成绩。现由样本计算得到统计量为:12x=1.40米,S=0.10米学校方面根据学生在跳高上的基础水平和教学的要求,规定就目前状况达到优秀的人数比例为10%,良好的人数比例为20%,有15%的人不能及格,试用统计方法求出以上三个标准的具体成绩。μ123-1-2-315%20%10%cba-1.040.521.281.30米1.45米1.53米图4—10跳高测验标准的确定计算过程如下:人数比例查标准正态分布表的面积u值标准)sux(10%(优)50%-10%=40%1.281.40+1.28×0.10=1.53(米)20%(良)50%-10%-20%=20%0.521.40+0.52×0.10=1.45(米)15%(不及格)50%-15%=35%-1.401.40-1.04×0.10=1.30(米)综上所述,优秀标准的成绩是1.53米;良好标准的成绩是1.45米;及格标准的成绩是1.30米。二、估计达标人数13以上阐述的是已知达标人数比例,求出这一标准的具体成绩,下面是叙述先定出具体的成绩标准,而后要求估计出达到标准的
本文标题:第四章正态分布体育统计学
链接地址:https://www.777doc.com/doc-2093403 .html