您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 定基比和曲线回归在制订选材标准中的运用
定基比和曲线回归在制订选材标准中的运用湖北省体育科研所王路德摘要:本文介绍了运用优秀成年运动员的模式数据乘定基比来制仃各年龄组选材标准的方法,并通过实例介绍了当不能用上述方法时,如何用曲线回归对数据进行平滑处理的简化方法。在运动员科学选材的研究工作中,制订选材标准是一项十分重要的内容。无论制订哪一个运动项目的选材标准时,都包括以下三部分研究。(1)指标筛选。即从众多指标中筛选出若干个对该运动项目选材十分重要的测试指标。(2)制订各年龄组单项指标的评定标准。(3)确定每个测试指标在综合评价时的“权”系数和综合评价的方法。这三项研究,都需要运用体育统计中的不同方法,进行大量的数据处理工作,才能制订出一个较为科学合理的选材标准。本文仅讨论制订各年龄组单项指标的评定标准时如何运用相应的统计方法来进行处理。一个指标(如:身高、30米跑等等)共分几个评分等级?各等级应如何划分?这些在体育统计学里都没有现成的规定,要由标准制订者根据不同情况来研究确定。一般认为:选材标准“宜粗不宜细”,评分等级不必划分过多。因而目前较多的选材标准都划分为优秀、良好、及格、不及格4个等级。这时首先要研究确定优秀、良好、及格、不及格4个等级在所测人群中应占的百分比,然后,才可以按正态分布的规律用平均数加减若干个标准差或用百分位数法计算出各等级的标准。下面着重讨论定基比和曲线回归在制订选材标准中的运用。1、定基比的运用由于制订各年龄组单项指标的评定标准时,必须使各年龄组评定标准的变化趋势符合青少年生长发育的规律,而各业余体校每年招生的水平参差不齐,从业余体校测试得到的一批不同年龄组运动员的数据,常常会出现各年龄组之间有较大的波动,用这类数据按平均数加减标准差的方法或百分位数法制订出的标准,有时甚至会出现小年龄组的标准反而比大年龄组标准高的不合理现象。因而1990年7月全国运动员科学选材中心组扩大会议讨论提出:制订选材标准时主要应该采取用优秀运动员的模式数据乘定基比的方法。如以制订身高标准为例,先要测得该项目成年优秀运动员身高的平均数、标准差(以下用X,S表示)。假设巳测得X=180,S=5。而要制订的优秀标准为X+S,良好标准为X,及格标准为X-0.5S。则本例优秀=180+5=185,良好=180,及格=180-0.5×5=177.5,这就是该项目优秀成年运动员身高的模式数据。有了这样的模式数据后,需要制订某几个年龄组的选材标准时,只要查到正常青少年身高的定基比后,就可以计算了。如根据我国青少年体质研究的统计资料,算出男性身高的定基比是:以20岁为100%,则11岁是20岁的82.1%,12岁是20岁的85.21%,13岁是20岁的89.08%……。则用模式数据乘定基比,即可算出各年龄组的标准如表一:表一:年龄定基比(%)优良及20100.00185180177.51182.10151.9147.8145.71285.21157.6153.4151.21389.08164.8160.3158.1……这样算出的各年龄组标准,其年增长率必然是符合青少年生长发育规律的。而且,只要有了优秀成年运动员的模式数据和各年龄组的定基比数据,计算就很方便。在运用定基比计算选材标准时,我们遇到了一个特例。选材指标中有一个派生指标:指距-身高。根据7~18岁的大样本统计资料,10岁以前指距-身高为负值(见表二,图一)。表二:由表二可见,如果把18岁的指距一身高3.92厘米定为100%,则按体育统计中原来计算定基比的方法,7岁的定基比就成了-31.2%,8岁成了-15.8%,这显然是错的,其原因就是因为7~10岁的指距-身高是负值。解决的办法是要加一个常数C,把负数全都变换成正数后再计算定基比。但是,C取多少合适呢?C值定得大小不同,直接影响各年龄组和18岁组的比值,其差别会很大。我们是这祥解决的,根据已有的统计资料可知,指距随年龄而变化的趋势和身高是一致的,而且两者的平均数差距也不太大,身高的定基比己知,因此可以用身高的定基比来推算C值。如计算男指距-身高的C值时根据男7岁的身高定基比为70%,则:(-1.22+C)──────────=0.7C=13.213.92+C把各年龄组指距-身高都加13.12后,就可计算出各年龄组的定基比如表三。表三:年龄平均数+C定基比711.9970.0812.5973.5912.9475.51013.0876.41113.7980.51214.5584.91315.2989.31415.7391.81516.5296.41616.9999.21716.2194.61817.13100.0年龄平均数定基比(?)7-1.22-31.28-0.62-15.89-0.27-6.910-0.13-3.3110.5814.8121.3434.2132.0853.1142.5264.3153.3184.4163.7896.4173.8598.2183.92100.0但在使用这样的定基比时,要代入下列公式:Y=(X+C)×定基比-C式中Y:某年龄组的指距-身高值,C:常数(本例为13.21)X:成年时要达到的指距一身高值如成年时要求指距-身高达8厘采,则代入公式可算出7岁时应达1.6厘来,8岁应达2.4厘米。2、曲线回归的运用有一些选材指标没有现成的定基比数据,或一时无法获得成年优秀运动员的模式数据,不可能用上述模式数据乘定基比的方法时,只能用从各业余体校测试来的数据计算标准、但是,即使侧试的样本含量较大,也必然存在抽样误差,用计算出的X,S计算标准时,还必须进行平滑处理后才能使用。如:我们测了一批7~17岁男生的心功能指数,各年龄组的n都达到l00以上。但是,算出的X、S各年龄组之间仍存在着随机波动(见表四)表四年龄平均数标准差713.232.64812.402.90912.263.281012.523.191112.592.501212.263.221311.453.591411.233.571511.593.861611.234.881710.674.10由表四可见,7~17岁的平均数有较大的波动,但是总的趋势是随着年龄的增大,心功能指数逐渐变小,因此,必须进行平滑处理。这时应该用曲线拟合来处理。本例对原始数据分别用直线、对数曲线、指数曲线、双曲线和抛物线进行拟合,计算结果如下:直线:Y=14.4839-0.2114XQ=0.9305对数曲线:Y=17.7542-5.4629LogXQ=1.0776指数曲线:Y=e(2.6921-0.0178X)Q=0.9523X双曲线:Y=──────────Q=1.4759(0.0996X–0.1728)抛物线:Y=13.7057-0.072X-0.0058X2Q=0.9015(最小)由Q值可见,抛物线拟合优度最好,应该用抛物线拟合的Y来制订标准。但是,由于各年龄组的标准差也存在着较大的波动(见表四),所以,简单地用抛物线拟合出的Y±S来制订标准还是不行的。由图二可见,虚线是拟合曲线,按Y+0.5S和Y-0.5S画出的两条曲线在好几个年龄段上都有较大的波动,为此,还需要对此进行处理。其办法是:先用X±S或百分位数法把各评分等级(优秀、良好、…)中每一个评分标准都一一计算出来,然后对每一个评分等级(优秀、良好、…)作一次曲线拟合的平滑处理计算。当评分等级分得比较多时,这样做的计算量较大。我们采用过两种方法简化处理。一种是把各年龄组的标准差计算平均数(以下标为SM),用Y士SM来计算各年龄组的标准。这种方法在各年龄组间的标准差波动不大,或者虽有较大波动但是看不出随年龄的增大而标准差增大(或减小)的趋势时,是可以用的。但是当标准差有明显的随年龄增大而增大(或减小)的趋势时,就不合适了。如本例SM=3.43,由图三可见,中间的虚线是拟合曲线,其上下的两条虚线是用Y+0.5SM和Y-0.5SM作出的两条曲线。虽然,看起来和用Y作出的曲线是平行的,即在7、8、9岁直至17岁的各个评分等级之间的差值是相同的(本例0.5SM值=1.72)没有任何波动。但是,从图三上看,以实线标出的X+0.5S,X-0.5S曲线就和Y+0.5SM,Y-0.5SM两条虚线拟合得不够好了。因此,可认为本例是不适合采用S平均数的方法作简化处理的。第二种简化方法是把各年龄组的S值先作一次曲线拟合的平滑处理,本例拟合结果也是以抛物线为最佳,就用抛物线方程计算出各年龄组的S估计值(计算过程略),然后,用Y士S估计值来分别计算各个评分等级的标准。从图四可见,Y+0.5S估计值和Y-0.5S估计值的两条曲线就比图三上拟合得好多了,即随着年龄的增长各评分等级之间的差值也逐渐有所增大,这样就比较符合原始数据的情况了。以上是我们在制订选材标准时,遇到的几个具体问题和如何运用统计方法加似解决的。不当之处请指正。
本文标题:定基比和曲线回归在制订选材标准中的运用
链接地址:https://www.777doc.com/doc-2528933 .html