您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 总结/报告 > 体育统计与SPSS应用-00统计基础
福建师范大学体育科学学院梅雪雄体育统计基础体育统计与SPSS应用基本概念总体:在一个统计问题中,通常把需要研究的同质的对象的全体称为总体。总体通常指的是研究工作所关心的变量,如研究某市初一男生的生长发育状况,以身高为指标,则总体指的是该市所有初一男生的身高,而不是这一具体的人群。个体:总体中的每一个元素称为个体。如一个身高数据,一个考试成绩等。总体中包含的个体数目可以是有限的,也可以是无限的。包含有限个体的总体称为有限总体,包含无限个体的总体称为无限总体。如一个班的学生,参加期未体育考试的成绩就是有限总体;而中学生的健康水平则是无限总体。体育科学研究中所涉及的总体,通常是无限总体。(一)总体、样本与抽样研究样本:从总体中抽取出来的一部分个体,称为总体的一个样本。样本中所含个体的数量叫样本容量。从总体中抽取样本的过程叫抽样。如研究某市初一男生的身高状况,抽测了600人,这些身高数据就构成了一个容量为600的样本。抽样研究:我们研究的对象一般是总体,但往往很难对总体中的每一个个体进行全面的观测。通常采用的方法是在总体中进行抽样观测,然后通过样本对总体做出推论。这种方法就叫作抽样研究。为什么要进行抽样研究?减少工作量,提高研究效益。对小总体进行“普查”,由于一次测试并不能完全代表某个个体的“真值”,所以仍将其看作是抽样研究。有损试验和破坏性试验,只能进行抽样研究。样本容量大,对总体的代表性就高。样本容量是否越大越好?No!样本容量并非越大越好。样本容量太大不仅会增加人力、物力、财力的消耗,还会加大试验条件控制上的困难。因此,在研究工作中不必盲目追求大样本。样本容量的确定应保证既能达到所需的研究精度,又能使人力、物力、财力的消耗尽可能小。(二)统计量与参数关于样本特征的统计指标称为统计量。统计量通常用英文字母表示。统计量来自直接测定的样本,因此常是已知的。但统计量的值不是唯一的,它会随样本的不同而改变。rSX样本相关系数样本标准差样本平均数关于总体特征的统计指标称为参数。参数通常用希腊字母表示。总体参数值是唯一确定的,但往往又是未知的。需由样本统计量来估计总体参数。总体相关系数总体标准差总体平均数(三)统计误差随机误差:在同一条件下测量某一指标,由于各种随机因素的影响,造成测得值时大时小,没有确定的规律,由此产生的误差叫随机误差。随机误差一般都是由众多微小的偶然因素造成。在统计工作中,随机误差无法避免,且无法消除,但它却有一定的统计规律性。在实际工作中,我们常假设这种误差不存在,即将其忽略不计。某个指标在某一时刻、某一状态下的实际值叫真值,测得值与真值之间的差异就是误差。过失误差:在测试工作中,由于人为错误造成测试结果的误差叫过失误差。这种误差常产生于看错、读错、听错、记错及仪器操作错误,其对测试结果的影响有时要比其他几类误差对测试结果的影响大得多。因此,测试人员在工作中一定要精益求精,严格遵守操作规范,尽力避免出现过失误差。系统误差:由于测试系统某些环节的偏差而造成测试结果呈倾向性的偏大或偏小,这种误差叫系统误差。如测试开始之前未校准仪器,场地器材出现故障,某些标准掌握过宽或过严等,都会造成系统误差。系统误差不能随样本的增大而减小。在收集数据的过程中,应校准测试仪器,严格控制测试条件,尽量避免出现系统误差。若发现存在系统误差,应认真分析确定其大小,通过系统校正加以消除。抽样误差:由抽样引起的样本统计量与总体参数之间的差异叫抽样误差。由于样本只是总体的一部分,不是总体,通过样本去推断总体,必然存在误差。因此,只要是抽样研究,抽样误差就不可避免。影响抽样误差大小的主要因素有:①变量本身的离散程度;②样本的大小;③抽样方法。抽样误差有一定规律,我们可以根据概率原理估计其大小和范围,并通过抽样程序加以控制,将其缩小到最低限度和控制在允许范围内。假设检验概述常用描述统计量结束0.1.1.1算术平均数(Mean)算术平均数简称平均数或均数,表示某变量所有取值的平均水平,即某变量全部值的和除以值的个数所得到的商。平均数是数据集中趋势的主要量度,是最常用的一个统计量。如果一组数据X1,X2,…,XN代表一个大小为N的有限总体,则其总体平均数为:NXN1ii如果一组数据x1,x2,…,xn代表一个大小为n的有限样本,则其样本平均数为:nxXn1ii0.1常用描述统计量0.1.1集中趋势量数算术平均数具有反应灵敏、确定严密、简明易懂、计算方便、受抽样的影响较小并能作进一步的代数运算等优点,是应用最广泛的一种集中量数。在体育研究中,很多情况下都可以用算术平均数来反映数据的集中趋势。但算术平均数易受极端值(极大值或极小值)的影响,因此,计算算术平均数时一般要预先排除极端值。例0.1:10名学生跳高的成绩为142,157,165,148,169,160,150,146,170,165(cm),试计算算术平均数。解:该组学生跳高成绩的算术平均数为(cm)2.15710165170146150160169148165157142xn1Xn1ii0.1.1.2几何平均数(GeometricMean)几何平均数是n个观测数据连乘积的n次方根:几何平均数也反映数据的集中趋势。一组观测值中,相邻的后一数据与前一数据之比称为发展速度。如果一组发展速度接近于一个常数,即数据按一定的比例变化时,欲求该组发展速度的平均水平,应当使用几何平均数。nn21gx...xxX例0.2:某省从1999年至2008年参加普通高校招生体育专业统考的人数及发展速度如下,试求9年来统考人数的平均发展速度。解:9年来统考人数的平均发展速度为年份:1999200020012002200320042005200620072008人数:2200244127583034364041204614521459447010发展速度:1.111.131.101.201.131.101.201.131.1814.1293.318.113.120.110.113.120.110.113.111.1x...xxX99nn21g0.1.1.3调和平均数(HarmonicMean)调和平均数是n个观测值倒数的算术平均数的倒数,亦称倒数平均数:调和平均数也反映数据的集中趋势。调和平均数常用来描述有关平均速度方面的问题。在每一速度所适用的距离相同时,应当用调和平均数来计算平均速度。x1nx1nx1...x1x1n11Xn1iin21h注意:如果是每一速度所适用的时间相同(而不是距离相同),欲求平均速度时,仍宜用算术平均数。6千米往返的平均速度为:)/(0.243012012x1nXh小时千米根据速度、距离、时间三者的关系式,亦可得:)/(0.245.01230620626tSV小时千米例如,一辆卡车以20千米/小时的速度行驶了6千米,然后以30千米/小时的速度返回。(20+30)/2=25例0.3:已知某小组8名学生60米途中跑的速度分别为8.6,8.4,8.8,8.1,8.3,8.0,7.6,8.4(m/s)。试求该组学生60米途中跑的平均速度。解:该组学生60米途中跑的平均速度为)s/m(26.84.816.710.813.811.818.814.816.818x1nXn1iih0.1.1.4中位数(Median)把一组数据按从小到大(或从大到小)的顺序排列,处于序列中点的数就称为中位数。它是将数据个数平均分为大小相等的两部分的那个数,可能是序列中的某一个原始数据,也可能不是原始数据而是通过计算得到的一个数。中位数也反映数据的集中趋势,它不会受到极端数值的影响,具有较高的稳健性。一组大小为n的数据,按从小到大(或从大到小)的顺序排列后,若n为奇数,则中位数就是(n+1)/2位置上的数,即:若n为偶数,则中位数是第n/2与第n/2+1位置上两个数值的平均数,即:21nXM2XXM12n2n当数据分布呈偏态时,或一组数据中有极端值时,或一组数据的两端有模糊数据时,一般不能用算术平均数来反映该组数据的平均水平。此时可用中位数来反映该组数据的平均水平。中位数易计算、易确定、不受极端值影响。但由于求中位数时不是每个数据都加入计算,故中位数有较大的抽样误差,不如平均数稳定。此外,中位数还难以作进一步的代数运算。所以中位数不如平均数应用广泛。例0.4:求以下两组数据的中位数:⑴16,4,19,22,17,9,13,2,10⑵1,27,23,15,24,17,6,24,19,8解:⑴将数据从小到大排列,可得2,4,9,10,13,16,17,19,22。n=9,为奇数,则中位数为13XXXM521921n⑵将数据从小到大排列,可得1,6,8,15,17,19,23,24,24,27。n=10,为偶数,则中位数为18219172XX2XX2XXM65121021012n2n0.1.1.5众数(Mode)众数是指在一组数据中出现频率最高的数值。众数也是反映数据集中趋势的量度,当数据分布呈偏态时,或一组数据中有极端值时,或一组数据的两端有模糊数据时,可以用众数来反映该组数据的平均水平。众数一般通过统计频数获得。但它不是唯一的,在一组数据中可能会出现多个众数。例4.5:24名学生的身高(cm)数据如下,求该组学生身高的众数。165168168168169169169169169170170170170170170171171171171172172173175178解:计算每个身高值出现的频数如下表所示。身高165168169170171172173175178频数135642111可以看出,在该组数据的所有数值中,最大频数6对应的是170,故该组学生身高的众数为170cm。0.1.2.1全距(Range,范围、极差)0.1.2离散程度量数全距也称为范围或极差,是一组数据中最大值(Maximum)与最小值(Minimum)之差。全距反映数据的离散趋势,在样本容量相同的情况下,全距大的一组数据要比全距小的一组数据更为分散。minmaxXXR0.1.2.2方差(Variance)与标准差(StandardDeviation)一组数据中各个数值与该组数据的平均数之差称为离差。平均离差:0ixxn平均绝对离差:0ixxn平均离差平方和:20ixxn方差是一组数据离差平方的平均值,即离差平方和除以数据个数所得的商。标准差是方差的平方根。总体方差:NX2i2总体标准差:NX2i样本方差:1nxxS2i2样本标准差:1nxxS2i方差和标准差具有反应灵敏、计算严密、受抽样变动的影响较小、具有可加性等优点,是统计分析中应用最广泛的反映数据离散程度的统计量。方差和标准差反映一组数据关于平均数的离散程度,对同类型的数据,方差和标准差越大,数据之间的差异就越大;方差和标准差越小,数据之间的差异就越小。0.1.2.3平均数标准误(StandardErrorofMean)由于抽样的缘故,由样本计算出的统计量的值与总体相应参数的真值大多是不尽相同的,这种差异就是抽样误差。平均数标准误是一个总体中理论上一切可能的样本容量为n的样本平均数的标准差。它反映了样本平均数与总体平均数之间的差异程度,即抽样误差的大小。平均数标准误越大,抽样误差就越大;平均数标准误越小,抽样误差就越小。某种统计量的标准差称为该种统计量的标准误差,简称为标准误。平均数标准误的计算公式为:nxnssx当总体标准差σ未知时,以样本标准差S替代,则平均数标准误的估计值为:原始数据的标准差σ反映的是原始数据X的离散程度,而平均数标准误反映的是一切可能样本平均数的离散程度。显然,平均数标准误比原始数据的标准差小。并且,平均数标准误受样本容量n的影响。样本容量越大,平均数标准误就越小;反之,样本容量越
本文标题:体育统计与SPSS应用-00统计基础
链接地址:https://www.777doc.com/doc-8609252 .html