您好,欢迎访问三七文档
汪立明第三讲集中量集中量用来表现数据资料的典型水平或集中趋势(centraltendency)。常用的集中量包括算术平均数、加权平均数、中位数和众数等等。一、算术平均数算术平均数(arithmeticaverage)一般简称为平均数(average)或均数、均值(mean)。一般用M,或者用表示。算术平均数是最常用的集中量。X1.算术平均数的计算公式原始数据计算公式ininXnnXXXX1211XnX1(4.1)由上述公式可得算术平均数的几个重要性质XnX0XnXXnCXC连加和计算规则XCCX频数分布表计算公式CjjkjkCkkCCXfnfffXfXfXfX12122111CfXnX1(4.2)表4-152名学生数学成绩平均数计算表成绩组中值Xc频数fF*Xc计算95-97.5219590-92.5218585-87.53262.580-52.55262.575-77.5862070-72.511797.565-67.59607.560-62.55312.555-57.5423050-52.5210545-17.5117.5合计523595.0CfXnX113.69520.35952、算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值”(truescore)的最佳估计值。真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。3、算术平均数的优缺点算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。4、计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。二、中位数中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用Md或Mdn表示。1、中位数的计算方法原始数据计算法首先将一组数据按顺序排列个数为第则为奇数若21,nMdn2,122nnXXMdn则为偶数若频数分布表计算法由频数分布表计算中位数需要用到累积次数分布表。当表中数据的累积方向不同时,计算公式也不同。表4-252名学生数学成绩次数分布表成绩频数f累积频数95-25290-25085-34880-54575-84070-113265-92160-51255-4750-2345-11合计5274.457473.5573.172.6572.271.7571.370.8570.469.9569.51110987654321由下至上累积频数计算公式公式中:Lb为中位数所在组的精确下限fb为中位数所在组下限以下的累积频数n为数据总和fMd为中位数所在组的频数i为组距MdbbfifnLMd2(4.3a)由上至下累积频数计算公式公式中:La为中位数所在组的精确上限fa为中位数所在组上限以上的累积频数n为数据总和fMd为中位数所在组的频数i为组距MdaafifnLMd2(4.3b)表4-352名学生数学成绩中位数计算表成绩频数f累积频数计算95252902508534880545758407011326592160512554750234511合计52MdbbfifnLMd211521265.6977.71262522n2.百分位数百分位数的概念百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值,一般用表示。pP百分位数的计算方法公式中:Lb为百分位数所在组的精确下限fb为百分位数所在组下限以下的累积频数p为百分数n为数据总和fp为百分位数所在组的频数i为组距pbbpfifpnLP(4.4)3.中位数的特点及应用中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:一组数据中有极端数据时;一组数据中有个别数据不确切、不清楚时;资料属于等级性质时。三.众数众数(mode)用Mo表示,有两种定义:理论众数是指与频数分布曲线最高点相对应的横坐标上的一点;粗略众数是一组数据中出现次数最多的那个数。众数也是一种集中量,也可用来表示一组数据的集中趋势。1.众数的计算方法观察法寻找粗略众数未分组数据中出现次数最多的数即为众数。次数分布表中,频数最多那一组数据的组中值,即为众数。公式法计算理论众数的近似值用公式计算的众数称为理论众数。一般在体育统计中常用的公式有皮尔逊的经验公式和金氏插补法公式。皮尔逊经验公式金氏插补法XMdMo23ifffLMbaaMoo(4.5)(4.6)皮尔逊经验公式只有当数据分布呈正态或接近正态时才能使用。当数据分布呈偏态时,一般用金氏插补法计算众数。2.众数的优缺点众数的概念简单易懂,但比较粗略,不能灵敏地反映一组数据的变化,而且不适合进一步代数运算。一般用于类别变量或等级变量的资料。4.算术平均数、中位数、众数三者的关系在正态分布中:在正偏态分布中:在负偏态分布中:OMMdXOMMdXOMMdX四、其它集中量除了算术平均数、中位数和众数以外,在应用中还有一些其它集中量。这些统计指标可以从其它角度描述一组数据的集中趋势。1.加权平均数加权平均数是不同比重数据(或平均数)的平均数,一般用表示。其计算公式有两种:wXiiiwWXWXiiwnXnX(4.7)(4.8)2.几何平均数几何平均数(geometricmean)是n个数值连乘积的n次方根,用或表示。计算公式为gXnngXXXM21gM当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。(4.9)几何平均数的变式两边取对数,得11112312nnnnngXXXXXXXXM1lglg11lgXXnMng注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。(4.10)2005年9月再见!
本文标题:04 集中量
链接地址:https://www.777doc.com/doc-3980396 .html