您好,欢迎访问三七文档
第二章:常用统计参数主讲:任杰2020/1/25第二章:常用统计参数2统计量统计量:反映一组数据(样本)统计特征的数字。参数:反映总体的统计特征的数字叫参数。统计量和参数的统计意义是相同的,计算原理和方法也是相同的,只是在指代不同对象时叫法不同,表示方法不同。2020/1/25第二章:常用统计参数3BB85.080.075.070.065.060.055.050.045.040.035.030.025.02001000Std.Dev=10.63Mean=51.7N=664.00年龄80.075.070.065.060.055.050.045.040.035.030.025.020.02001000Std.Dev=10.39Mean=37.3N=644.002020/1/25第二章:常用统计参数4一、集中量数集中量:即表现一组数据的集中趋势或集中程度,代表一组数据的中心位置的统计量。2020/1/25第二章:常用统计参数5集中量算术平均数加权平均数中数众数几何平均数2020/1/25第二章:常用统计参数6(一)算术平均数1、算术平均数:一般简称为平均数或均数(Mean),一组数据的总和除以数据的总个数所得的商就是算术平均数。学算术平均数常用代表变量的字母上加一“—”来表示,如YX,2020/1/25第二章:常用统计参数72、算术平均数的计算假设一变量X共有n个观测值,则变量X的平均数为:iniiniinXXnXnXXXX通常可简写为1121...2020/1/25第二章:常用统计参数83、算术平均数的性质在一组数据中每个观测值与平均数之差(离均差)的总和等于0。在一组数据中,每一个观测值都加上一个常数C,则所得平均数为原来的平均数加上常数C。在一组数据中,每一个观测值都乘以一个常数C,则所得平均数为原来的平均数乘以常数C。2020/1/25第二章:常用统计参数9证明XCnXCnCXCXCnXnnCXnCXnCXXXXnXXXXXiiiiiiiiiii32012020/1/25第二章:常用统计参数104、次数分布表算术平均数的计算为各组的组中值为各组的次数ccXfffXX2020/1/25第二章:常用统计参数115、算术平均数的意义与优点算术平均数是应用最普遍的一种集中量数,是“真值”的渐近、最佳估计值。反应灵敏。观测数据中任何一个数值的变化都能通过算术平均数反应出来。确定严密。只要是同一组数据,计算出来的算术平均数不受计算者、时间、地点等因素的影响。2020/1/25第二章:常用统计参数125、算术平均数的意义与优点简明易解。原理简单易懂,计算简便易行。符合代数方法进一步演算。较少受抽样变动的影响。从同一个总体中随机抽取的容量相同的样本,所计算出的算术平均数与其他集中量指标相比,抽样误差较小。2020/1/25第二章:常用统计参数136、算术平均数应用的局限易受极端数据的影响。若有模糊不清的数据,则无法计算平均数。凡不同质的数据不能计算平均数。(同质数据是指用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。)2020/1/25第二章:常用统计参数14(二)中数1、中数,又叫中位数,符号为Md或Mdn(Median),指的是位于一组数据中较大一半与较小一半中间位置的那个数。中数可能是观测数据中的某一个,也可能根本不是原有的数。2020/1/25第二章:常用统计参数152、未分组数据中数的计算A、将数据依值的大小排序B、如果位于数据序列中间的几个数不重复,按以下方法计算中数:1)当数据的个数为奇数时,取位于中间的那个数即第(N+1)/2个数为中数;2)当数据的个数为偶数时,取第N/2个和第N/2+1个数的平均数为中数。2020/1/25第二章:常用统计参数16C、如果位于数据序列中间的是几个重复数据,则按以下方法计算中数:1)把重复数据视作某一区间上的几个连续的数;2)根据B步骤的计算方法,中数落在哪一个数上,则该数的中点就是此一列数据的中数;3)如果中数落在两个重复数据之间,则前一个重复数据的精确上限或后一个数据的精确下限即为要求的中数。2020/1/25第二章:常用统计参数172、4、5、7、8、9、9、11、132、4、5、5、7、8、9、9、11、132、4、5、5、8、9、9、9、11、12、132、4、5、5、8、9、9、9、11、12、13、172020/1/25第二章:常用统计参数183、次数分布表中数的计算A、求N/2,找出N/2即中数所在的分组区间;B、求N/2所在区间以下各区间的次数和(即中数所在组区间下限以下的累加次数),记作Fb;C、计算N/2–Fb的值;D、求位于N/2点的值2020/1/25第二章:常用统计参数19ifFbNLMdmdmd22020/1/25第二章:常用统计参数20其中:Lmd为N/2所在区间的精确下限i为组距fmd为中数所在区间的次数2020/1/25第二章:常用统计参数21组别组中值(Xc)次数(f)相对次数上限以下累积百分数42.5-4510.0333.347.5-5030.10013.352.5-5530.10023.357.5-6030.10033.362.5-6540.13346.667.5-7040.13359.972.5-7580.26786.677.5-8030.10096.682.5-8510.034100.0总和(Σ)N=301.0002020/1/25第二章:常用统计参数224、中数的意义与应用优点:计算简单,容易理解。不足:反应不够灵敏;受抽样的影响较大,不稳定;也不能作进一步的代数运算。2020/1/25第二章:常用统计参数234、中数意义与应用应用:中数一般不经常使用,但在下列情况下,中数可以较好地反映数据的集中趋势:A.当一组观测结果中出现两极端数据时;B.当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值;C.当需要快速估计一组数据的代表值时,也常用中数。2020/1/25第二章:常用统计参数24(三)众数1、众数:又叫范数,密集数,通常数等,常用符号Mo表示,是指一组数据中出现次数最多的那个数(Mode)。2020/1/25第二章:常用统计参数252、众数的计算求众数最简单的方法是通过直接观察找出粗略众数。也可以用公式求出理论众数,皮尔逊经验法是常用的计算正态分布数据理论众数的方法,其公式为:Mo=3Md-2M2020/1/25第二章:常用统计参数263、众数的应用众数的缺点同中数一样,其应用也因此受到限制,通常是在无法计算平均数的情况下,用以了解一组数据的集中情况,如存在极端数据、有模糊数据、有不同质数据等。2020/1/25第二章:常用统计参数27(四)加权平均数1、加权平均数是用来表示不同比重数据、或平均数的平均数,用或Mw表示。当数据的比重不同时,如果直接用算术平均数来表示该组数据的集中趋势,就不够科学和准确,这时就要用权数(weight),即该数据在整个数据总体中的相对重要性来计算平均数。WX2020/1/25第二章:常用统计参数282、加权平均数的计算iiiWWXWX2020/1/25第二章:常用统计参数293、加权平均数的应用大学课程成绩的计算大学生综合测评成绩的计算不同分实验(调查)结果的会合等等2020/1/25第二章:常用统计参数30(五)几何平均数1、几何平均数(geometricmean):又叫对数平均数,符号记作Mg或。gX2020/1/25第二章:常用统计参数312、几何平均数的应用条件一组实验数据中有少数数据偏大或者偏小,数据的分布呈偏态时;心理物理学实验中,用等距和等比量表测量所获得的数据;一组数据彼此间差异较大,几乎是按一定的比例关系变化时,如教育研究中教育经费的增加、学校每年的招生人数等。2020/1/25第二章:常用统计参数323、几何平均数的计算)()(1121BXXXAXXXXnngnng2020/1/25第二章:常用统计参数33上式中,n代表数据的个数;几何平均数有两种情况:一种是实验直接观测值的平均数(如心理物理实验中所获得的数据,此时用公式A,P36);一种是指数据的平均变化率(如人口的增长率、学习能力的进步率等,此时用公式B)。2020/1/25第二章:常用统计参数34练习一研究阅读能力随阅读遍数变化的实验结果如下:第一遍,理解成分为40%第二遍,理解成分为52%第三遍,理解成分为65%第四遍,理解成分为75%第五遍,理解成分为86%第六遍,理解成分为97%求阅读能力随阅读遍数的平均增加比率。2020/1/25第二章:常用统计参数35二、离散量离散量:反映一组数据离散趋势或离散程度的统计量,用来表示一组数据的分散情况。次数分布的两个基本特征:中心位置与离散性2020/1/25第二章:常用统计参数36图例2020/1/25第二章:常用统计参数37离散量方差与标准差标准分数全距平均差差异系数离散量的种类相对差异量绝对差异量2020/1/25第二章:常用统计参数38(一)全距全距:即一组数据中最大值与最小值的差。常用大写字母R表示。(Range=Max-Min)用全距表示一组数据的离散程度是非常粗略和不准确的。2020/1/25第二章:常用统计参数39(二)平均差平均差:每一个观测值与平均数的距离的和的平均。用AD(averagedeviation)表示。nxnXXADii2020/1/25第二章:常用统计参数40平均差的应用平均差是用来表示一组数据离散程度的较好的差异量数,反应灵敏,确定严密。缺点是在计算时要取绝对值,不利于代数方法的运算;也不利于进一步的统计分析。2020/1/25第二章:常用统计参数41(三)方差与标准差1、基本定义方差(Variance):也叫变异数、均方,是每个观测值与该组数据的平均数之差平方后和的均值,即离均差平方和的平均数。样本方差和总体方差的计算方法和含义是一致的,但符号不同,前者用S2表示,后者用σ2表示。标准差(Standarddeviation):即方差的平方根,样本方差常用符号S或SD表示,总体方差则用σ表示。2020/1/25第二章:常用统计参数422、方差与标准差的计算公式nXXSnXXSii2222020/1/25第二章:常用统计参数43练习试推导用原始数据计算方差和标准差的公式。22222nXnXSnXnXSiiii2020/1/25第二章:常用统计参数44计算并思考计算下列四组数据的平均数,并找出每组数据的最大值和最小值:A.7、7、8、8、8、9、9B.4、5、7、8、9、11、12C.1、4、7、8、9、12、15D.1、8、8、8、8、8、15思考:这四组数据有什么不同?仅仅用平均数能不能反映这组数据的所有特性?为什么?2020/1/25第二章:常用统计参数453、标准差的性质一组数据的每一个观测值都加上一个常数C,其标准差不变。一组数据的每一个观测值都乘以一个常数C,其标准差为原标准差乘以常数C。2020/1/25第二章:常用统计参数46证明并思考试证明上述标准差的性质并思考在每种情况下数据分布形态的变化。2020/1/25第二章:常用统计参数474、方差与标准差的意义方差与标准差是表示一组数据离散程度的最好指标,具有以下优点:反应灵敏,每个数据取值的变化,方差与标准差都会随之变化;有一定的计算公式严密确定;容易计算并适合代数运算;2020/1/25第二章:常用统计参数484、方差与标准差的意义受抽样变动的影响小;具有可加性,因此可以分解并确定出属于不同来源的变异性,并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。2020/1/25
本文标题:常用统计参数
链接地址:https://www.777doc.com/doc-3298142 .html