您好,欢迎访问三七文档
2020/1/24第五章数据分布特征的测度1第五章数据分布特征的测度§集中趋势的测度§离散程度的测度§偏态与峰态的测度2020/1/24第五章数据分布特征的测度2学习目的与要求通过本章学习,要正确理解平均指标与变异指标的概念、意义、作用;明确其种类及其区别;掌握平均指标与变异指标的计算方法、应用条件、平均指标与变异指标的关系。2020/1/24第五章数据分布特征的测度3数据分布的特征集中趋势(位置)离中趋势(分散程度)偏态和峰态(形状)2020/1/24第五章数据分布特征的测度4第五章数据分布特征的测度第一节平均指标的概念和作用第二节算术平均数第三节调和平均数第四节几何平均数第五节中位数与众数第六节标志变异指标2020/1/24第五章数据分布特征的测度5第一节平均指标的概念和作用一.概念:平均指标是同质总体各单位某一标志值在一定时间、地点条件下的一般水平的代表值。二.特点:⒈平均指标是一个代表值2.抽象了各变量值之间的差异3必须具有同质性4.反映总体变量值的集中趋势(Centraltendency)2020/1/24第五章数据分布特征的测度6一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据2020/1/24第五章数据分布特征的测度7三.作用:⒈可用于同类现象在不同空间的比较⒉可用于同类现象在不同时间的比较⒊作为评判事物的标准⒋可进行数量估算2020/1/24第五章数据分布特征的测度8四.种类1.对总体各单位的标志值差异进行抽象算术平均数、调和平均数、几何平均数、中位数、众数2.对某种现象在不同时间上指标值的差异进行抽象3.统计指数、总相对数、回归直线2020/1/24第五章数据分布特征的测度9㈠算术平均数㈡调和平均数㈢几何平均数㈣中位数㈤众数数值平均数位置平均数2020/1/24第五章数据分布特征的测度10第二节算术平均数(均值)一、基本公式计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。总体单位总量总体标志总量算术平均数2020/1/24第五章数据分布特征的测度11总产量总成本平均成本职工人数工资总额平均工资例:2020/1/24第五章数据分布特征的测度12二、计算方法(一)简单算术平均数式中:为算术平均数;N为总体单位总数;为第i个单位标志值。NXNXXXXNiiN121XiX2020/1/24第五章数据分布特征的测度132.在变量分配数列中,各组次数都相等使用条件:1.只掌握总体各单位的标志值,未掌握总体标志总量2020/1/24第五章数据分布特征的测度141用统计功能计算例1:某工厂某生产班组有11名工人,各人日产量为15、17、19、20、22、22、23、23、25、26、30件,求平均日产量。解:=(15+17+19+20+22+22+23+23+25+26+30)/11=22件开机,2ndF,ON,在0的上方出现STAT15,M+,17,M+,19,M+,20,M+,22,M+,22M+,23M+,23M+,25M+,26M+,30M+,x→M出现结果22NXX2020/1/24第五章数据分布特征的测度15例2:五名工人日产零件数为12,13,14,14,15件,计算平均每人日产量。12,M+,13,M+,14,M+,14,M+,15,M+,RM,,5,=计算结果13.6,注意:每次开机后按x→M键,清内存。2.用存储功能算2020/1/24第五章数据分布特征的测度16(二)加权算术平均数式中:为算术平均数;为第i组的次数;m为组数;为第i组的标志值或组中值。miimiiimmmffXffffXfXfXX11212211XifiX2020/1/24第五章数据分布特征的测度17适用条件:在分配数列中,各组变量值的次数不等例1:日产零件分组x工人人数f20121422623824122510267272合计50表4-6某厂工人生产情况2020/1/24第五章数据分布特征的测度18fxfX271012864122772610251224823622421120==23.88(件)2ndF,ON,20,M+,21,,4,M+,22,,6,M+,23,,8,M+,24,,12,M+,25,10,M+,26,,7,M+,27,2,M+,x→M结果为23.882020/1/24第五章数据分布特征的测度19在组距数列中,则应取各组的组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。iX2020/1/24第五章数据分布特征的测度20例2:某厂资料如下,计算月平均工资.月工资(元)人数f组中值xxf250以下402259000250-3008027522000300-35012032539000350-4001503755550400-4507042536680450以上4047519000合计500—982302020/1/24第五章数据分布特征的测度21)(46.1965009823050040475...8027540225元fxfX即500名工人的月平均工资为196.46元。2020/1/24第五章数据分布特征的测度22影响算术平均数的因素:分析:miimiiiffXX11决定平均数的变动范围起到权衡轻重的作用权数:指变量数列中各组标志值出现的次数。2020/1/24第五章数据分布特征的测度23例:权数对均值的影响成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)6199802020/1/24第五章数据分布特征的测度24权数的形式:绝对数权数相对数权数表现为次数、频数、单位数;即公式中的fXfXf表现为频率、比重;即公式中的ffXfXfXff2020/1/24第五章数据分布特征的测度25例3:某建筑工地上有10台起重机在工作,其中一台的起重量为40吨,两台为25吨,三台为10吨,其余四台为5吨,求平均起重量。2020/1/24第五章数据分布特征的测度26起重量(吨)X台数f起重总量xf4014025250103305420合计10140解(吨)14432145310225140fXfX2020/1/24第五章数据分布特征的测度27平均起重量==400.1+250.2+100.3+50.4=14(吨)起重量(吨)X起重机台数构成(%)4010425205103035402合计10014ffffXffX解:2020/1/24第五章数据分布特征的测度28(三)两者的关系当f1=f2=…=fn=A时,(四)权数的选择(五)强度相对数与算术平均数的区别NXNAXAfXfX2020/1/24第五章数据分布特征的测度29三、算术平均数的数学性质1.算术平均数与总体单位总量的乘积等于总体标志总量。或2.各变量值与算术平均数的离差之和等于零。或3.各变量值与算术平均数的离差平方和为最小值。XNXxffX0)(XX0)(fXX2020/1/24第五章数据分布特征的测度302)(XX最小值或fXX2)(最小值证明:设为不等于的任意值,C为常数,则有,以为中心的离差平方和为:0XCXX00X212121122102)(NCXXCXXCXXCXXXXNiiNiiNiiNiiNii2020/1/24第五章数据分布特征的测度31所以221NCXXNii0NC2因为2N1ii2N1i0iXXXX最小值21NiiXX2020/1/24第五章数据分布特征的测度32xbabxa)(4.对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。5.对于任意两个变量x和y,它们的代数和的算术平均数等于两个变量的算术平均数的代数和。yxyx)(2020/1/24第五章数据分布特征的测度33均值(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据2020/1/24第五章数据分布特征的测度34算术平均数的特点优点:①容易理解,便于计算②灵敏度高③稳定性好④最小值和缺点:①易受极值影响②在偏斜分布和U形分布中,不具有代表性0)(XX2)(XX2020/1/24第五章数据分布特征的测度35第三节调和平均数一.概念标志值倒数的算术平均数的倒数。又称倒数平均数。二.简单调和平均数公式:例1:某种蔬菜价格早市为0.5元/斤、中市为0.4元/斤、晚市为0.25元/斤。现早、中、晚各买1斤,求平均价格。元38.0325.04.05.0NXX2020/1/24第五章数据分布特征的测度36元35.05.8325.014.015.01111X实际上,例2是用下列公式计算:这就是简单例2:某种蔬菜价格早市为0.5元/斤、中市为0.4元/斤、晚市为0.25元/斤。现早、中、晚各买1元,求平均价格。调和平均数的公式。nHXXXNXNX1^111212020/1/24第五章数据分布特征的测度37三.加权调和平均数例3:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买2元、3元、4元,求平均价格。XmmXH元33.05.27925.044.035.02432HX加权调和平均数公式:2020/1/24第五章数据分布特征的测度38【例】某公司奖金分配资料如下,计算该企业平均每人的奖金额。等级奖金额(元)X各组奖金总额(元)m一等120960二等1004200三等902700合计_78602020/1/24第五章数据分布特征的测度39=NiiiNiiHXmmX11)(25.98807860902700100420012096027004200960元解:2020/1/24第五章数据分布特征的测度40调和平均数是算术平均数的一种变形。权数的选择:在已知分母、未知分子时,求平均指标用加权算术平均数。在已知分子、未知分母时,求平均指标用加权调和平均数。fXfXXmmXH2020/1/24第五章数据分布特征的测度41【例】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—18249002020/1/24第五章数据分布特征的测度42计算该公司该季度的平均计划完成程度。fmX计划产值实际产值程度计划完成﹪12.10524900261754400800440015.180085.0fXfX应采用加权算术平均数公式计算2020/1/24第五章数据分布特征的测度43【例】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):计算该公司该季度的平均计划完成程度。组别企业数(个)计划产值(万元)实际产值(万元)12342310380025001720044006802375180605060合计1824900261752020/1/24第五章数据分布特征的测度44fmX计划产值实际产值程度计划完成组别企业数(个)计划产值(万元)实际产值(万元)﹪12.1052490026175XmmXH2
本文标题:第五章 平均指标程
链接地址:https://www.777doc.com/doc-3286234 .html