您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 数据指标-3章-统计数据的描述度量.
2020/5/181本章教学目标:度量中心(集中)趋势的指标度量离散程度(变异性)的指标度量偏斜程度的指标度量两种数值变量关系的指标掌握利用Office软件计算各种统计指标第3章统计数据的描述度量2020/5/182数据分布的特征集中趋势(位置)离中趋势(分散程度)偏态和峰度(形状)2020/5/183数据分布的特征和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位差变异系数偏态四分位数2020/5/184§3.1度量集中趋势的平均指标平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势平均指标按计算方式可分为数值平均数和位置平均数两大类2020/5/185——是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。(一)算术平均数(ArithmeticMean)算术平均数的基本公式总体单位总数总体单位标志总量算术平均数一.数值平均数2020/5/186(1)简单算术平均数niixnx11算术平均数的计算n—总体单位总数;xi—第i个单位的标志值。xi—第i组的代表值(组中值或该组变量值);fi—第i组的频数。iiiffxx(2)加权算术平均数2020/5/187单项数列分组数列家庭人口(分组)职工户数(频数)172383105454531合计235iiiffxxixif上限组中值1512.52017.52522.53027.53532.54037.54542.55047.55552.56057.56562.5ix2020/5/188使用Excel函数求加权算术平均数利用Excel“数学和三角函数”中的SUMPRODUCT函数可以方便地计算出分组数据的加权算术平均数。语法规则:格式:SUMPRODUCT(区域1,区域2,…)功能:返回两个或多个区域中对应元素乘积之和。例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。2020/5/189啤酒销售量的分组统计销售量频次比重组中值10—1911.7%14.520—2935.0%24.530—3958.3%34.540—491626.7%44.550—592033.3%54.560—69915.0%64.570—7946.7%74.580—8923.3%84.5合计60100.0%51.833333加权算术平均数=51.833332020/5/1810(二)几何平均数(GeometricMean)当统计资料是各时期的发展速度等前后期的两两环比数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是n个数连乘积的n次方根。1.简单几何平均数nnGxxxx212.加权几何平均数ffnffGnxxxx2121fi—各比率出现的频数2020/5/1811例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一:1992199319941995成本200228239.4244.2年增长率(%)1452302.105.114.1Gx解二:3200/2.244Gx年平均增长率=1.0688-1=6.88%0688.10688.12020/5/1812000,100$X000,50$X000,100$X32150%decrease100%increase25.2)1()5.(X%0111)]2()50[(.1))]1(1())5.(1[(1)]1()1()1[(2/12/12/1/121nnGRRRR算术平均数:几何平均数:2020/5/1813使用Excel求几何平均数可以使用Excel统计函数中的GEOMEAN函数返回几何平均数语法规则:格式:GEOMEAN(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的几何平均数。2020/5/1814位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一)中位数(Median)——将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。比如有5笔付款:9元,10元,10元,11元,60元付款的均值为20元,显然这并不是一个很好的代表值,而中位数Me=10元则更能代表平均每笔的付款数。二.位置平均数2020/5/1815使用Excel的统计函数返回未分组数据的中位数可以使用Excel统计函数中的MEDIAN函数返回未分组数据的中位数。格式:MEDIAN(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的中位数。0123456789100123456789101214Median=5Median=52020/5/1816分组数据中位数的确定对于分组数据的统计资料,中位数要用插值法来估算。(1)计算各组的累计频数;(2)确定中位数所在的组——是累计频数首次包含中位数Σf/2的组。dfSfLMmme121其中:L—中位数所在组的下限;Sm-1—中位数所在组前一组的累计频数;fm—中位数所在组的频数;d—中位数所在组的组距。2020/5/1817例:计算下表数据的中位数解:Σf/2=27.5,中位数在“15-25”的组中,分组各组频数累计频数0-5225-156815-25202825-35154335-4585145455dfSfLMmme121102085.271575.242020/5/1818(二)众数(Mode)——是总体中出现次数最多的标志值,记为M0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。2020/5/1819众数(众数的不唯一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642422020/5/1820未分组数据众数的确定在数据量很大的时候,可以使用Excel统计函数中的MODE函数返回众数。格式:MODE(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的众数。01234567891011121314Mode=92020/5/1821分组数据众数的确定对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算dLM2110其中:L—众数组的下限Δ1—众数组与前一组的频数之差Δ2—众数组与后一组的频数之差d—众数组的组距Δ1Δ2众数Ld2020/5/1822例:计算下表数据的众数解:众数组是“15-25”的组,则分组各组频数0-525-15615-252025-351535-458454dLM211010)1520()620(6201537.222020/5/1823三.算术平均数和位置平均数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同0xf(Me,M0)X0xfMeXM00xfMeXM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数2020/5/1824补充习题补充题:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。注册资金(万元)50以下50~100100~150150~200200~250250以上企业数203542261552020/5/1825答案注册资金(万元)企业数累计企业数组中值50以下20202550~100355575100~1504297125150~20026123175200~25015138225250以上5143275(万元)6.123iiiffxx(万元)64.1195042555.711002/1dfSfLMmmeΣf/2=143/2=71.5,中位数所在“100~150”的组,众数组为“100~150”的组,)(22.11550)2642()3542(35421002110万元dLM2020/5/1826四分位数(Quartile)(概念要点)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.可用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%2020/5/1827四分位数(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N42020/5/1828未分组数据四分位数的确定规则1如果结果是整数,四分位数等于那个整数位置的数据。规则2如果结果是半数(如2.5,3.5等),四分位数等于相邻有序数据的平均数。规则3如果结果既不是整数又不是半数,结果取最接近的整数,并选数据。2020/5/1829数值型未分组数据的四分位数(7个数据的算例)原始数据:23213032282526排序:21232526283032位置:1234567QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30N+N+112020/5/1830数值型未分组数据的四分位数(6个数据的算例)原始数据:232130282526排序:212325262830位置:123456QL=23QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=282020/5/1831Excel中四分位数的计算过程(1)如果共有n个数,则有1n个数据间隔,每个四分位间有14n个数(2)第nthquart个四分位数为原有序数中的第114nthquartnnth个数;(3)如果nth的结果为整数,则该四分位数就是第nth数;否则该四分位数为第[]nth个数+(第[]1nth个数减去第[]nth个数)[]()nthnth2020/5/1832原始数据:232130282526排序:212325262830位置:123456QL=23+0.25*(25-23)=23.5QL位置=N-14=QU位置=3(N-1)4=4.75QU=26+0.75(28-26)=27.51+数值型未分组数据的四分位数(6个数据的算例)2.251+2020/5/1833数值型分组数据的四分位数上四分位数:UUUUUifSNLQ43LLLLLifSNLQ4下四分位数:2020/5/1834QL位置=50/4=12.5QU位置=3×50/4=37.5表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—)(81.117588450115个LQ)(75.128510304503125个UQ数值型分组数据的四分位数【例】根据第三章表中的数据,计算50名工人日加工零件数的四分位数2020/5/1835五数汇总和箱线图Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12304557702020/5/1836右偏Right-Skewed左偏Left-SkewedSymmetric1Q1Q1Q2Q2Q2Q3Q3Q3Q
本文标题:数据指标-3章-统计数据的描述度量.
链接地址:https://www.777doc.com/doc-5433952 .html