您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 应用经济统计学数据整理与分析
数据整理与分析主要内容数据分组数据显示数据集中趁势数据离中趋势数据分组1、将原始资料顺序排序2、确定组数与组距3、确定组限4、将各个数据按其数值大小归入相应的组内如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数=1+3.322logn组距=(观察值中的最大数值-观察值中的最小数值)/组数数据分组例【例1】设某企业30个非熟练工人的周工资额(元)如下:106998512184941061101191019591871051061091189612891105111111107103101107106数据分组例排序:84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128分组计算组数=1+3.322logn=5.9(n=30)分6组组距:每组区间的宽度=(观察值中的最大数值-观察值中的最小数值)/组数=(128-84)/6=7.3分6组,组距8每周工资(元)人数(个)各组人数占总人数百分比(%)84~9251792~100517100~1081240108~116413116~124310124~13213合计30100结合实际数据一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开始,分5组,组距10每周工资(元)人数(个)各组人数占总人数百分比(%)80~9031090~100723100~1101343110~120517120~13027合计30100分两组工资收入次数分配表工资收入分组次数80-10513105-13017合计30反映不出观察值分布特征次数0510152080-105105-130次数分组太细会出现什么问题?020406080100120140工资1人员编号工资表数据图示直方图:频数分配直方图、频率分配直方图次数多边形图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图。[特例]洛伦茨曲线茎叶图直方图以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少。如下图:频数直方图直方图频率分布直方图次数多边形图分配直方图02468101214收入人次80-9090-100100-110110-120120-130次数多边形图还可将几种不同数据绘在同一多边形图上用于比较.如图:累计次数分配图小于上组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)80~9090331090~10010071033100~110110132377110~12012052893120~130130230100累计次数分配图以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:累计次数分配图大于下组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)80~908033010090~1009072790100~110100132066110~1201105723120~130120227累计次数分配图洛伦茨曲线以人口百分比为横坐标、以累积收入百分比为纵坐标描点连接而成的图形,如图:基尼系数反映一国收入的平等程度。如右图基尼系数r=A/(A+B)r=0绝对平等r=1绝对不平等r越大越不平等,反之则越平等。茎叶图数据源:21,29,60,1,27,35,66,23,8,38,31,45,57,66,68,62,62,93,68,19,68,72,76,91,46,62,3,10,49,56,52,95按大小排序后如下:1,3,8,10,19,21,23,27,29,31,35,38,45,46,49,52,56,57,60,62,62,62,66,66,68,68,68,72,76,91,93,95茎叶图茎叶次数01383109221379431583456935267360222668889726280913554数据集中趋势算术平均数几何平均数调和平均数中位数及四分位数众数算术平均数(概念要点)集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响算术平均数(计算公式)设一组数据为:简单算术平均值的计算公式为设分组后的数据为:相应的频数为:加权算术平均值的计算公式为121niniXXXXXnn1122111211()kiikkkiiikkikiiiiXfXfXfXffXXfffff12,,,nXXX12,,,kXXX12,,,kfff简单算术平均数(算例)原始数据:10591368112345661059136868.5niiXXXXXXXXn加权算术平均数(算例)【例2】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。拿这三种工资的人数分别为:14人、10人、2人,则该公司雇员的平均工资为:___6.5147.5108.521837.0381410226X加权算术平均数(分组数据算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(fi)Xifi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例3】根据表4-1中的数据,计算50名工人日加工零件数的均值116160123.250kiiikiiXfXf(个)算术平均数的数学性质1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小2211()min()nniiCRiiXXXCniiXX10)(1()0niiiXXf2211()min()nniiiiCRiiXXfXCf几何平均数(概念要点)1.集中趋势的测度值之一2.主要用于计算平均比率及平均发展速度3.计算公式为简单几何平均数加权几何平均数4.数据都为正数时才可计算几何平均数5.可看作是均值的一种变形121..nnnniiGMXXXX112log1log..(logloglog)niinXGMXXXnn12121..kikffffffkiiGMXXXX几何平均数(算例)【例4】设某建筑公司承建的四项工程的利润分别为3%、2%、4%、6%。问这四项工程的平均利润率是多少?124..3%2%4%6%3.46%nnGMXXX几何平均数(算例)【例5】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。124..104.5%102.0%103.5%105.4%103.84%nnGMXXX平均收益率=103.84%-1=3.84%几何平均数(算例)【例6】设某银行有一笔20年的长期投资,其利率是按复利计算的,有1年为2.5%,有3年为3%,有5年为6%,有8年为9%,有2年为12%,有1年为5%,求平均年利率。358220355220..(12.5%)(13%)(16%)(19%)(112%)(15%)1.025(1.03)(1.06)(1.09)(1.12)(1.05)1.070881.0708810.070887.088%GMr调和平均数(概念要点)集中趋势的测度值之一均值的另一种表现形式易受极端值的影响计算公式为简单调和平均数加权调和平均数1(1/)niinHX11(/)kiiiiikiiimHmxfmx,其中调和平均数(说明)加权调和平均111111,(/)(/)kiiiiiikiiikkiiiiikkiiiiiiimHmxfxmxmxfHmxffm,其中而不是变量值出现的次数,故事实上就是加权算术平均数的变形,它主要用于每个数值次数未知,而总量已知情形的数据求平均.调和平均数(算例)【例7】某人开车,前10公里以时速50公里驾驶,后10公里以时速30公里驾驶。则此人跑这20公里的平均时速为:101021010115030503037.5(/V总路程S总时间T公里小时)【例8】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别购买的金额是1元(m1)、2元(m2)、3元(m3),求平均价格。解:平均价格=总金额/总数量调和平均数(算例)12360.24/12325.50.400.250.20mHmx元元斤斤【例9】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别买2.5斤(f1)、8斤(f2)、15斤(f3),求平均价格。解:平均价格=总金额/总数量调和平均数与算术平均数的区别0.42.50.2580.20150.24/2.5815xfxf总金额总数量元斤中位数(概念要点)1.集中趋势的测度值之一2.排序后处于中间位置上的值Md50%50%3.不受极端值的影响4.各变量值与中位数的离差绝对值之和最小,即11minnnidiCRiiXMXC中位数(位置的确定)未分组数据:中位数位置组距分组数据:2∑f中位数位置12n未分组数据的中位数(计算公式)1212212ndnnXMXX当n为奇数时当n为偶数时数值型未分组数据的中位数(5个数据的算例)原始数据:2422212620排序:2021222426位置:12345中位数22151322n位置数值型未分组数据的中位数(6个数据的算例)原始数据:10591268排序:56891012位置:123456位置=中位数8+928.51613.522n1.根据位置公式确定中位数所在的组,设落入第组2.采用下列近似公式计算数值型分组数据的中位数(要点及计算公式)1/2idiiinFMLdfi11iiiiLiFifidi其中为第组的下限为前组的累积次数为第组的频数为第组的组距数值型分组数据的中位数(算例)表4-2某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例10】根据右表中的数据,计算50名工人日加工零件数的中位数501621205123.21()14dM个众数(概念要点)1.集中趋势的测度值之一2.出现次数最多的变量值:一组数据分布的最高峰点3.不受极端值的影响4.可能没有众数或有几个众数众数(众数的不唯一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242计算该企业该日全部工人日产量的众数。日产量(件)工人数(人)1011121314合计70100380150100800单值型数列的众数(算例)【例11】已知某企业某日工人的日产量资料如下:数值型分组数据的众数(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下
本文标题:应用经济统计学数据整理与分析
链接地址:https://www.777doc.com/doc-1146079 .html