您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学-第4章--综合指标与数据分布特征
第四章综合指标与数据分布特征第一节总量指标第二节相对指标第三节数据分布集中趋势的测定第四节数据分布离散程度的测定第五节分布的偏度与峰度第一节总量指标一、总量指标的概念、作用和种类1、总量指标:是反映社会经济现象在一定时间、地点、条件下的总体规模或水平的统计指标。也称绝对数指标,其表现形式是绝对数。2、总量指标的作用3、总量指标的种类按反映总体内容不同:总体单位总量和总体标志总量按反映时间状态不同:时期指标和时点指标时期指标和时点指标的区别:是否连续登记、是否具有累加性、指标数值大小是否受时间长短制约。第一节总量指标二、总量指标的计量单位1、实物单位自然单位度量衡单位标准实物单位2、货币单位3、劳动单位指标类型登记方式累加性时间制约时期指标连续登记具备受时间长短制约时点指标间断登记不具备与时间间隔长短无关第二节相对指标一、相对指标的概念和作用1、相对指标:是两个有联系的指标对比计算的比率,反映事物在时间、空间、事物本身内部及不同事物之间的联系程度和对比关系,也称相对数。2、相对指标的作用二、相对指标的种类及计算方法1、结构相对指标结构相对数=(总体部分数值÷总体全部数值)×100%2、比例相对指标比例相对数=总体中某部分数值÷总体中另一部分数值第二节相对指标3、比较相对指标:同类事物不同空间的静态比较比较相对数=甲地区某一现象的水平÷乙地区同类现象的水平4、计划完成程度相对指标计划完成相对数=(实际完成数÷计划任务数)×100%5、强度相对指标:性质不同但有联系的指标对比强度相对数=某一总量指标数值÷另一有联系而性质不同的总量指标数值6、动态相对指标动态相对数=报告期指标数值÷基期指标数值第二节相对指标三、计算和运用相对指标的原则1、可比原则要求分子、分母在:内容、范围、计算方法、计算价格、计量单位等可比。2、相对指标和总量指标结合运用的原则3、相对指标和多个指标结合运用原则第三节数据分布集中趋势的测定——平均指标一、平均指标的概念及特点1、平均指标:又称平均数,指同类现象在一定时间、地点、条件下达到的一般水平。2、平均指标的特点将数量差异抽象化只能就同类现象计算能反映总体变量的集中趋势3、平均数有数值平均数和位置平均数两种数值平均数是根据数据分布中的全部标志值计算得到的,有算术平均数、调和平均数、几何平均数。位置平均数是根据数据分布中的某些标志值在总体中所处的位置来确定的,有众数、中位数。二、算术平均数算术平均数也称均值,是全部数据的算术平均。1、简单算术平均数(适用于未分组情况)例:某企业的一个生产班组有5名工人,其月工资分别为700元、750元、800元、850元、900元。则这5名工人的月平均工资为:nxnxxxxn21第三节数据分布集中趋势的测度(元)800540005900850800750700nxx2.加权算术平均数(适用于已分组情况)例:某车间有50名工人,日生产某种零件如表1所示,试求工人平均日产零件数。解:工人平均日产零件数:fxfffffxfxfxxnnn212211(件)78.1621018155219101818171516515fxfx第三节数据分布集中趋势的测度表1:日产零件加权平均数计算表第三节数据分布集中趋势的测度权数除用次数(频数)表示外,还可以用比重(频率)表示。公式如下:ffxffxffxffxxnn2211件78.1604.01920.01836.01730.01610.015ffxx例:仍以表1资料为例,采用比重计算加权算术平均数,平均每个工人日产零件数为:第三节数据分布集中趋势的测度三、调和平均数调和平均数是总体各单位变量值倒数的算术平均数的倒数,又称倒数平均数。1.简单调和平均数xnxxxnnxxxHnn111111112121第三节数据分布集中趋势的测度例:设某组5个学生的考试分数为70、80、85、90、92,则5个学生成绩的调和平均数为:)(5.820606.0592190185180170151分xnH第三节数据分布集中趋势的测度2.加权调和平均数xmmxmxmxmmmmHnnn221121例:某厂工人工资资料如表2所示,据此资料工人平均工资为:元8.8385041940102020409309300850153007801170072036002040930015300117003600xmmH第三节数据分布集中趋势的测度表2某工厂工人工资情况及平均工资计算表第三节数据分布集中趋势的测度例:已知某公司各企业产值计划完成程度及实际完成数如表3所示,则全公司计划完成程度(即各企业平均计划完成程度)为:%10510001050%115115%105840%959511584095xmmH计划任务数实际完成数平均计划完成程度第三节数据分布集中趋势的测度表3某公司所属企业产值计划完成情况及平均数计算表第三节数据分布集中趋势的测度四、几何平均数1.简单几何平均数例:某地区2002―2006年国内生产总值环比发展速度分别为108.0%、107.5%、108.3%、109.3%、109.5%,则其平均发展速度为:nnnxxxxG21%52.108%5.109%3.109%3.108%5.107%0.1085nxG第三节数据分布集中趋势的测度2.加权几何平均数例:某银行对企业的一笔十年期的投资年利率是:第1至3年是7%,第4至6年是8%,第7至9年是9%,第10年是10%。则平均年利率是:即平均年利率为8.2%。ffffffnffxxxxGnn212121%2.811.109.108.107.11333333ffxG第三节数据分布集中趋势的测度五、众数众数指总体或分布数列中,出现频数最多或出现频率最高的那个标志值。如下图:单项式数列和组距式数列的众数计算方法不同。0M第三节数据分布集中趋势的测度1.单项式数列的众数确定:统计分组以后找出出现次数最多的标志值即可。某村农民按家庭儿童人数分组家庭按儿童数分组(个/户)家庭数(户)0123440651259040合计360在这个例子中,众数就是两个儿童。第三节数据分布集中趋势的测度2.组距式数列众数的确定:先确定众数所在的组(标志值出现最多的组),然后计算以求得近似的众数值。或为:dXML2110dXMU2120下限公式上限公式第三节数据分布集中趋势的测度例:某县农民家庭按人均纯收入分组资料如表4所示,求众数。解:表4表明,人均纯收入3000―4000元组户数最多,故该组为众数组。其中,XL=3000、XU=4000、d=1000,=260-236=24,=260-223=37。按下限公式计算:按上限公式计算:即农民家庭人均收入众数为3393.44元。)(44.3393100037242430000元M)(44.3393100037243740000元M12第三节数据分布集中趋势的测度按人均纯收入额分组(元)农户数累计次数向上累计向下累计1000以下1000―20002000―30003000―40004000―50005000以上44792362602231584412335961984210001000956877641381158合计1000――表4某县农民家庭人均纯收入中位数计算表第三节数据分布集中趋势的测度3、众数的特点:•不受极端值的影响•一组数据可能没有众数或有几个众数无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242第三节数据分布集中趋势的测度六、中位数把总体各单位的标志值按大小顺序排列后,处于中点位置的标志值就是中位数。如:未分组数列和分组数列中位数的求法不同eM第三节数据分布集中趋势的测度1.未分组数列的中位数把总体各单位的标志值从小到大顺序排列。若数列有奇数项,中位数就是数列中间位次上的那个标志值。若数列有偶数项,中位数就是数列中间两个位次上标志值的平均数。例:某组有5名工人,年龄(岁)分别为34、35、36、37、38,则中点位置为,中位数为第三个工人的年龄36(岁)。如果有6名工人,年龄(岁)分别为34、35、36、37、38、39,则中点位置为,中位数为第三个工人和第四个工人年龄的简单算术平均数36.5(岁)。321521n第三节数据分布集中趋势的测度5.321621n2.分组数列的中位数单项式分组:首先确定中位数所在的组,即累计频数达到f/2,然后确定中位数的具体值。某村农民按家庭儿童人数分组f/2=360/2=180和f/2+1=360/2+1=181中位数的位置是在第180和181家庭之间。从第一组家庭户数开始向后累加至180~181户,即中位数是两个儿童。家庭按儿童数分组(个/户)家庭数(户)0123440651259040合计360第三节数据分布集中趋势的测度组距式分组数列的中位数求法(1)先确定中位数所在的组:求f/2,从第一组的总体单位数开始向后累加至f/2止(2)计算中位数的近似值:下限公式:上限公式:dfXfSMmmLe12第三节数据分布集中趋势的测度dfXfSMmmUe12例:根据表4的资料确定中位数。解:据表中资料计算:,第四组为中位数组。XL=3000XU=4000d=10=359=381按上限公式计算中位数:500210002f中点位置(元)31.3542100026035921000300021dfSfLMmme260mf1mS1mS第三节数据分布集中趋势的测度※众数、中位数、均值的关系1、对称分布:众数=中位数=均值2、右偏分布:众数中位数均值3、左偏分布:众数中位数均值左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值第三节数据分布集中趋势的测度第四节数据分布离散程度的测定—标志变异指标一、标志变异指标1、概念:是反映同质总体各单位标志值的差异程度,即数列的离散趋势的指标,又称标志变动度。2、作用:衡量平均指标的代表性反映社会经济活动过程的均衡性标志变异指标是统计分析的一个基本指标3、种类:全距、四分位差、平均差、标准差、离散系数二、全距R1、定义:全距也称极差,是一组数据的最大值与最小值之差,是离散程度的最简单测度值。2、计算:未分组数据:R=最大值-最小值分组数据:R=最大组上限-最小组下限3、特点:计算方便,便于理解易受极端值影响未考虑数据的分布第四节数据分布离散程度的测定三、四分位差IQR1、定义:四分位差也称内距或修正极差,是上四分位数与下四分位数之差。2、计算:内距=上四分位数–下四分位数=Q3–Q13、特点:反映了中间50%数据的离散程度不值受极端的影响,可以衡量中位数的代表性高低第四节数据分布离散程度的测定第四节数据分布离散程度的测定四、平均差A.D.1、定义:平均差是数列中各单位标志值与平均数之差绝对值的平均数。2、计算:未分组数据:分组数据:3、特点:全面反映标志值的差异程度不适合代数方法的演算使其使用受到限制nXXDA..ffXXDA..五、方差和标准差1、定义:方差是总体各单位某一数量标志的标志值与其算术平均数的离差平方的平均数。方差的平方根为标准差,又称均方差。2、计算:总体方差与标准差样本方差与标准差3、特点:离散程度的最常用的测度值之一反映了各变量值与均值的平均差异第四节数据分布离散程度的测定总体方差和标准差(PopulationvarianceandStandarddeviation)未分组数据
本文标题:统计学-第4章--综合指标与数据分布特征
链接地址:https://www.777doc.com/doc-6193267 .html