您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第四章 数据分布特征描述
第四章数据分布特征的描述描述数据分布特征的指标主要有三大类:一是描述数据分布集中趋势的指标;二是描述数据分布离散程度的指标;三是描述分布偏斜程度的指标。统计指标的分类总量指标(绝对数)—数量指标相对指标(相对数)—质量指标平均指标(平均数)—质量指标绝对数。现象的规模、水平一般以绝对数形式表现。相对数。相对数由两个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。平均数。平均数反映现象总体的一般水平或分布的集中趋势。第一节总量指标和相对指标一、总量指标(一)总量指标的概念和作用总量指标是反映现象在具体时间、地点、条件下的总规模或总水平的统计指标。总量指标也称为绝对指标或绝对数。总量指标在社会经济统计中的作用:①可以反映社会经济和企业的基本情况,反映一个国家的基本国情和国力。②它是计算相对指标、平均指标等描述指标的基础。③是制定政策、编制计划、实行社会经济管理的基本依据。(二)总量指标的种类1、总量指标按其反映的时间状况不同,分为时期指标和时点指标。•时期指标反映现象在某一时期发展过程的总数量;•时点指标则反映现象在某一时刻上的状况总量。2、总量指标按计量单位不同,分为实物量指标、价值量指标和劳动量指标。•实物量指标是以所反映现象的实物单位为计量单位的总量指标;•价值量指标是以货币为计量单位的总量指标;•劳动量指标是以劳动时间为计量单位的总量指标。•时期指标和时点指标的不同特点:①时期指标的数值是连续计数的;时点指标的数值则是间断计数的。②时期指标具有累加性;时点指标则不具有。③时期指标数值的大小受时期长短的制约;时点指标数值的大小与时点的间隔长短无直接关系。二、相对指标(一)相对指标的概念和作用相对指标又称相对数,它是两个有联系的指标数值对比的结果。注:用来对比的两个数既可以是绝对数,也可以是平均数和相对数。•相对指标的主要作用:①能具体表明社会经济现象之间的比例关系。②能使一些不能直接对比的事物找出共同比较的基础。③相对指标便于记忆、易于保密。相对指标的表现形式:有名数、无名数。有名数是将对比的分子指标和分母指标的计量单位结合起来使用。无名数是一种抽象化的数值,一般分为系数、倍数、成数、百分数、千分数等。(二)相对指标的种类和计算方法相对指标通常分为:结构相对指标、比例相对指标、比较相对指标、计划完成相对指标、强度相对指标和动态相对指标。1、结构相对指标计算各组总量占总体或样本总量的比重,用以反映总体或样本结构状况的综合指标。%100总体(样本)总量各组总量结构相对数•1、结构相对指标①可以反映总体内部结构的特征。②通过不同时期相对数的变动,可以看出事物的变化过程及其发展趋势。③结构相对数一般用百分数表示。④各组结构相对数之和等于100%或1。例:我国规模以上工业增加值的轻重工业构成表轻重工业2006年2007年工业增加值/亿元比重%工业增加值/亿元比重%轻工业2431430.492827729.90重工业5543869.516630470.10合计79752100.0094581100.00•2、比例相对指标总体中另一部分数值总体中某部分数值比例相对数比例相对数是总体或样本中不同部分加以对比,用以反映总体或样本内部的比例关系和协调关系的综合指标。例:我国规模以上工业增加值的轻重工业构成表(2007年)轻重工业工业增加值/亿元比重%以轻工业增加值为100%轻工业2827729.90100.00重工业6630470.10234.48合计94581100.00——•3、比较相对指标%100数值另一条件下的同类指标值某条件下的某类指标数比较相对数反映某一现象在同一时期内或同一时点上不同空间下的不平衡程度的综合指标。比较相对数可以是两个总量指标对比,也可以是相对指标或平均指标对比。•4、计划完成相对数%100计划数实际完成数计划完成相对数%100计划完成百分比实际完成百分比计划完成相对数%100555年计划规定的末年水平水平年计划末年实际达到的年计划完成程度%100555年计划规定的累计数成数年计划期间实际累计完年计划完成程度长期计划的检查:•5、强度相对指标的总量指标数值另一有联系而性质不同某一总量指标数值强度相对数概念:是性质不同但又有内在联系的两个绝对指标的对比,是用以反映某现象的强度、密度或普遍程度的综合指标。强度相对数的两种表示方法:(1)一般用无名数表示。(2)少数用百分数或千分数表示。注:强度相对数不是平均数,不是同类指标数值之比。•例:(正指标)某地人口数(千人)某地零售商业机构数商业网点密度(逆指标)某地零售商业机构数某地人口数(千人)表现社会服务能力的强度相对数是用服务单位数与人口比较。表现现象普遍成都的强度相对数,如人口密度、公路网密度等。)初年末人口平均数计算全国人口数(一般按年品的全国产量某一主要工业品或农产人均产量•6、动态相对指标%100基期水平报告期水平动态相对数概念:是不同时期同一指标数值之比,用以反映现象在不同时期发展变化程度的综合指标。动态相对数的计算结果用百分数或倍数表示。例:我国2001-2007年若干统计指标资料指标2001年2002年2003年2004年2005年2006年2007年国内生产总值(亿元)109655120333135823159878183218211924249530年末总人口数(万人)127627128453129227129988130756131448132129人均国内生产总值(元)862293981054212336140531616518934第三产业占国内生产总值比重%40.541.541.240.440.140.040.1相对指标的种类和计算方法相对指标计算方法结构相对指标总体中部分数值/全部数值比例相对指标总体中A部分数值/B部分数值比较相对指标甲地某指标数值/乙地同一指标数值计划完成程度指标实际数/计划数强度相对指标某一指标数值/同期另一有联系的指标数值动态相对指标报告期水平/基期水平数据分布的特征描述数据分布的特征:一、集中趋势:反映数据向其中心靠拢或聚集程度;二、离散趋势:数据远离中心的趋势;三、偏态和峰态:偏态是对数据分布对称性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。数据分布的特征集中趋势(平均指标)(位置)离散趋势(变异指标)(分散程度)偏态和峰度(形状)数据分布的特征和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均数离散系数方差和标准差四分位差偏态峰度数据的特征和测度集中趋势离散程度第二节平均指标数据分布集中程度的描述指标1.概念–也称平均指标或平均数。用来反映标志值的典型水平或标志值分布的中心位置或集中趋势2.作用反映变量分布的集中趋势和一般水平。可用来比较同一总体在不同空间的发展水平可用来分析现象之间的依存关系是统计推断中一个重要的统计量。第二节平均指标集中趋势(centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测量集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值集中趋势指标的分类•数值平均数–算术平均数–调和平均数–几何平均数•位置平均数–众数–中位数及其他分位数•一、算术平均数变量值个数变量值总和算术平均数算术平均数的基本公式(最基本指标):分为:简单算术平均数:加权算术平均数:nxxfxfx(一)简单算术平均数–把每项数据直接加总后除以它们的项数–通常用于对未分组的数据计算算术平均数–计算公式:Xi代表变量,代表算数平均数,n变量值个数,∑求和xnxnxnxxxxniin121...表3-2年龄人数(人)xf2242510305501合计20表3-1男性女性2222222225252525252525252525303030305030例题:采用简单算术平均法计算,即全体队员的平均年龄为(单位:周岁):若采用简单平均:•分组数据不能简单平均!因为各组变量值的次数不等!9.26205382030...225030302525252525222275.31450302522(二)加权算术平均数•加权算术平均数的计算公式:加权—为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(fi).fxfffxffffxfxfxxniiniiinnn11212211......(二)加权算术平均数设分组后各组的变量值或组中值为:x1,x2,…,xn相应的频数为:f1,f2,…,fn正确的计算是:9.2620538151041505301025422x[例]表某班级40名同学统计学原始成绩(单位:分)64707875308977.234040X简单算术平均数算式:表40名同学统计学成绩汇总表(单位:分)加权算术平均数算式:11306076.540KiiiKiixfxf55×2+65×8+75×16+85×10+95×4=3060权数(fi,也称权重)•权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。•可以是绝对数形式,也可以是比重形式(如频率)表示。事实上比重权数更能够直接表明权数权衡轻重作用•当权数完全相等(f1=f2=…=fn)时,加权算术平均数就成了简单算术平均数。ffxx•一种是以绝对数表示,称次数或频数f;•另一种是以比重表示,称频率。•用频率计算的公式和直接用次数计算的公式在内容上是相等的,即ffXXffXfXf变量数列的权数有两种形式:(三)算术平均数的数学性质0)(XX0)(fXX1、各个变量值与算术平均数的离差之和等于零。2、各个变量值与算术平均数的离差平方之和等于最小值。最小值2)(XX最小值fXX2)(•算术平均数有两点不足:1、算术平均数易受极端变量值的影响,使的代表性变小,而且受极大值的影响大于受极小值的影响。2、当组距数列为开口组时,由于组中值不易确定,使的代表性也不很可靠。XX二、调和平均数•1.集中趋势的测度值之一;•2.算术平均数的另一种表现形式;•3.易受极端值的影响;•4.有简单调和平均数和加权调和平均数。原来只是计算时使用了倒数XnXh1fXfXh1调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。简单调和平均数和加权调和平均数二、调和平均数【例】速度x(里/小时)行走里程m所需时间m/x2011/201522/151033/10合计61/20+2/15+3/10)(2912126103152201小时里平均速度1、简单调和平均数应用条件:资料未分组,各变量值次数都是1。x1x1x1x1x1nnHn321)(31132201101小时里计算公式:举例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为:2、加权调和平均数xmnn3322xmn321mxmxmxmmmmmH11应用条件:资料经过分组,各组次数不同。计算公式:3、调和平均数特点:①如果数列中有一标志值等于零,则无法计算;②它作为一种数值平均数,受所有标志值的影响,它受极小值的影响大于受极大值的影响,但较之算术平均数,受极端值的影响要小。hXhX三、几何平均数nnnGXXXXX21概念:几何平均数又称“对数平均数”,它是若干项变量值连乘积开其项数次方的算术根。(一)简单几何平均数在实际工作中,常用即几何平均数是各个变量值对数的算术平均数的反对数。XnXXXXnXnnGlg1)lglglg(lg1lg121表6某工业产品产量平均发展速度计算表年份产品产量(亿吨)逐年发展速度(X)(各年产量为前一年的%)逐年发展速度的
本文标题:第四章 数据分布特征描述
链接地址:https://www.777doc.com/doc-3135741 .html