您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 统计-第四章-平均指标
第四章集中趋势测量法统计分析首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。主要内容算术平均数中位数众数几何平均数和调和平均数下面是一个小故事:一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?挠头的数值公司员工的月薪如下:员工经理副经理职员A职员B职员C职员D职员E职员F职员G月薪(元)60004000170013001200110011001100500我们有三种方法选择集中趋势:(1)根据频数:哪个变量值出现次数越多,就选择哪个变量值,比如民主决策的表决机制。(2)根据居中:比如一个城镇居民的生活水平,居中的是小康家庭,那么就用小康家庭来代表该城镇的生活水平。(3)根据平均:用平均数来代表变量的平均水平。关于集中趋势的一个故事吉斯莫先生有一个小工厂,生产超级小玩意儿。管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。现在吉斯莫先生正在接见萨姆,谈工作问题。吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。萨姆:每周100元又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。萨姆:好,现在我可懂了。我……我辞职!集中趋势:一组数据向其中心值靠拢的倾向和集中程度;测度集中趋势就是寻找数据一般水平的代表值或者中心值;不同类型的数据用不同类型的集中趋势测度值;定类数据:众数;定序数据:中位数;定比和定距数据:均值低层次数据集中趋势的测度适合于高层次数据,但是高层次的不能降序处理平均指标平均指标就是表明同质总体在一定条件下某一数量标志所达到的一般水平。平均指标把总体各单位之间的差异加以抽象概括,其中个别标志值的偶然性被相互抵消,从而反映出总体分布的集中趋势。1.同质性,即总体内各单位的性质是相同的,如果各单位性质上存在着差异,就不能计算平均数。2.抽象性,即总体内各同质单位虽然存在数量差异,但在计算平均数时并不考虑这种差异,即把这种差异平均掉了。3.代表性,即尽管各总体单位的标志值大小不一,但我们可以用平均数这一指标值来代表总体一般水平。平均指标具有三个特点:可以用来比较同类现象在不同地区、部门、单位(即不同总体)发展的一般水平,用以说明经济发展的高低和工作质量的好坏。可以用来对同一总体某一现象在不同时期上进行比较,以反映该现象的发展趋势或规律。–如对同一地区人均年收入逐年进行比较来反映该地区居民生活水平的发展趋势或规律。可以用来分析现象之间的依存关系。–例如,分析施肥量和农作物的平均变量的依存关系;劳动生产率和平均单位成本间的依存关系。可以估算和推算其他有关数字平均指标的作用第一节算术平均数(MEAN)用总体标志总量除以总体单位数即得算术平均数(Arithematicmean)。通常表示为算术平均数是反映集中趋势最常用、最基本的平均指标,也被称为均值。它只适用于定距以上的变量。X例:某小区350户家庭共有居民1190人。在这个例子中,家庭总数350户是总体单位数,居民总数1190人是该总体的标志总量。根据算术平均数的定义户均人口==3.4(人)35011901.对于未分组资料(简单算术平均数)注意:对求和符号,此时流动脚标的变动范围是1,2,3,…,N,N是总体单位数。[例]求74、85、69、91、87、74、69这些数字的算术平均数。[解]==78.4NXXNXX7697487916985742.对于分组资料(加权算术平均数)注意:对求和符号,此时流动脚标的变动范围1,2,3…,n,n是组数,而不是总体单位数。很显然,算术平均数不仅受各变量值(X)大小的影响,而且受各组单位数(频数)的影响。由于对于总体的影响要由频数(f)大小所决定,所以f也被称为权数。PXffXX权数对均值的影响:甲乙两组各有10名学生,他们的考试成绩以及人数分布情况如下:甲组考试成绩(X):020100人数分布(F):118乙组考试成绩(X):020100人数分布(F):811分别计算出平均值?考察权数对于均值的影响。[例]求下表(单项数列)所示数据的算术平均数。人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00XPX对于组距数列,要用每一组的组中值权充该组统一的变量值。[例]求下表所示数据的的算术平均数fXfX间距频数(f)组中值(X)148―152152―156156―160160―164164―168168―172172―176176―180180―184184―188188―192192―19612510192517125301150154158162166170174178182186190194合计100——算术平均数练习题:1、某单位年终有40名职工获得技术创新奖,奖金的分配情况如右,求40名职工的平均奖金额?奖金额(X)人数50004200016100020合计40算术平均数练习题:2、某企业职工1500人的工资状况统计如右表,试求出该企业职工的月平均工资?月工资(X)职工人数(f)500-10001001000-15004001500-20008002000-2500200算术平均数的性质:(1)各变量值与算术平均数的离差之和等于0,–即∑(X-平均数)=0或者∑f(X-平均数)=0;变量值正负离差大致相等;(2)各变量值对算术平均数的离差的平方和,小于它们对任何其他数(X’)偏差的平方和。–各变量值与算术平均数的离差的平方和为最小值————最小平方性质;(3)算术平均数受抽样变动影响微小,通常它是总体资料集中趋势的最佳度量;(4)算术平均数受极端值的影响颇大,遇到这种情况时,就不宜用它代表集中趋势了;(如:平均工资)(5)分组资料如果遇到开放组距时,不经过特殊处理将无法得到算术平均数;(6)用于数值型数据,不能用于定类数据和定序数据;算术平均数的应用1、先进平均数运用算术平均方法,计算先进平均数,可为部门、企业管理中制定各类平均先进定额提供基础数据。一群数据的算术平均数,将该群分为两部分:一部分是优于算术平均数的数据,另一部分是差于算术平均数的数据。就优于算术平均数的数据,再计算一个新的算术平均数,即为先进平均数。计算步骤1、计算一般算术平均数(总平均数)2、计算优于一般平均数的变量值的平均数。例子件数工人数X(组中值)6—8678—1010910—12171112—14813根据表中的数据,计算先进平均数。1、计算一般算术平均数2、根据平均值再分组:10-10.4;10.4-123、计算组中值:(10.4+12)/2=11.24、假设组中的数据均匀分布,采用按比例均摊的方法,推算出10.4-12这一组中工人数=(12-10.4)/(12-10)*17=145、计算先进平均数:67109171181310.440X11.21413811.85148XfXf2、交替标志平均数1、概念:交替标志又称是非标志,它是一个只有两种答案的标志。–如:性别只有男、女;一批产品只有合格品、不合格品等就可用是非标志来反映。2、表示形式:1:具有某种属性的单位标志值。0:不具有某种属性的单位标志值。N:全部总体单位数。N1:具有某种属性的总体单位数。N2:不具有某种属性的总体单位数。P=N1/N:具有某种属性的单位数所占的比重。Q=N2/N:不具有某种属性的单位数所占的比重。其中:P+Q=110pxfPQxPfPQ例子比率(%)X合格品95(p)1不合格品5(q)0合计100—某工厂某一批产品的合格情况1950595%100XfXf平均数即为合格率第二节中位数(Median)把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,用Md表示。Md可用于定序、定距、定比资料。1.对未分组资料•先把所有数据按大小顺序排列,•如果总体单位数为奇数,则取第(N+1)/2位上的变量值为中位数;•如果总体单位数为偶数。因为居中的数值不存在,按惯例,取第N/2位和第N/2+1位上的两个变量值的平均作为中位数。例题求下列两数列的中位数A:3678101314B:367810131416求54,65,78,66,43这些数字的中位数。求54,65,78,66,43,38这些数字的中位数。你会吗?练习题2.对于分组资料(1)单项数列根据N/2在累计频数分布中找到中位数所在组,该组变量值就是Md。中位数(2)组距数列按中位数所在组的下限:按中位数所在组的上限:当根据组距数列求中位数时,要采用所谓的比例插值法:先根据N/2在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方法求出中位数(注意:此处用的是向上累计)。[例]某年级学生身高如下,求中位数[解]第一种方法=168+×6=170.29(厘米)100/23734请你用第二种方法来做一下3.中位数的性质•(1)各变量值对中位数之差的绝对值总和,小于它们对任何其他数的绝对值总和。•(2)中位数不受极端值的影响。•(3)分组资料有不确定组距时,仍可求得中位数。•不涉及到组中值,•仅仅是根据所在组(中间位置的)的上限、下限、组距求得,•与其它是没有关系的;•(4)中位数受抽样变动的影响较算术平均数略大。第三节众数(Mode)众数是在一组资料中,出现次数(或频数)呈现出“峰”值的那些变量值,用Mo表示。众数只与次数有关,可以用于定类、定序、定距、定比资料。1.对于未分组资料直接观察首先,将所有数据顺序排列;然后,只要观察到某些变量值(与相邻变量值相比较)出现的次数(或频数)呈现“峰”值,这些变量值就是众数。2.对于分组资料单项式:观察频数分布(或频率分布)组距式:找出频数最高的一组L为众数组下限;Δ1为众数组频数与前一组频数之差;Δ2为众数组频数与后一组频数之差;ho为众数组组距。人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00求下表中的众数众数例现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:如何计算众数?耐用时间产品个数(个)600以下84600-800161800-10002441000-12001571200-1400361400以上18合计700计算101221283800200897.658387871000200897.658387oooMLhMUh===(小时)或者:==(小时)1众数位于第三组L=800U=1000h=1000-800=200=244-161=83=244-157=872也可以作图求解众数方法:即先画相邻三组次数分布直方图,然后连接相邻两组次数差的对角线,再以对角线的交点向x轴引一条垂线,它与X轴的交点即为众数.也可以作图求解众数050100150200250300600以下600-800800-10001000-12001200-14001400以上耐用时间产品个数
本文标题:统计-第四章-平均指标
链接地址:https://www.777doc.com/doc-1845570 .html