您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 数据的描述性分析(1)
§4数据的描述性分析数据分布的特征:数据分布的集中趋势数据分布的离散程度平均指标变异指标数据分布的形状偏态与峰度1.一组数据向其中心值靠拢的倾向和程度。2.测度集中趋势就是寻找数据一般水平的代表值或中心值。3.不同类型的数据适用不同的集中趋势测度值(平均指标)。集中趋势(Centraltendency)的描述数据集中区变量x平均指标平均指标的种类按所反映的时间状态划分静态平均数动态平均数按计算方法划分算术平均数调和平均数几何平均数众数中位数数值平均数位置平均数算术平均数(Arithmeticmean)变量值个数各变量值之和算术平均数(均值)nxnxxxxxnin1321...简单算术平均数(Simplemean)——依据未分组的原始数据直接计算X1、X2、X3、Xn表示总体各单位变量值;n表示总体单位数(或总体变量值个数);Σ为求和(连加)符号;Xnix1表示从X1连加到Xn;也可简写成ΣXi或ΣX。式中:表示算术平均数(读作X-bar);某大学生职业介绍所对商学院的毕业生进行问卷调查,获得12名毕业生的起始薪金(元)信息如下。23502450255023802255221023902630244028252420238024401229280122380235012121iixxfxfffffxfxfxxnnn......212211加权算术平均数(Weightedmean)——原始数据经过分组,已编成次数分布数列式中:f——各组次数。X——当分布数列为单项数列时,即各组变量值。——当分布数列为组距数列时,用各组组中值代表各组变量值。工人按日产量分组/件(X)工人人数(f)Xf20120214842261322381842412288251025026718227254合计50119488.23501194fxfx按月平均工资分组(元)职工人数(f)320~3603360~4007400~44013440~4805480~5202合计30组中值(x)340380420460500——x·f102026605460230010001244067.4143012440fxfx男生女生录取人数未录取人数350450200400报考人数800600表1.某高校报考及录取情况统计表表2.某高校两专业报考及录取情况统计表工程系财经系男生女生男生女生录取人数未录取人数30030010010050150100300报考人数600200200400加权算术平均数受两个因素的影响分布数列中各组变量值的大小(或组中值的大小)各组中单位数的多少/次数f的大小当各组变量值固定不变时,出现次数多的变量值对平均数的影响较大,使平均数向其靠拢;出现次数少的变量值对平均数的影响较小,平均数远离该变量值。次数f在计算平均数的过程中起着权衡轻重的作用,故将其称为权数。权数的两种表现形式以绝对数表示——次数/频数f以相对数表示——频率f/∑fffxffxffxffxxnn......221.1fxfffffxfxfxxnnn......212211工人按日产量分组/件(X)每组工人数占总人数的比重(f/∑f)x·f/∑f200.020.40210.081.68220.122.64230.163.68240.245.76250.205.00260.143.64270.041.08合计1.0023.8888.23.ffxx算术平均数的权数客观权数次数分布数列中,各组变量值出现的次数或频率;与变量存在直接数量关系的指标主观权数某公司利润情况统计表利润率分公司数(个)职工人数(人)销售额(万元)5%以下5%~10%10%~15%15%以上289120050060012030050008000400合计20142013700%60.10137004005.178000%5.125000%5.7300%5.2X要求:计算该公司的平均利润率。算术平均数的数学性质各变量值与其算术平均数的离差之和为零。各变量值与其算术平均数的离差平方和最小。N10)(iiXXN12min)(iiXX算术平均数的特点易于理解和运算受极端数值的影响较大例如:有5个数,分别为:9、11、12、13、55,205551312119x解决途径:切尾平均法(trimmedmean)采用其他不受极端值影响的平均数市场上有三种苹果,每公斤的价格分别为3.00元、3.60元、4.00元,分别在下述情况下求平均价格:(1)三种苹果各购买1公斤;(2)三种苹果分别购买1公斤、2公斤、3公斤;(3)三种苹果各购买1元钱。(保留小数点后两位数)公斤元/53.3346.33)1(公斤元/7.362.223213426.313)2(公斤元/48.386.03416.31313)3(调和平均数(Harmonicmean)一、含义:调和平均数是变量值(标志值)倒数的算术平均数的倒数,也称倒数平均数。——变量值不能为零。——受极端数值的影响。三、计算方法简单调和平均法加权调和平均法四、应用二、特点:简单调和平均数(Simpleharmonicmean)——依据未分组的原始数据直接计算xnxxxnnxxxHnn111111112121即先计算总体中各变量值倒数的简单算术平均数,然后求其倒数。mxmmxmxmxmmmmmmmxmxmxHnnnnnn11111111221121212211加权调和平均数(Weightedharmonicmean)——原始数据经过分组,已编成次数分布数列例(4)若三种苹果分别购买7.5元、10.8元、16元,求其平均价格。H=(7.5+10.8+16)/(7.5/3+10.8/3.6+16/4)=34.3/9.5=3.61元/公斤市场批发价X(元/公斤)成交量(公斤)甲0.7020000乙0.6830000丙0.7410000公斤元/697.0600004180003000020000100001000074.068.03000070.020000fxfx例:某市有三个西瓜的批发交易市场,三个市场某日西瓜的批发价格和成交量如下:要求计算该市这天西瓜的平均价格。f市场批发价X(元/公斤)成交额(元)甲0.7014000乙0.6820400丙0.747400例:某市有三个西瓜的批发交易市场,三个市场某日西瓜的批发价格和成交额如下:要求计算该市这天西瓜的平均价格。mxmH1公斤元/697.074.0740068.02040070.01400074002040014000mmxmH1xfxfxfxxf1m=x·f调和平均数是算术平均数的变形。调和平均数的应用用于计算相对数的平均数。工厂计划完成程度(%)x计划产值(万元)甲951200乙10512800丙1152000例:某工业公司有三个工厂,已知其计划完成程度及计划产值资料如下:要求计算该公司的平均计划完成程度。%5.10520001280012002000%11512800%1051200%95平均计划完成程度=总实际产值/总计划产值f工厂计划完成程度(%)x实际产值(万元)甲951140乙10513440丙1152300例:某工业公司有三个工厂,已知其计划完成程度及实际产值资料如下:要求计算该公司的平均计划完成程度。%5.105%1152300%10513440%9511402300134401140平均计划完成程度m如何选择平均数的计算方法?关键以基本公式为依据当所掌握的是公式中的分母资料,就将其作为权数,采用加权算术平均法;当所掌握的是公式中的分子资料,就将其作为权数,采用加权调和平均法。销售额流通费流通费用率销售量销售额价格原来只是计算时使用了不同的数据!几何平均数(Geometricmean)一、应用它主要用于计算社会经济现象的平均比率或平均速度。凡是各变量值的连乘积等于事物总量,应使用几何平均法求其平均数。例:某钢铁厂第一年的钢产量为100万吨,第二年为110万吨,比第一年增产10%,第三年又比第二年增长了20%,达到132万吨。发展总速度=110%×120%=132%%110100110%120110132%132100132几何平均数是n个变量值乘积的n次方根。简单几何平均数的计算——未分组资料式中,G——几何平均数;x——变量值;∏——连乘符号nnnxxxxG21二、计算例:x1=110%x2=120%%89.1142.11.1%120%110G100×114.89%×114.89%=132万吨若采用算术平均法求平均发展速度:100×115%×115%=132.25万吨算术平均数与调和平均数是应用于按算术级数形式变化的事物,即在事物总量等于各变量值的总和时求平均水平。%1152%120%110x几何平均数适用于按几何级数形式变化的事物,即在事物总量等于各变量值乘积时求平均水平。加权几何平均数的计算——分组资料ffffffnffxxxxGnn212121f——各变量出现的次数三、几何平均数的特点2、几何平均数是算术平均数的变形。1、用以计算几何平均数的各变量值必须大于零,否则不能计算几何平均数或计算的结果无意义。例:某银行在10年内几次调整贷款利率(按复利计息),第1至第2年为4%,第3至第5年为5%,第6至第9年为6.5%,第10年为8%。求这10年银行贷款的平均年利率。0569.17396.108.1065.105.104.11010432G平均年利率=105.69%-100%=5.69%简单几何平均数:nnxxxG21nxxxxnGnlg)lglg(lg1lg21∴简单几何平均数的对数是各个变量值对数的简单算术平均。加权几何平均数:nnffffnffxxxG212121fxffffxfxfxfGnnnlglglglglg212211∴加权几何平均数的对数是各个变量值对数的加权算术平均。中位数(Median)将总体各单位的变量值按大小顺序排列,处于数列中点位置的变量值为中位数。二、中位数的特点一、确定中位数Me的方法由未分组的原始数据确定中位数由单项式数列确定中位数由组距数列确定中位数Me50%50%由未分组的原始数据确定中位数中位数位置=21nn——总体变量值个数当n为奇数时,中间位置所对应的数值即为中位数。当n为偶数时,居于中间位置的两个数值的算术平均数为中位数。例:有5个工人,每天生产某产品的件数,按序排列如下:20,23,26,29,30中位数位置=(5+1)/2=3Me=26(件)例:有6个工人,每天生产某产品的件数,按序排列如下:20,23,26,29,30,32中位数位置=(6+1)/2=3.5Me=(26+29)/2=27.5(件)由单项式数列确定中位数求中位数的位次、用公式21f2、计算各组的累计次数(较小制累计或较大制累计)累计次数刚刚超过中位数位次的组即为中位数所在组。3、中位数所在组的变量值即为中位数按日产量分组(件)工人数(人)较小制累计次数较大制累计次数26313234364131014271883132754728080776753268合计80——中位数位次=80/2=40中位数所在组的累计次数应刚刚超过40,即第四组。∴Me=34例:某工厂工人某日产量资料如下,要求其中位数。由组距数列确定中位数求中位数的位次、用公式21f2、计算各组的累计次数(较小制累计或较大制累计)累计次数刚刚超过中位数位次的组即为中位数所在组。3、利用公式计算中位数的近似值iffLMemsm12L
本文标题:数据的描述性分析(1)
链接地址:https://www.777doc.com/doc-3981463 .html