您好,欢迎访问三七文档
第4章描述性统计(统计数据的描述)主要内容一、数据分布的集中趋势描述二、数据分布的离散程度描述三、数据分布形态描述第一节统计分布的集中趋势描述一组数据向某一中心值靠拢的倾向;通常用平均指标反映;集中趋势集中趋势指标:反映数据分布一般水平的代表值或中心值平均数数值平均数位置平均数算术平均数几何平均数中位数众数(一)概念一组数据相加后除以数据的个数一、平均数(均值)1、算术平均数(二)类型总体各单位变量值之和与总体单位个数之比。变量值之和算术平均数变量值个数(1)简单算术平均数——适用于总体资料未分组整理、尚为原始资料的情况NXNXXXXNiiN121式中:为算术平均数;为总体单位总数;为第i个单位的标志值。iXNX算术平均数的计算方法平均每人日销售额:元558527905440750480600520NXX某售货小组5个人,某天销售额分别为520元、600元、480元、750元、440元,则【例】(2)加权算术平均数——适用于总体资料经过分组整理形成变量数列的情况miimiiimmmffXffffXfXfXX11212211式中:为算术平均数;为第组的频数;为组数;为第组的标志值或组中值。XiXifimi【例4-2】某企业电子产品加工车间的50名工人的日加工零件数如表:日产量(件)工人人数(人)202122232451010205合计50Xf计算该车间工人的平均加工零件数。iXif件)(2.225011105552452011miimiiiffXX解:若资料为组距数列,则取各组组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。说明A、根据单项分组的数据资料计算表4-2某公司日平均销售量计算表按日销售量分组组中值(Xi)天数(Fi)XiFi150~160160~170170~180180~190190~2001551651751851951025352551550412561254625975合计—10017400【例4.3】某电脑公司销售量的数据资料如下表第一、三栏所示,计算计算该公司日平均销售量。B、根据组距分组的数据资料计算(台)1741001740011KiiKiiiFFXX加权均值(权数对均值的影响)甲乙两组各10名学生,他们考试成绩及其分布数据如下甲组:考试成绩(X):020100人数分布(F):118乙组:考试成绩(X):020100人数分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)表现为次数、频数、单位数;即公式中的fXfXf表现为频率、比重;即公式中的ffXfXfXff变量数列中,各组标志值出现的次数。反映各组的标志值对平均数的影响程度权数绝对权数相对权数C、频率为权数的加权算术平均数【例4.4】以例4.3的数据资料为例,用频率作为权数计算计算该公司日平均销售量。表4-3某公司日平均销售量计算表按日销售量分组组中值(Xi)天数(Fi)Fi/ΣFi150~160160~170170~180180~190190~2001551651751851951025352550.100.250.350.250.05合计—1001.00(台)17411KiiiKiiFFXX(3)算术平均数优点和局限(1)确定严密,有确切定义和严密计算公式,每组数据只有一个平均数优点(2)反应灵敏。能反映每个数据的变化(3)简明易解。概念简单明白,计算简单局限(1)易受极端数据影响(2)有模糊不清数据时无法计算n个变量值乘积的n次方根;计算现象的平均比率或平均速度;nniiNNGxxxxx1212、几何平均数——适用于总体资料未经分组整理,尚为原始资料,且每个比率或每个速度已知的情况式中:为几何平均数;为变量值的个数;为各个标志值。iixnGxnininnGxxxxx121A.简单几何平均数【例4-9】某流水生产线有前后衔接五道工序。某日各工序产品合格率分别为95﹪、92﹪、90﹪、85﹪、80﹪,求整个流水生产线产品平均合格率。分析:设最初投产100A个单位,则第一道工序的合格品为100A×0.95;第二道工序的合格品为(100A×0.95)×0.92;……第五道工序的合格品为(100A×0.95×0.92×0.90×0.85)×0.80;该流水线最终合格品即为第五道工序的合格品,故该流水线总合格品为100A×0.95×0.92×0.90×0.85×0.80;则该流水线产品总合格率为:80.085.090.092.095.0100A80.085.090.092.00.95100A总产品总合格品即该流水线总合格率等于各工序合格率连乘积,符合几何平均数适用条件,采用几何平均法。﹪解:24.885349.080.085.090.092.095.055GX思考若上题由五个独立作业车间,各车间合格率同前,又假定各车间产量相等均为100件,求该企业的平均合格率。几何平均数的计算方法各车间彼此独立作业,有第一车间合格品:100×0.95第二车间合格品:100×0.92……第五车间合格品:100×0.80则该企业全部合格品应为各车间合格品总和,即总合格品=100×0.95+……+100×0.80几何平均数的计算分析:不再符合几何平均数适用条件,需按求解比值的平均数方法计算。﹪4.8850044210010010080.010095.0fXfXfmX产品合格品合格率采用加权算术平均数计算,即B.加权几何平均数——适用于总体资料经过分组整理,形成变量数列的情况式中:为几何平均数;为第组的次数;为组数;为第组的标志值或组中值。GxiXifininiiimiinfnififfnffGxxxxx1121121【例4-10】某金融机构以复利计息。近12年来年利率有4年3﹪,2年5﹪,2年8﹪,3年10﹪,1年15﹪。求平均年利率。设本金为V,则至各年末的本利和应为:第1年末的本利和:﹪31V﹪﹪3131V第2年末的本利和:………………﹪﹪﹪﹪﹪1511018151313224V第12年末的本利和:分析:第2年的计息基础第12年的计息基础15.010.05130.01V15.010.05130.01V2424本金总的本利和该笔本金12年总的本利率为:即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。﹪﹪平均年利率﹪85.6185.106185.1062154.215.0105.0103.011212424GGXX解:标志值连乘等于总比率或总速度的现象,都可以用几何平均数计算平均比率和速度。局限:1、数据分布中有一个标志值为0或负数,无法计算2、受极端值影响几何平均数的优点和局限某系83名女生身高资料(按序排列)次序统计量的概念身高人数(CM)(人)152115421552156415711582159216012161716281634身高人数(CM)(人)1643165816651673168716911705171217231741总计83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174将变量值按顺序排列,当反映分布集中趋势的度量值仅由数列中某个位置的值确定时,这个值就称为次序统计量,也称为位置平均数。位置平均数不需要依据每一个变量值来计算。二、中位数某系83名女生身高资料(按序排列)次序统计量的概念身高人数(CM)(人)152115421552156415711582159216012161716281634身高人数(CM)(人)1643165816651673168716911705171217231741总计83将变量值按顺序排列,当反映分布集中趋势的度量值仅由数列中某个位置的值确定时,这个值就称为次序统计量,也称为位置平均数。位置平均数不需要依据每一个变量值来计算。152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174数列中点的值即第42个值将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用Me表示中位数不受极端数值影响总体标志值差异很大时,具有较强的代表性中位数的优点位置平均数(次序统计量)中位数把标志值数列分为两部分,一部分标志值小于或等于它,另一部分标志值大于或等于它中位数的位次为:321521N即第3个单位的标志值就是中位数元520eM【例4】某售货小组5人,某天销售额按从小到大顺序排列为440元、480元、520元、600元、750元,则中位数的计算(1)未分组资料中位数的位次为5.321621N中位数应为第3和第4个单位标志值的算术平均数,即元5602600520eM【例4-11B】若上述售货小组6个人,某天销售额按从小到大顺序排列为440元、480元、520元、600元、750元、760元,则,为偶数,为奇数,:步骤:先从小到大排序nxxnxMxxxxnnnen2,,......22121321【例4-12A】某企业某日工人的日产量资料如下:日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800—Xf计算该企业该日全部工人日产量的中位数。中位数的位次:5.4002180012eM(A)单项分组数据(2)已分组资料步骤:(1)计算累计次数(2)按(∑f+1)/2确定中位数位次(3)按此位次将按向上或向下累计的方法计算的累计次数刚好超过中位数位次的组确定为中位数组,该组标志值即为中位数【例4-12B】某大型商场衬衫部两组营业员月销售衬衫件数资料如下,求每组营业员月销售衬衫件数的中位数。按件数分组(件/月)营业员人数(人)人数累计(人)甲组乙组甲组乙组18018618718919319535874145683438162327284915232630合计2830——甲组(∑f+1)/2=14.5,位于14和15之间,187件乙组(∑f+1)/2=15.5,中位数位于15与16之间,则(187+189)/2=188件(B)组距数列①计算(∑f+1)/2,确定中位数所在组,该组上下限规定中位数的取值范围;②再假定中位数所在组内各数值均匀分布前提下,按照下面公式计算中位数近似值。下限公式ifSfLMeeeMMMe12上限公式ifSfUMeeeMMMe12注:下限公式适用向上累计的情况,上限
本文标题:4描述性统计解析
链接地址:https://www.777doc.com/doc-3271204 .html