您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 第4章数据分布特征的测度
统计学中是用一个或几个数据测度(刻画)数据总体的分布特征。统计学中刻划数据分布特征的最主要的代表有数据分布的集中趋势、离散程度和分布形态。描述统计统计数据的收集统计数据分布特征的测度统计数据的整理与显示第四章数据分布特征的测度主要内容和学习目标集中趋势的测度(重点掌握)离散程度的测度(重点掌握)——均从未分组和分组两角度进行介绍偏度与峰度的测度(了解)未分组和分组数据辨析1071081081101121121131141151171171171181181181191201201211221221221221231231231231241241241251251261261271271271281281291301311331331341341351371391391、未分组数据——未经过分组整理的数据某生产车间50名工人日加工零件数原始资料(单位:个)某城市居民关注广告类型的频数分布广告类型人数(人)频率(%)商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其他广告21.0合计200100.02、分组数据例-经过分组整理的数据某地区农民家庭年人均收入资料按年人均收入分组(元)农民家庭数(户)1000~12001200~14001400~16001600~18001800~20002000~22002200~24002400~2600240480105060027021012030合计3000一、集中趋势的测度算术平均数(重点掌握)调和平均数几何平均数(掌握)中位数(掌握)众数(掌握)概念与测度指标楼市价格下降?《2010年3月广州市十区房地产交易登记情况通报》,数据显示,广州十区3月的一手住宅成交量环比回升两成,达到62.35万平方米,成交量接近去年3月“小阳春”。今年3月楼市成交回暖是否也是楼价低的因素?因为广州3月楼价环比下降了9.2%。表面看来是如此。集中趋势的概念:是指一组数据向某一中心值靠拢的倾向,它反映了数据聚集的中心所在。集中趋势的测度:是指寻找数据(总体)一般水平的代表值或中心值集中趋势的概念与测度指标集中趋势的测度指标:称之为平均指标(平均数)——众数、中位数、算术平均数、调和平均数、几何平均数。集中趋势测度的作用:可以用一个数值说明总体的一般水平。平均数的种类位置平均数数值平均数众数中位数算术平均数调和平均数几何平均数众数定义确定方法特点总结一个班30名同学参加英语考试,成绩如下:2名同学——60分10名同学——72分15名同学——80分3名同学——85分5名同学——90分众数的引例众数定义:是指一组数据中出现次数最多的变量值,用MO表示。实际应用:当更感兴趣的是最普遍的尺寸而不是平均尺寸的大小时众数是一个合适的集中趋势代表值。众数(Mode)众数的确定方法1.未分组数据2.分组数据-品质型分组-数值型分组107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139众数:1221、未分组数据例某生产车间50名工人日加工零件数原始资料(单位:个)某城市居民关注广告类型的频数分布广告类型人数(人)频率(%)商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其他广告21.0合计200100.0众数:商品广告2、分组数据例-品质型分组甲城市家庭对住房状况满意程度的频数分布满意程度户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意248248.0300100不满意1083613244.027692一般933122575.016856满意451527090.07525非常满意3010300100.03010合计300100————众数:不满意某200名手机使用者目前已更换手机数量频数分布表更换手机数量人数(人)频率(%)06318241276383及以上3618合计200100众数:12、分组数据例-单项式分组某地区农民家庭年人均收入资料按年人均收入分组(元)农民家庭数(户)1000~12001200~14001400~16001600~18001800~20002000~22002200~24002400~2600240480105060027021012030合计3000105048014002001511.8(1050480)(1050600)oM(元)2、分组数据例-组距分组10504801400200(1050480)(1050600)oM=1511.8(元)1400L=1050mf1480mf1600mf200d解:从表中的资料可以看出,出现频数最多的是1050,即众数组为1400~1600,且根据众数公式可得:1、未分组数据的众数MO=频(次)数最多的数据值(变量值、标志值)2、分组数据的众数(1)品质数据和单项式分组的数值型数据MO=频数最多组的数据值(变量值、标志值)(2)组距式分组的数值型数据——由公式近似得出下限公式:上限公式:111()()mmommmmffMLdffff111()()mmommmmffMUdffff众数的确定方法总结优点:众数能够直观的说明客观现象的集中趋势——到底哪一个数据最多。它是一个位置代表值,不受资料中极端值的影响。幻灯片24缺点:1.可能不存在,也可能不具有唯一性;2.众数未能利用全体数据的信息众数要点小结众数的优缺点无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642幻灯片2342众数不受极端值影响原始数据:252829364242存在极端值25293642421000众数要点小结1.众数的确定——出现次(频)数最多的数据值(组)2.众数的作用——所有类型数据集中趋势的测度值之一,主要用于分类数据3.众数的特点——位置代表值,不受极端值的影响中位数定义确定方法特点总结5个好朋友在一次英语考试中的成绩为:甲60分;乙72分;丙80分;丁85分;戊90分中位数引例中位数定义:是一组数据按从小到大排序后,处于中间位置上的变量值,用Me表示。中位数(Median)Me一分为二50%50%如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。比如有5笔付款:9元,10元,10元,11元,60元平均付款为100/5=20元。很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。中位数的实际应用中位数的确定方法1.未分组数据2.分组数据-品质型分组-数值型分组中位数的确定方法(步骤)排序→找中位数位置→确定中位数中位数的位置为:321521n即第3个单位的变量值就是中位数元520eM例:某售货小组5个人,某天的销售额为440元、480元、520元、600元、750元,则中位数的确定例-未分组数据中位数的位置为:5.321621n中位数应为第3和第4个单位变量值的中点数值,即元5602600520eM例:若上述售货小组为6个人,某天的销售额为440元、480元、520元、600元、750元、760元,则未分组数据中位数的确定步骤:排序→找中位数位置→计算中位数21n中位数位置:日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800—Xf单项式分组例——计算该企业该日全部工人日产量的中位数?中位数组的位置:4002800eMf分组数据中位数位置的确定图示共个单位2f共个单位2f下组限L上组限U中位数组单项式分组中位数的确定步骤(P57):排序→找中位数组的位置→确定中位数2)(fn中位数组位置:组距分组例-某车间50名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—计算该车间工人月产量的中位数?——近似值组距分组中位数的确定步骤:排序→找中位数组的位置→利用公式计算中位数的近似值(P574-4下限公式4-5上限公式)2)(fn中位数组位置:下限公式:上限公式:12memfSMLdf12memfSMUdf第一步:排序第二步:确定中位数的位置中位数的位置=(未分组)(分组数据-顺序和单项式、组距)第三步:确定中位数的值12n2f中位数组的变量值利用公式计算近似值中位数的确定方法总结为偶数时当为奇数时当nxx21nx)12n()2n(21neM练习:某生产车间50名工人日加工零件数原始资料(单位:个)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121排序表107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139中位数:123甲城市家庭对住房状况满意程度的频数分布满意程度户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意248248.0300100不满意1083613244.027692一般933122575.016856满意451527090.07525非常满意3010300100.03010合计300100————中位数:一般某200名手机使用者目前已更换手机数量频数分布表更换手机数量人数(人)频率(%)向上累积向下累积06362001824188194276381641123及以上361820036合计200100--中位数:2某地区农民家庭年人均收入资料按年人均收入分组(元)农民家庭数(户)向上累积频数向下累积频数1000~12001200~14001400~16001600~18001800~20002000~22002200~24002400~2600240480105060027021012030240720177023702640285029703000300027602280123063036015030合计3000——3000720214002001548.6(1050eM元)3000150021400L=1720mS=1050mf=200d=3000720214002001548.6(1050eM元)解:由表中资料可知,中位数的位置=中位数在1400~1600组,且,,根据中位数的公式,得中位数的计算过程优点:1.只要数据可以排序(顺序、数值型),中位数一定存在。2.中位数是一个位置代表值,不受极端数值的影响。在存在极端值的情况下,中位数具有较强的代表性。缺点:1.未能充分利用数据的信息2.存在大量重复数值时,中位数未必准确,须注意其含义的解释。中位数的优缺点中位数要点小结1.中位数的确定:排序,找位置,确定中位数2.中位数的作用:顺序和数值型数据的集中趋势测度值之一,主要用于顺序数据3.中位数的特点:——位置代表值,不受极端值的影响。——排序后处于正中间位置上的值(不一定是
本文标题:第4章数据分布特征的测度
链接地址:https://www.777doc.com/doc-3183019 .html