您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 第4章 数据的分布特征的测定
4-1经济、管理类基础课程统计学第四章数据分布特征的测度4-2经济、管理类基础课程统计学第四章数据分布特征的测度第一节集中趋势的测度第二节离散程度的测度第三节偏态与峰度的测度4-3经济、管理类基础课程统计学数据分布的特征和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态4-4经济、管理类基础课程统计学第一节集中趋势的测度一、集中趋势的含义二、众数三、中位数四、均值五、众数、中位数和均值的比较4-5经济、管理类基础课程统计学一、集中趋势(Centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定4-6经济、管理类基础课程统计学二、分类数据:众数4-7经济、管理类基础课程统计学众数(概念要点)1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能没有众数或有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据4-8经济、管理类基础课程统计学众数(众数的不唯一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642424-9经济、管理类基础课程统计学分类数据的众数(算例)表3-1某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据第三章表3-1中的数据,计算众数解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即Mo=商品广告4-10经济、管理类基础课程统计学顺序数据的众数(算例)【例】根据第三章表3-2中的数据,计算众数解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.04-11经济、管理类基础课程统计学数值型分组数据的众数***(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算dffffffLM)()(1110MoMo4-12经济、管理类基础课程统计学数值型分组数据的众数(算例)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.1】根据第三章表3-5中的数据,计算50名工人日加工零件数的众数)(1235)1014()814(8141200个M4-13经济、管理类基础课程统计学三、顺序数据:中位数和分位数4-14经济、管理类基础课程统计学中位数(概念要点)1.集中趋势的测度值之一2.排序后处于中间位置上的值Me50%50%3.不受极端值的影响4.主要用于定序数据,也可用数值型数据,但不能用于定类数据5.各变量值与中位数的离差绝对值之和最小,即min1nieiMX4-15经济、管理类基础课程统计学中位数(位置的确定)未分组数据:顺序数据与分组数据:21N中位数位置2N中位数位置4-16经济、管理类基础课程统计学顺序数据的中位数(算例)【例4.2】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数解:中位数的位置为:300/2=150从累计频数看,中位数的在“一般”这一组别中。因此Me=一般表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-17经济、管理类基础课程统计学1.计算向上累计频数。2.在向上累计频数序列中从上往下找第一个大于N/2的数,该数所对应的既为中位数所在组。3.采用下列近似公式计算:4.该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数***(要点及计算公式)dfSNLMmme124-18经济、管理类基础课程统计学数值型分组数据的中位数(算例)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.3】根据第三章表3-5中的数据,计算50名工人日加工零件数的中位数)(21.12351416250120个eM4-19经济、管理类基础课程统计学数值型未分组数据的中位数则中位数就可以按下面的方式确定:为偶数)(为奇数)(nxxnxnnneM2122214-20经济、管理类基础课程统计学数值型未分组数据的中位数(5个数据的算例)原始数据:2422212620排序:2021222426位置:12345中位数22321521N位置4-21经济、管理类基础课程统计学数值型未分组数据的中位数(6个数据的算例)原始数据:10591268排序:56891012位置:123456位置N+126+123.5中位数8+928.54-22经济、管理类基础课程统计学四分位数(概念要点)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%4-23经济、管理类基础课程统计学四分位数(位置的确定)未分组数据:顺序数据与组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N44-24经济、管理类基础课程统计学顺序数据的四分位数(算例)【例4.4】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为:QL位置=(300)/4=75上四分位数(QL)的位置为:QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此QL=不满意QU=一般表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-25经济、管理类基础课程统计学数值型分组数据的四分位数(计算公式)上四分位数:UUuuUdfSNLQ43LLLLLdfSNLQ4下四分位数:4-26经济、管理类基础课程统计学数值型分组数据的四分位数(计算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.6】根据第三章表3-5中的数据,计算50名工人日加工零件数的四分位数)(81.117588450115个LQ)(75.128510304503125个UQ4-27经济、管理类基础课程统计学数值型未分组数据的四分位数(7个数据的算例)原始数据:23213032282526排序:21232526283032位置:1234567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=304-28经济、管理类基础课程统计学数值型未分组数据的四分位数(6个数据的算例)原始数据:232130282526排序:212325262830位置:123456QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)=28.54-29经济、管理类基础课程统计学数值型数据:均值(平均数)4-30经济、管理类基础课程统计学平均数(概念要点)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据6.类型:算术平均数调和平均数几何平均数4-31经济、管理类基础课程统计学算术平均数(计算公式)设一组数据为:X1,X2,…,XN简单算术平均数的计算公式为设分组后的数据为:X1,X2,…,XK相应的频数为:F1,F2,…,FK加权算术平均数的计算公式为NXNXXXXNiiN121KiiKiiiNNNFFXFFFFXFXFXX112122114-32经济、管理类基础课程统计学简单算术平均数(算例)原始数据:105913685.868613951066543211XXXXXXNXXNii4-33经济、管理类基础课程统计学加权算术平均数(算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例4.7】根据第三章表3-5中的数据,计算50名工人日加工零件数的均值(个)2.12350616011KiiKiiiFFXX4-34经济、管理类基础课程统计学算术平均数(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(X):020100人数分布(F):118乙组:考试成绩(X):020100人数分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)4-35经济、管理类基础课程统计学平均数(数学性质)1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小niiXX12min)(niiXX10)(4-36经济、管理类基础课程统计学调和平均数(概念要点)1.集中趋势的测度值之一2.均值的另一种表现形式3.易受极端值的影响4.用于定比数据5.不能用于定类数据和定序数据6.计算公式为原来只是计算时使用了不同的数据!iiiiiiiiMFFXXFXFXH4-37经济、管理类基础课程统计学调和平均数(算例)表4-3某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)Xi成交额(元)XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合计—3690048000【例4.8】某蔬菜批发市场三种蔬菜的日成交数据如表4-2,计算三种蔬菜该日的平均批发价格(元)769.04800036900iii
本文标题:第4章 数据的分布特征的测定
链接地址:https://www.777doc.com/doc-3170915 .html