您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > (贾俊平_统计学_第五版)第4章_数据的概括性度量.
4-1统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院第4章数据的概括性度量作者:中国人民大学统计学院贾俊平4-2统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院第4章数据的概括性度量4.1集中趋势的度量4.2离散程度的度量4.3偏态与峰态的度量4-3统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法6.用Excel计算描述统计量并进行分析4-4统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院4.1集中趋势的度量4.1.1分类数据:众数4.1.2顺序数据:中位数和分位数4.1.3数值型数据:平均数4.1.4众数、中位数和平均数的比较4-5统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院集中趋势(centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据4-6统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院分类数据:众数4-7统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据4-8统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642424-9统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)果汁矿泉水绿茶其他碳酸饮料610118150.120.200.220.160.301220221630合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买碳酸饮料的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=碳酸饮料4-10统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.04-11统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院顺序数据:中位数和分位数4-12统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院中位数(median)1.排序后处于中间位置上的值Me50%50%2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即min1eniiMx4-13统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院中位数(位置和数值的确定)位置确定21n中位数位置为偶数为奇数nxxnxMnnne1222121数值确定4-14统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院顺序数据的中位数(例题分析)解:中位数的位置为(300+1)/2=150.5从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-15统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院数值型数据的中位数(9个数据的算例)【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080521921n位置4-16统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院数值型数据的中位数(10个数据的算例)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021n位置102021080960中位数4-17统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.计算公式QLQMQU25%25%25%25%434ULnQnQ位置位置4-18统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院顺序数据的四分位数(例题分析)解:QL位置=(300)/4=75QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为QL=不满意QU=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-19统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院数值型数据的四分位数(9个数据的算例)【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:12345678975.649325.249UL位置位置QQ5.79725.0)780850(780LQ5.143775.0)12501500(1250UQ4-20统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院数值型数据:平均数4-21统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院平均数(mean)1.也称为均值2.集中趋势的最常用测度值3.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.有简单平均数和加权平均数之分6.根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为xx4-22统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院简单平均数(Simplemean)设一组数据为:x1,x2,…,xn(总体数据xN)样本平均数nxnxxxxniin121NxNxxxNiiN121总体平均数4-23统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院加权平均数(Weightedmean)设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fknfMffffMfMfMxkiiikkk1212211样本加权平均总体加权平均NfMffffMfMfMkiiikkk12122114-24统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院185120222001nfMxkiii加权平均数(例题分析)某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—120222004-25统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院几何平均数(geometricmean)1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.可看作是平均数的一种变形nniinnmxxxxG121nxxxxnGniinm121lg)lglg(lg1lg4-26统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院几何平均数(例题分析)【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率%0787.81%9.101%5.125%1.102%5.1044G算术平均:%5.84%9.1%5.25%1.2%5.4G几何平均:4-27统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院众数、中位数和平均数的比较4-28统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院众数、中位数和平均数的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值4-29统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用4-30统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院4.2离散程度的度量4.2.1分类数据:异众比率4.2.2顺序数据:四分位差4.2.3数值型数据:方差和标准差4.2.4相对离散程度:离散系数4-31统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院离中趋势1.数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值4-32统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院分类数据:异众比率4-33统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院异众比率(variationratio)1.对分类数据离散程度的测度2.非众数组的频数占总频数的比例3.计算公式为4.用于衡量众数的代表性imimirfffffv14-34统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院异众比率(例题分析)解:在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“碳酸饮料”代表消费者购买饮料品牌的状况,其代表性不是很好%707.050151501550rv不同品牌饮料的频数分布饮料品牌频数比例百分比(%)果汁矿泉水绿茶其他碳酸饮料610118150.120.200.220.160.301220221630合计5011004-35统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院顺序数据:四分位差4-36统计学STATISTICS(第五版)作者:贾俊平,中国人民大学统计学院四分位差(quartiledeviation)1.对顺序数据离散程度的测度2.也称为内距或四分间距3.上四分位
本文标题:(贾俊平_统计学_第五版)第4章_数据的概括性度量.
链接地址:https://www.777doc.com/doc-3045976 .html