您好,欢迎访问三七文档
第二章统计数据的描述第2节分布集中趋势的测度一、众数二、中位数三、四分位数四、均值五、几何平均数六、切尾均值七、众数、中位数和均值的比较集中趋势(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据众数(mode)1.一组数据中出现次数最多的变量值2.一般情况下,只有在数据量较大且集中趋势明显的情况下,才能用众数作为总体的代表值。3.众数是一个位置代表值,不受极端值的影响4.主要用于定类尺度数据,也可用于定序尺度数据和定比尺度数据众数的种类无众数data:10591268一个众数data:659855双众数data:252828364242多众数data:3232323334343435363636定类尺度数据的众数(例题分析)解:众数为“SP09-05”,即Mo=SP09-05某专卖店新品球衣销售情况(单位:件)球衣货号前日售出数量当日出售数量AS01-9064AS02-951821AB09-102533SP09-058893SS12-101523PP89-1586合计160180定序尺度数据的众数(例题分析)解:众数为“副教授”这一级别,即Mo=副教授某高校在职教师职称分布职称人数百分比(%)教授副教授讲师助教其他教师1513822972031714.3836.3828.2919.331.62合计1050100.00日产量(件)工人人数(人)101112131470100380150100合计800【例】已知某企业某日工人的日产量资料如下:解:该企业该日全部工人日产量的众数为12件。定比尺度数据的众数(单变量值分组)符号含义:(A)L为众数组的下限;(B)1=fm-fm-1,即众数组的次数与前一组次数之差;2=fm-fm+1,即众数组的次数与后一组次数之差;(C)i为众数组的组距。iLMo211定比尺度数据的众数(组距分组)组距分组计算众数收入组别人均收入(元)频数(人)1234562000以下2000~40004000~60006000~80008000~1000010000以上234368322410合计-200元67.48192000)3268()4368(43684000211iLMo某地区的人均月收入调查数据•排序后处于中间位置上的值不受极端值的影响主要用于定序尺度数据,也可用于定比尺度数据,但不能用于定类尺度数据Me50%50%中位数(median)1、确定中位数的位置定序尺度数据的中位数2n中位数位置2、确定中位数定序尺度数据的中位数(例题分析)解:中位数的位置为300/2=150从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—(1)由未分组资料确定中位数(2)由单变量值分组确定中位数(3)由组距分组数据确定中位数定比尺度数据的中位数(计算方法)(1)由未分组资料确定中位数排序:确定中位数位置奇数:中间位置的变量值为中位数。偶数:中间位置相邻两个变量值的简单平均数是中位数。21nOm定比尺度数据的中位数(计算方法)中位数(9个数据的算例)【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数Me1080521921nOm位置中位数(10个数据的算例)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021nOm位置102021080960eM中位数(2)由单变量值分组确定中位数中位数位置:从累计频数看,中位数在“80”这一组别中,中位数为Me=34(台)2n中位数位置402802nOm某公司销售人员月销售冰箱中位数计算销售冰箱分组(台)销售人员数(人)向下累计频数向上累计频数25303234363931014271883132754728080776753268合计80--(3)由组距分组数据确定中位数第一步:确定中位数位置其中:L是中位数所在组的下限fm是中位数所在组的次数Sm-1是中位数所在组前面各组累计次数i是中位数所在组的组距2fOmifSfLMmme12第二步:采用公式计算按家庭收入分组(元)家庭数(户)向下累计频数5000以下5000~1000010000~1500015000~2000020000以上214514662166808692合计92-某地区家庭收入分组中位数的位置在第46(92/2)位,应在第二组)(8.777750004521292500021元ifSfLMmme分位数1、四分位数2、十分位数3、百分位数四分位数(quartile)2.不受极端值的影响1.排序后处于25%和75%位置上的值Q1Q2Q325%25%25%25%3、主要用于定序尺度数据,也可用于定比尺度数据,但不能用于定类尺度数据1、由定序数据确定四分位数(2)确定四分位数(1)确定位置:43431nQnQ位置位置四分位数定序尺度数据的四分位数(例题分析)解:Q1位置=(300)/4=75Q3位置=(3×300)/4=225从累计频数看,Q1在“不满意”这一组别中;Q3在“一般”这一组别中四分位数为Q1=不满意Q3=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—四分位数2、由未分组数据确定四分位数(1)确定位置:4)1(34131nQnQ位置位置四分位数(2)确定四分位数【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234567895.74)19(35.241931位置位置QQ1565216301500815285078031QQ四分位数【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:1234567891025.84)110(375.2411031位置位置QQ5.1532)15001630(25.015005.772)750780(75.075031QQ四分位数均值(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于定比尺度数据,不能用于定类尺度数据和定序尺度数据简单平均数与加权平均数(simplemean/weightedmean)设一组数据为:x1,x2,…,xn各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk简单平均数nxnxxxxniin121nfMffffMfMfMxkiiikkk1212211加权平均数某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—12022200)(185120222001台nfMxkiii加权平均数(例题分析)加权平均数(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811)(82108100120101分甲nxxnii)(12101100120801分乙nxxnii几何平均数(geometricmean)1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.当数据中出现零值或负值时不宜计算几何平均数nniinnmxxxxG121某电器销售公司2003~2008年销售量的环比增长率分别为:7.6%、2.5%、0.6%、2.7%和2.2%。求这期间销售量的平均增长率。几何平均数的计算示例销售量的平均增长率=103.1%-1=3.1%155107.6%102.5%100.6%102.7%102.2%1.16454103.1%nnGiiXXG切尾均值(trimmedMean)1、去掉大小两端的若干数值后计算中间数据的均值2、在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用3、计算公式为(1)(2)()2nnnnxxxxnn102n表示观察值的个数;α表示切尾系数,【例】某次比赛共有11名评委,对某位歌手的给分分别是:经整理得到顺序统计量值为123456,,,,,,9.22,9.25,9.20,9.30,9.65,9.30,xxxxxx7891011,,,,9.27,9.20,9.28,9.25,9.24xxxxx(1)(2)(3)(4)(5)(6),,,,,,9.20,9.20,9.22,9.24,9.25,9.25,xxxxxx(7)(8)(9)(10)(11),,,,9.27,9.28,9.30,9.30,9.65xxxxx去掉一个最高分和一个最低分,取1/11111/111111/11211111/111/11(2)(3)(10)112111/111129.29.229.39.269xxxxxxx众数、中位数和平均数的比较众数、中位数和平均数的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第3节分布离散程度的测度一、极差(全距)二、内距(四分位差)三、方差和标准差四、离散系数离散程度1.数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响计算公式为minmaxxxR最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则元310440750minmaxxxR甲组乙组0-10040100-20049200-30010【例B】空调耐用性分组测试表(单位:小时)甲组R=300-0=300(小时)乙组R=200-100=100(小时)【例C】某季度某工业公司18个工业企业产值计划完成情况如下,计算极差。计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~10010
本文标题:保险学课件
链接地址:https://www.777doc.com/doc-231505 .html