您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 第1章统计数据基本特征.
4-1第一章数据的概括性度量第一章4-2第一章数据的概括性度量哪名运动员的发挥更稳定?在奥运会女子10米气手枪比赛中,每个运动员首先进行每组10抢共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表4-3第一章数据的概括性度量哪名运动员的发挥更稳定?最会的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅·帕杰林娜以总成绩498.1环获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺·萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠勒仅以479.6环的成绩名列第8名由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?通过本章内容的学习就能很容易回答这样的问题4-4第一章数据的概括性度量第1章数据的概括性度量•1.1集中趋势的度量•1.2离散程度的度量•1.3偏态与峰态的度量4-5第一章数据的概括性度量学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法4-6第一章数据的概括性度量1.1集中趋势的度量---集中趋势的度量4-7第一章数据的概括性度量集中趋势(centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据---集中趋势的度量4-8第一章数据的概括性度量众数(mode)---集中趋势的度量4-9第一章数据的概括性度量众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242---集中趋势的度量4-10第一章数据的概括性度量分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占被调查总人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐---集中趋势的度量4-11第一章数据的概括性度量顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0---集中趋势的度量4-12第一章数据的概括性度量中位数(median)1.排序后处于中间位置上的值Me50%50%2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据---集中趋势的度量4-13第一章数据的概括性度量中位数(位置和数值的确定)位置确定21n中位数位置为偶数为奇数nxxnxMnnne1222121数值确定---集中趋势的度量4-14第一章数据的概括性度量顺序数据的中位数(例题分析)解:中位数的位置为(300+1)/2=150.5从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—---集中趋势的度量4-15第一章数据的概括性度量数值型数据的中位数【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080521921n位置---集中趋势的度量4-16第一章数据的概括性度量数值型数据的中位数【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021n位置102021080960中位数---集中趋势的度量4-17第一章数据的概括性度量四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%---集中趋势的度量4-18第一章数据的概括性度量四分位数(位置的确定)方法2:较准确算法4)1(341ULnQnQ位置位置方法1:定义算法434ULnQnQ位置位置---集中趋势的度量4-19第一章数据的概括性度量四分位数方法3:其中[]表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上方法4:Excel给出的四分位数位置的确定方法如果位置不是整数,则按比例分摊位置两侧数值的差值2121nQ位置43LnQ位置413UnQ位置---集中趋势的度量4-20第一章数据的概括性度量顺序数据的四分位数解:QL位置=(300)/4=75QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为QL=不满意QU=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—---集中趋势的度量4-21第一章数据的概括性度量数值型数据的四分位数【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:12345678975.649325.249UL位置位置QQ5.79725.0)780850(780LQ5.143775.0)12501500(1250UQ方法1---集中趋势的度量4-22第一章数据的概括性度量数值型数据的四分位数【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234567895.74)19(35.2419UL位置位置QQ15652163015008152850780ULQQ方法2---集中趋势的度量4-23第一章数据的概括性度量数值型数据的四分位数【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789321219位置Q1500850ULQQ方法3---集中趋势的度量4-24第一章数据的概括性度量数值型数据的四分位【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789方法4741933439UL位置位置QQ850LQ1500UQ---集中趋势的度量4-25第一章数据的概括性度量平均数(mean)1.也称为均值,一组数据相加后除以数据的个数得到的结果2.集中趋势的最常用测度值3.一组数据的均衡点所在4.体现了数据的必然性特征5.易受极端值的影响6.有简单平均数和加权平均数之分7.根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为xx---集中趋势的度量4-26第一章数据的概括性度量简单平均数-未分组数据设一组数据为:x1,x2,…,xn(总体数据xN)样本平均数nxnxxxxniin121NxNxxxNiiN121总体平均数---集中趋势的度量4-27第一章数据的概括性度量加权平均数-分组数据设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fknfMffffMfMfMxkiiikkk1212211样本加权平均总体加权平均NfMffffMfMfMkiiikkk1212211---集中趋势的度量4-28第一章数据的概括性度量185120222001nfMxkiii加权平均数(例题分析)某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—12022200---集中趋势的度量4-29第一章数据的概括性度量加权平均数(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811)(82108100120101分甲nxxnii)(12101100120801分乙nxxnii4-30第一章数据的概括性度量平均数(数学性质)1.各变量值与平均数的离差之和等于零2.各变量值与平均数的离差平方和最小niixx12min)(niixx10)(---集中趋势的度量4-31第一章数据的概括性度量平均数(数学性质)1.各变量值与平均数的离差之和等于零1111()0nnnniiiiiiixxxxxnx---集中趋势的度量4-32第一章数据的概括性度量平均数21()niiYxM2.各变量值与平均数的离差平方和最小21()minniixx112()0/niiniiYxMMMxnx---集中趋势的度量4-33第一章数据的概括性度量几何平均数1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.可看作是平均数的一种变形nniinnmxxxxG121nxxxxnGniinm121lg)lglg(lg1lg---集中趋势的度量4-34第一章数据的概括性度量几何平均数(例题分析)【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率%91.114%120%116%109321nnmxxxG年平均增长率=114.91%-1=14.91%---集中趋势的度量4-35第一章数据的概括性度量几何平均数(例题分析)【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%
本文标题:第1章统计数据基本特征.
链接地址:https://www.777doc.com/doc-2154251 .html