您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 数字特征和茎叶图课件
复习练习:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第三小组频数为51.(1)第三小组的频率是多少?样本容量是多少?90100110120130140150次数00.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.0360.34150(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?90100110120130140150次数00.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.0361-0.12=0.88即达标率是88%频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线1.众数、中位数、平均数2.2.2用样本的数字特征估计总体的数字特征一、复习众数、中位数、平均数的概念2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.3、平均数:一般地,如果n个数,那么,叫做这n个数的平均数。12,,...,nxxx121(...)nxxxxn1、求下列各组数据的众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4二、众数、中位数、平均数与频率分布直方图的关系例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们得知这一组样本数据的,并画出过这组数据的频率分布直方图.众数=2.3(t)中位数=2.0(t)平均数=2.0(t)现在,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?众数、中位数和平均数频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距思考:小长方形面积、对应这个组的频率、这个组占的比例的关系。频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距2.25归纳总结得:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内。众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02提示:中位数左边的数据个数与右边的数据个数是相等的。频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和=0.49后四个小矩形的面积和=0.262.02归纳总结得:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表50个单位,它们的分界线与x轴交点的横坐标就是中位数。中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标。思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02提示:在频率分布直方图中,各个组的平均数如何找?频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02.........0.751.752.252.753.253.754.251.250.25提示:与小长方形面积的比例有关吗?频率分布直方图00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.022.02.........0.751.752.252.753.253.754.251.250.25总结归纳得:平均数是频率分布直方图的“重心”,是直方图的平衡点。先找出每个小长方形的“重心”,即每小组的平均数,再按比例算出直方图的平均数。平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和。三、三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。3、平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。茎叶图问题情境1.情境:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.2.问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?.,,,,发挥比较稳定说明其集中程度高且分布较对称之间到众数都在位数、该运动员平均得分及中出从这张图可以直观地看4020注中位数:一排数字把他从小到大排列最中间的那个数如果这排数的个数是单数则中位数为中间那两个数的平均数.众数:一排数字中出现最多的数。众数不一定唯一建构数学茎叶图的概念:一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;(3)茎叶图对重复出现的数据要重复记录,不能遗漏.例2.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.甲12,15,24,25,31,31,36,36,37,39,44,49,50.乙8,13,14,16,23,26,28,33,38,39,51解:画出两人得分的茎叶图;从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好.练习:1.右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()甲012345乙824719936250328754219441AA.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分2.2002-2003赛季,一球员在NBA某些场次的比赛所得篮板球数分别为:16,6,3,5,12,8,13,6,10,3,19,14,9,7,10,10,9,11,6,11,12,14,8,6,10,5,10,11,13,9,10,10,7,6,11,12,17,4,12,8,10,12,9,15,15,12,13,18,8,16,请制作这些数据的茎叶图.01334556666677888899990000000011112222223334455667893.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:甲乙014235503287542194418247199362(1)甲乙两名队员的最高得分各是多少?他们的中位数和众数各是多少?(2)哪名运动员的成绩好一些?(1)甲运动员的最高得分为51分,中位数为36,众数为44.乙运动员的最高分为52分,中位数为25,众数为29.(2)甲运动员的成绩好于乙运动员.
本文标题:数字特征和茎叶图课件
链接地址:https://www.777doc.com/doc-2309077 .html