您好,欢迎访问三七文档
2.2用样本估计总体2.2.2用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数第二章统计课前自主预习1.众数的定义一组数据中的数称为这组数的众数.2.中位数的定义把一组数据按的顺序排列,处在位置的数(或中间两个数的)叫做这组数据的中位数.□01出现次数最多□02从小到大(或从大到小)□03最中间□04平均数3.平均数的定义如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用x表示,即x=.□051n(x1+x2+…+xn)□061n(x1+x2+…+xn)1.判一判(正确的打“√”,错误的打“×”)(1)中位数一定是样本数据中的某个数.()(2)在一组样本数据中,众数一定是唯一的.()(3)在样本数据中,频率分布最高点所对应的样本数据是众数.()√××2.做一做(1)10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.abcB.bcaC.cabD.cba解析将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a=110(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,显然abc.故选D.(2)(教材改编P74练习)奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为()A.减少计算量B.避免故障C.剔除异常值D.活跃赛场气氛解析因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.(3)一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中中位数为16,则x=________.15解析由题意知x+172=16,即x=15.课堂互动探究探究1众数、中位数、平均数的计算例1某公司的33名职工的月工资(以元为单位)如下表:(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.[解](1)平均数是x-=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元),中位数是1500元,众数是1500元.(2)新的平均数是x′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元),新的中位数是1500元,新的众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.拓展提升众数、中位数、平均数的特点(1)众数、中位数及平均数都是描述一组数据集中趋势的量.(2)平均数的大小与一组数据里每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动.(3)众数考查各数出现的频率,其大小与这组数据中部分数据有关,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中个别数据较大时,用中位数描述这种趋势.【跟踪训练1】在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:分别求这些运动员成绩的众数、中位数与平均数.解在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是x-=117×(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).答:17名运动员成绩的众数、中位数、平均数依次为1.75m,1.70m,1.69m.探究2众数、中位数、平均数与频率分布直方图的关系例2某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩.[解](1)由图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.拓展提升利用直方图求数字特征(1)众数是最高的矩形的底边的中点的横坐标.(2)中位数左右两边直方图的面积应相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.【跟踪训练2】从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.(答案精确到0.1)解(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以由频率分布直方图得众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.设其底边为x,高为0.03,令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈73.7.探究3众数、中位数、平均数的实际应用例3个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:李某大厨二厨采购员杂工服务生会计30000元4500元3500元4000元3200元3200元4100元(1)计算所有员工8月份的平均工资;(2)由(1)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?[解](1)这7个人的8月份平均工资是x1=17×(30000+4500+3500+4000+3200+3200+4100)=7500(元).(2)计算出的平均工资不能反映打工人员的当月收入的一般水平,可以看出,打工人员的工资都低于平均工资,因为这7个值中有一个极端值——李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的工资后的平均工资x2=16×(4500+3500+4000+3200+3200+4100)=3750(元),该平均工资能代表打工人员的当月收入的一般水平.(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.拓展提升各种数字特征的优缺点众数、中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,而平均数与每一个样本数据都有关系,可反映出更多的关于样本数据的全体信息,但受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,因此用平均数估计总体有时不可靠.【跟踪训练3】(1)16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,其他15位同学成绩的下列数据中,能使他得出结论的是()A.平均数B.极差C.中位数D.方差(2)某鞋店试销一种新女鞋,销售情况如下表:型号3435363738394041数量/双259169532如果你是鞋店经理,最关心的是哪种型号的鞋销量最大,那么下列统计量中对你来说最重要的是()A.平均数B.众数C.中位数D.方差解析(1)判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,其成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.(2)鞋店经理最关心的是哪种型号的鞋销量最大,由表可知,型号为37的鞋销量最大,共销售了16双,并且这组数据的众数为37.1.众数通常用来表示分类变量的中心值,容易计算.但是它只能表达样本数据中很少的一部分信息,通常用于描述变量的中心位置.2.中位数不受几个极端数据(即排序靠前或靠后的数据)的影响,容易计算.它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据时,应该用抗极端性很强的中位数表示数据的中心值.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.4.如果样本平均数远大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.5.在实际问题中众数、中位数、平均数都有单位.随堂达标自测1.已知一组数据按从小到大的顺序排列为14,19,x,23,27,其中中位数是22,则x的值为()A.24B.23C.22D.21解析一组数据按从小到大的顺序排列为14,19,x,23,27,则中位数是x.因为中位数是22,所以x=22.故选C.2.下列说法中,不正确的是()A.数据2,4,6,8的中位数是4,6B.数据1,2,2,3,4,4的众数是2,4C.一组数据的平均数、众数、中位数有可能是同一个数据D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析数据2,4,6,8的中位数为4+62=5,显然A错误,B,C,D都正确.故选A.3.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是()A.85,85,85B.87,85,86C.87,85,85D.87,85,90解析从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.4.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为()A.46B.36C.56D.60解析根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数
本文标题:2019-2020学年高中数学 第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估
链接地址:https://www.777doc.com/doc-8288669 .html