您好,欢迎访问三七文档
第二章统计2.2.2用样本的数字特征估计总体的数字特征[学习目标]1.理解样本数据标准差的意义和作用,会计算数据的标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释(重点).2.体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征(重点).3.会用样本估计总体的思想解决一些简单的实际问题(难点).[知识提炼·梳理]1.众数、中位数、平均数(1)众数、中位数、平均数的概念.①众数:在一组数据中,出现次数最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.③平均数:指样本数据的算术平均数.即:x-=1n(x1+x2+…+xn).(2)众数、中位数、平均数与频率分布直方图的关系.众数众数是最高矩形的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和②平均数是频率分布直方图的重心,是频率分布直方图的平衡点2.标准差与方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示,计算时通常用公式:s=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].显然,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.(2)方差:标准差s的平方s2,即s2=1n[(x1-x-)2+…+(xn-x-)2]叫作这组数据的方差,与标准差一样,方差也是用来测量样本数据的分散程度的特征数.温馨提示:因为标准差与原始数据的单位相同,所以在解决实际问题时,一般多采用标准差.[思考尝试·夯基]1.思考判断(正确的打“√”,错误的打“×”).(1)样本2,3,3,5,6,5,9,1的众数为3.()(2)中位数一定是样本数据中的某个数.()(3)标准差越大,数据的稳定性越强.()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()答案:(1)×(2)×(3)×(4)√2.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出的次品数.甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则从平均数考虑,甲、乙两台机床出次品数较少的为()A.甲B.乙C.相同D.不能比较解析:x-甲=110(0+1+0+2+…+4)=1.5,x-乙=110(2+3+…+1)=1.2,所以x-乙x-甲.答案:B3.下图是某个篮球运动员在一个赛季中的30场比赛中得分的茎叶图,则其得分的中位数与众数分别为()A.3与3B.23与3C.3与23D.23与23解析:中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23.答案:D4.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.92,2B.92,2.8C.93,2D.93,2.8解析:去掉一个最高分95与一个最低分89后,所得的5个数分别为90,90,93,94,93,所以x-=90+90+93+94+935=4605=92,s2=2×(90-92)2+2×(93-92)2+(94-92)25=145=2.8.答案:B5.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下.甲:6,8,9,9,8;乙:10,7,7,7,9.则两人的射击成绩较稳定的是________.解析:x-甲=x-乙=8,s2甲=1.2,s2乙=1.6,因为s2甲s2乙,所以甲稳定.答案:甲类型1众数、中位数、平均数的应用[典例1]某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资/元22000550042003000100035700人数16510123合计220003300021000300001000107000(1)指出该工厂人员月工资数据中的众数、中位数、平均数.(2)月工资的平均数能客观地反映该工厂人员的月工资水平吗?为什么?解:(1)由表格可知,众数为3000元.把23个数据按从小到大(或从大到小)的顺序排列,排在最中间的数应是第12个数,其值为4200,故中位数为4200元.107000÷23≈4652,所以平均数为4652(元).(2)虽然平均数为4652元,但由表格中所列出的数据可见,只有经理及管理人员在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂人员的月工资水平.归纳升华1.如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们做出决策.2.众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.[变式训练]高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.(1)求这次测验全班的平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人;(3)分析男同学的平均分与中位数相差较大的主要原因.解:(1)利用平均数计算公式,得x-=27×82+21×8048≈81.13,所以全班的平均分是81.13分.(2)因为男同学得分的中位数是75分,所以至少有14人得分不超过75分.又因为女同学得分的中位数是80分,所以至少有11人得分不超过80分.所以全班至少有25人得分不超过80分.(3)男同学的平均分与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.类型2方差、标准差的计算与应用[典例2]甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203204202196199201205197202199乙:201200208206210209200193194194(1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近200克?哪台包装机包装的10袋糖果的质量比较稳定?解:(1)x-甲=110(3+4+2-4-1+1+5-3+2-1)+200=200.8,x-乙=110(1+0+8+6+10+9+0-7-6-6)+200=201.5.s2甲=7.96,s2乙=38.05.(2)因为200<x-甲<x-乙,所以甲台包装机包装的10袋糖果的平均质量更接近200克.因为s2甲<s2乙,所以甲台包装机包装的10袋糖果的质量比较稳定.归纳升华1.方差、标准差反映一组数据的离散程度,方差、标准差越大,数据越不稳定;方差、标准差越小,数据越稳定.2.在实际应用中,常常把平均数与标准差结合起来进行决策,在平均数相等的情况下,比较方差或标准差以确定稳定性.3.比较两个样本的稳定性、可靠性.先求平均数,比较一下哪一个更接近标准.若平均数相等,则再求方差.方差越小,数据越稳定.[变式训练]甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解:(1)x-甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x-乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2],得s2甲=3,s2乙=1.2.(3)x-甲=x-乙,说明甲、乙两战士的平均水平相当.又s2甲s2乙,说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.类型3频率分布与数字特征的综合应用[典例3]从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.解:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中,高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75.在频数分布直方图中,中位数在左右两边频数应相等,即频率也相等,从而小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.30.5,所以中位数应位于第四个小矩形内.设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,故中位数应为70+6.7=76.7.所以这50名学生成绩的众数是75,中位数是76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.所以,这50名学生的平均成绩为76.2.归纳升华1.根据有关统计图表求数字特征时,要会识图表,从图表中找出中位数、众数等,计算平均数要用到频数(率)分布表.2.总体的平均数和标准差往往很难求,通常做法就是用样本的平均数与方差去估计总体的平均数与方差,只要样本的代表性好,这种做法就合理.3.利用频率分布直方图求数字特征:(1)众数是最高的矩形的底边的中点.(2)中位数左右两侧直方图的面积相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.[变式训练]某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.解:(1)由题干图知众数为70+802=75.(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3,即中位数为73.3.1.对众数、中位数、平均数的理解.(1)众数的大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.(2)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(3)平均数的大小与一组数据里每个数据都有关系,任何一个数据的变动都会引起平均数的变动,但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.2.对方差与标准差概念的三点说明.(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).3.有关平均数、方差的一些结论.若数据x1,x2,…,xn的平均数为x-,方差为s2.(1)ax1,ax2,…,axn的平均数为ax-,方差为a2s2.(2)数据mx1+a,mx2+a,…,mxn+a的平均
本文标题:2019秋高中数学 第二章 统计 2.2.2 用样本的数学特征估计总体的数字特征课件 新人教A版必修
链接地址:https://www.777doc.com/doc-8246499 .html