您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > [苏教版]必修3统计课件――总体特征数的估计(均值、方差、标准差)
中位数:把一组数据按照从小到大(或从大到小)的顺序排列后,处于最中间位置的一个数据(或最中间两个数据的平均数)知识回顾众数:一组数据中出现次数最多的数据众数、中位数都是描述一组数据集中趋势的量,众数考查各数据出现的频率,它的大小只与这组数据中的部分数据有关;中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响。情境一:某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下(单位:厘米):甲:25414037221419392142乙:27164427441640401640问:哪种玉米苗长得高?分析:欲比较哪种玉米苗长得高,可以比较一下它们的平均高!反映了总体的某种特征总体特征数3031总体特征数:通常把能反映总体某种特征的量称为总体特征数如何反映总体的特征数?用样本的特征数估计总体的特征数!情境二:在利用单摆检验重力加速度的实验中,全班同学在相同的条件下进行测试,得到下列数据(单位:m/s²)9.629.549.789.9410.019.669.889.6810.329.769.459.999.819.569.789.729.939.949.659.799.429.689.709.849.90怎样利用这些数据对重力加速度进行估计?平均数问题转化为:实验结果测得一组数据为用作为重力加速度“最理想的”近似值,依据是什么呢?12,,naaa算术平均数11niian=12naaan=a读作:平均a处理实验数据的原则是使这个近似值与实验数据之间的离差(偏差)最小、设近似值为x,则它与n个实验值ai(i=1,2,3,…,n)的离差分别为x-a1,x-a2,…,x-an平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小。称为这n个数的平均数或者均值例1某校高一年级的甲乙两个班级(均为50人)的数学成绩如下(总分150),试确定这次考试中,哪个班的数学成绩更好一些.甲班乙班甲班均分乙班均分1128610684100105981029410787112949499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110思考某公司内部结构以及工资分布:人员经理管理人员技工工人学徒合计月工资11000125011001000500人数165101023某公司有经理1人,另有6名管理人员,5名高级技工,10名工人和10名学徒,现需要增加一名新工人。小张前来应聘,经理说:“我公司报酬不错,平均工资每月1695元。”小张工作几天后找到经理说:“你欺骗了我,我问过其他工人,每月一个人的工资超过1500元,平均月工资怎么能是1695元呢?”经理拿出如下表所示的工资表说:“你看,平均周工资就是1695元。”在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?总体月平均数不能反映工人的月工资水平,因为公司中少数人的月工资额与大多数人的月工资额差别较大,这样导致平均数与中位数的偏差较大,所以周平均数不能反映这个公司工人的月工资水平,而应该应用中位数或众数来反映工人的月工资水平在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?例2:由下表计算学生日睡眠时间[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.02合计1001例3高一(1)班学生年龄统计:(班级共有43人)其中有20人18岁,13人17岁,7人16岁,,3人15岁,求该班级的平均年龄。分析在班级年龄序列中18出现了20次,17出现了13次,16出现了7次,15出现了3次解:2013181717133465x“加权平均数”17201373434318413131647815加权平均值(用频率计算平均值)一般地,若取值为,出现的次数分别为,设频率为12,,nxxx12,nfff12,,nppp则其加权平均数为1122nnxpxpxp其中12(1)nppp收入范围所占百分比10000至1500010%15000至2000015%20000至2500020%25000至3000025%30000至3500015%35000至4000010%40000至500005%例4:由某单位年收入表试估计该单位职工的平均年输入情境一:某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:甲:31323537333032313029乙:53165413661613111662问:哪种玉米苗长得高?哪种玉米苗长得齐?x=32乙x=32甲怎么办呢?甲37(最大值)29(最小值)8乙66(最大值)11(最小值)55极差甲:31323537333032313029乙:53165413661613111662甲32372937321166乙极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度如果甲乙两组数据的集中程度差异不大时,怎么办呢?我们可以考虑每一株的高度与平均高度的离差离差的平方和越小,长的越齐考察样本数据的分散程度的大小,最常用的统计量是方差和标准差。设一组样本数据,其平均数为,则12,,nxxxx称s2为这个样本的方差,11()niisxxn称为这个样本的标准差,分别称为样本方差、样本标准差2222121()()()nsxxxxxxn2211()niisxxn即它的算术平方根•样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;•样本方差的算术平方根叫做样本标准差。因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们标准差来刻画一组数据的稳定程度.方差和标准差的意义:描述一个样本和总体的波动(离散程度)大小的特征数,标准差大说明波动大.极差、方差与标准差的区别和联系:都是用来描述数据的离散程度,其中极差是数据最大值与最小值的差,反映了一组数据的变化的最大幅度,它对一组数据中的极端值非常敏感。方差反映一组数据围绕平均数波动的大小,标准差是以样本数据为单位表示波动幅度。例1:从高一(1)班的一次数学测验抽取一小组成绩如下(保留整数):859080808575100计算这组样本数据的极差、方差和标准差.例2.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定。品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8例3.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差。天数151~180181~210211~240241~270271~300301~330331~360361~390灯泡数11118202516721、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为_________________;2、已知数据的方差为2,则求数据的方差、标准差。123,,aaa1232,2,2aaa9.5,0.016课本P68练习1、22、极差是体现数据离散程度1、(算术)平均数3、方差、标准差是体现稳定性
本文标题:[苏教版]必修3统计课件――总体特征数的估计(均值、方差、标准差)
链接地址:https://www.777doc.com/doc-3600371 .html