您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 用样本估计总体与变量间的相关关系-概率、统计与统计案例 2012高考一轮数学精品课件
学案4用样本估计总体与变量间的相关关系用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况.比例大小返回目录(2)频率分布折线图连接频率分布直方图中各小长方形,就得到频率分布折线图.(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(4)茎叶图2.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数上端的中点众数:在样本数据中,频率分布最大值所对应的样本数据;中位数:样本数据中,累积频率为0.5时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);平均数:样本数据的算术平均数,即x=.(2)标准差的计算公式:s=.3.从散点图上看,点散布在就称这种相关关系为正相关,如果点散布在返回目录)xx(xn1n21+…++从左下角到右上角的区域内从左上角到右下角的区域内就称这种相关关系为负相关.[]2n2221x)-(xx)-(xx)-(xn1+…++4.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有,这条直线叫做回归直线,回归直线方程常记作.5.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),用最小二乘法,求回归直线系数a,b的公式为b==,a=.其中,x=,y=.返回目录y-bxxn1in1i∑=yn1in1i∑=线性相关关系x)-(xy)-x)(y-(x2in1iiin1i∑∑==nx-xyxn-yx22in1iiin1i∑∑==bx+a=yˆ通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.返回目录(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2返回目录对某电子元件进行寿命追踪调查,情况如下:寿命(h)[100,200)[200,300)[300,400)[400,500)[500,600)个数(个)2030804030考点一绘制频率分布直方图返回目录【分析】按要求列表、绘图,用样本的分布估计总体的分布.(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)以内的概率;(4)估计电子元件寿命在400h以上的概率.返回目录寿命(h)频数频率[100,200)200.10[200,300)300.15[300,400)800.40[400,500)400.20[500,600)300.15合计2001.00【解析】(1)样本频率分布表如下:(2)频率分布直方图如图.返回目录(3)由频率分布表可以看出,寿命在[100,400)内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在[100,400)内的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.返回目录【评析】(1)列频率分布表时要注意区分频数、频率的意义.(2)画频率分布直方图时要注意纵、横坐标代表的意义及单位.(3)通过本题可以掌握总体分布估计的各种常见步骤和方法.(4)解决总体分布估计问题的一般步骤如下:①先确定分组的组数;②分别计算各组的频数及频率(频率=);③画出频率分布直方图,并作出相应的估计.返回目录频数总数*对应演练*从某校高一年级的1002名新生中,用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm),试作出该样本的频率分布表和频率分布直方图.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163161158168167161162167168161165174156167166162161164166返回目录返回目录(1)在全部数据中找出最大值180和最小值151,则两者之差为29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组.(2)从第一组(150.5,153.5开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:分组频数频率[150.5,153.5)40.04[153.5,156.5)80.08[156.5,159.5)80.08[159.5,162.5)110.11[162.5,165.5)220.22[165.5,168.5)190.19[168.5,171.5)140.14[171.5,174.5)70.07[174.5,177.5)40.04[177.5,180.5]30.03合计1001返回目录返回目录(3)作直角坐标系,以横轴表示身高,纵轴表示.(4)在横轴上标上150.5,153.5,156.5,…,180.5表示的点.(5)在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,高等于该组的.至此,就得到了这组数据的频率分布直方图,如图所示.频率组距频率组距返回目录为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如图10-4-6所示:考点二频率分布直方图的应用【解析】(1)样本数据落在[62.5,64.5)内的频率为0.07×2=0.14.(2)众数为=65.5(kg).【分析】在频率直方图中,频率等于矩形的面积,每一小组的频率等于这小组的频数与样本容量的商,而众数是最高矩形的中点.(1)样本数据落在[62.5,64.5)内的频率是多少?(2)100名学生的体重的众数是多少?返回目录266.564.5+【评析】解决该类问题时应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布.其中,①频率分布直方图中纵轴表示,频率=;②频率分布直方图中,各小长方形的面积之和为1,长因此在频率分布直方图中,组距是一个固定值,所以长方形高的比也就是频率之比;③频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观;④众数为最高矩形的中点;⑤中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.返回目录频率组距频数样本容量返回目录*对应演练*在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日到30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2:3:4:6:4:1,第三组的频数为12,请回答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件,2件作品获奖,问这两组哪组获奖率最高?返回目录返回目录(1)依题意知第三组的频率为又因为第三组的频数为12,所以本次活动的参评作品数为=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18(件).(3)第四组的获奖率是.第六组上交的作品数量为60×=3(件),∴第六组的获奖率为,显然第六组的获奖率较高..511464324=+++++51121464326+++++951810=1464321+++++9632=返回目录甲、乙两台机床同时加工直径为10mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm)甲:99,100,98,100,100,103乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.考点三用样本的数字特征估计总体的数字特征返回目录【解析】(1)x甲==100,x乙==100,=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=.=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)因为,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.61031001009810099+++++61001009910210099+++++2s甲61372s乙612s甲2s乙【分析】已知一组数据x1,x2,…,xn,其平均数为x,方差为s2=,标准差为.x)-x(n12i1∑ni=【分析】已知一组数据x1,x2,…,xn,其平均数为x,方差为s2=,标准差为.x)-x(n12i1∑ni=【评析】两个机床加工零件的平均数相等,平均数描述了数据的平均水平,要说明哪一台机床加工的零件更符合要求,可再用方差来判断.平均数和标准差超过了规定界限时,说明这批产品质量与生产要求有较大偏差.返回目录返回目录*对应演练*甲、乙两种冬小麦试验品种连续x年的平均单位面积产量如下:试根据这组数据,估计哪一种小麦品种产量较稳定.品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8返回目录甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02;乙品种的样本平均数也是10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24>0.02.所以,由这组数据可以认为甲种小麦的产量比乙种小麦的产量较稳定.返回目录某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示:(3)将两组数据比较,说明哪个车间产品较稳定.考点四茎叶图返回目录【解析】(1)因为间隔时间相同,故是系统抽样.(2)茎叶图如图所示:【分析】(1)根据各种抽样的特点判断.(2)求出两组数据的平均值与方差进行比较.(3)甲车间:平均值:x1=(102+101+99+98+103+98+99)=100.方差:=[(102-100)2+(101-100)2+…+(99-100)2]≈3.4286.乙车间:平均值:x2=(110+115+90+85+75+115+110)=100,方差:=[(110-100)2+(115-100)2+…+(110-100)2]≈228.5714.∵x1=x2,,∴甲车间产品稳定.返回目录21s717122s717121s22s【评析】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.返回目录*对应演练*某中学高一(2)班甲、乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩茎叶图.请根据茎叶
本文标题:用样本估计总体与变量间的相关关系-概率、统计与统计案例 2012高考一轮数学精品课件
链接地址:https://www.777doc.com/doc-3590868 .html