您好,欢迎访问三七文档
统计复习收集数据(随机抽样)整理、分析数据、估计、推断简单随机抽样系统抽样变量间的相关关系线性回归分析样本估计总体样本特征数估计总体数字特征样本频率分布估计总体分布分层抽样(1)平均数(2)方差(3)众数(4)中位数(1)频率分布表(2)直方图(3)折线图(4)茎叶图3总体:所有考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。4抽取样本要求:总体中每个个体被抽取的机会相等(1)简单随机抽样抽签法;随机数法(2)系统抽样(3)分层抽样51、抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,可用小球、卡片、纸条等制作号签(3)将这些号签放在同一个容器中,搅拌均匀(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本62、随机数表法步骤(1)将总体中的个体编号(编号时位数要一样);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本7系统抽样步骤:1.编号随机剔除多余个体,再编号。2.分组(组数等于样本容量)间隔长度k=N/n3.抽取第一个个体编号为i(i=k)4.依预定的规则抽取余下的个体编号为i+k,i+2k,…(加等间隔)8分层抽样步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样(可用简单随机抽样或系统抽样)类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取总体中的个体个数较______抽样过程中每个个体被抽到的可能性相同系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体个数较_____分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由________几部分组成三种抽样方法少多差异明显1、极差=_______________________。2、组距=3、组数k=__________________4、频率分布直方图:横轴表示“样本数据”,纵轴表示________。其中各小组的频率=_________频数=各小矩形的面积=_____________;所有小矩形的面积之和=____。5、频率分布折线图:连接频率分布直方图中各小矩形上端的点而得的折线图。-最大值最小值频数组距样本容量频数组距组距1中极差组数极差组距N作样本频率分布直方图的步骤:频率组距0.150.1250.10.0750.05克09698100102104106三、估计1、众数:最高矩形的中点.如右图为2、中位数:左右两边直方图的面积相等.如右图为3、平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.如右图为4、标准差和方差:描述数据波动或离散程度的大小。它们越小,离散程度越,数据越。s=标准差2s方差小集中22212[()()()]/nxxxxxxn22212[()()()]/nxxxxxxn10111013101.312茎叶图作法:第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在中间。第三步,将各个数据的叶按大小次序写在茎右(左)侧.变量间的相关关系最小二乘法得回归直线方程:axby必经过样本中心点(,)其中,b=121niiiniixxyyxx(数据较大时用)=niiniiixnxyxnyx1221(数据较小时用)aybxxy1.现有以下两项调查:①某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共1500家,三者数量之比为1∶5∶9.为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成①、②这两项调查宜采用的抽样方法依次是()A、简单随机抽样法,分层抽样法B、分层抽样法,简单随机抽样法C、分层抽样法,系统抽样法D、系统抽样法,分层抽样法D2.要从已编号(1~60)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是()A.5,10,15,20,25,30B.3,13,23,33,43,53C.1,2,3,4,5,6D.2,8,14,20,26,32B3、将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n的值为()A、640B、320C、240D、1604、将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于.5、一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x=B60216、下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是^0.7yax,则a=______。月份x1234用水量y4.5432.55.25例1:2009年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取100展位的成交额(万元),制成如下频率分布表和频率分布直方图.(1)完成频率分布表;(2)估计成交额在[190,230)的摊位个数;(3)估计成交额的中位数、众数和平均数.分组频数频率频率/组距[150,170)40.04[170,190)0.05[190,210)[210,230)[230,250]5合计0.051536500.500.05100频率/组距0.0021501701902102302500.0060.0100.0140.0180.0220.026万元0.360.040.050.360.500.050.0020.00250.0180.0250.0025频率/组距0.0021501701902102302500.0060.0100.0140.0180.0220.026万元0.040.050.360.500.05由直方图可估计:众数:中位数:平均数:最高矩形区间中点左右面积相等区间中点与相应矩形面积之积的和220万元212万元209.4万元(2)在抽取的100个摊位中,在成交额在[190,230)的86个,所以在成交额在[190,230)中的摊位有4300个例2:在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲273830373531乙332938342836(1)画出数据的茎叶图;(2)计算甲、乙平均数、标准差并判断选谁参加某项重大比赛更合适.甲乙23701578643988(1)所以,乙的成绩比甲稳定,应选乙参加比赛更合适。222222222222222233=33147=[632245],63138=[540135],63xxssss甲乙甲乙乙甲(2)由茎叶图可知:,乙比较稳定x3456y2.5344.5例3、下表为某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出回归方程;(3)已知该厂技术改造前100吨甲产品的生产能耗90吨标准煤。试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(2)所以线性回归方程为y=0.7x+0.355.3,5.4yx7.05.44865.35.445.66ˆ2b35.0297.05.3ˆa由系数公式可知,(3)ˆ100,0.71000.3570.35xy当,所以,预测生产100吨甲产品的生产能耗比技术改造前降低了19.65吨标准煤。【课后作业】1、某工厂生产A、B、C三种不同型号的产品,产品的数量之比依次为3∶4∶7,现用分层抽样法抽出容量为n的样本,样本中A型产品有15件,则样本容量n=()A.50B.60C.70D.802、一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,所得新数据的平均数和方差分别是()A57.2和3.6B57.2和56.4C62.8和63.6D62.8和3.63、某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是().A.3.5B.-3C.3D.-0.5CDB4、某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行驶时速(单位:km/h)如下:上班时间:303318253240262821283520下班时间:271932293629302225161730用茎叶图表示上面的样本数据,计算上、下班的平均数和方差。=26x下班21=366s下班=28x上班2=38s上班5、为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高),分组情况如下:分组147.~155.5155.5~163.5163.~171.5171.5~179.5频数62127m=6频率0.10.35a=0.450.1(1)求出表中a,m的值.(2)画出频率分布直方图(1)6,0.45ma身高频率组距x23456y2.23.85.56.576、设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:若i=15x2i=90,i=15y2i=140.8,i=15xiyi=112.3:(1)求x,y;(2)若x与y具有线性相关关系,求出线性回归方程;(3)估计使用年限为10年时,维修费用约是多少?解:(1)x=2+3+4+5+65=4.y=2.2+3.8+5.5+6.5+7.05=5.(2)b^=5152215()iiiiixyxyxx=112.3-5×4×590-5×42=1.23,a^=y-b^x=5-1.23×4=0.08.所以线性回归方程为y^=1.23x+0.08.(3)当x=10时,y^=1.23×10+0.08=12.38(万元),即估计使用10年时,维修费用约为12.38万元.
本文标题:《统计》复习课件
链接地址:https://www.777doc.com/doc-1791692 .html