您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 数据分析初步-复习讲义
1/8第三章数据分析初步项目一知识概要1.平均数、中位数、众数的概念及举例一般地,对于n个数x1,x2,…,xn,我们把,叫做这n个数的算术平均数,简称平均数。一般地,n个数据按大小顺序排列,处于的一个数据(或)叫做这组数据的中位数。一组数据中出现次数的那个数据叫做这组数据的众数。2.平均数、中位数、众数的特征(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。(2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。(3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。当一组数据中个别数据变动较大时,可选择中位数来表示这组数据的“集中趋势”。(4)众数的可靠性较差,它不受极端数据的影响,求法简便。当一组数据中某些数据多次重复出现时,众数是我们关心的一种统计量。3.加权平均数例1:统计一名射击运动员在某次训练中15次射击的中靶环数,获得如下数据:6,7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运动员射击的平均成绩。4、方差与标准差在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是标准差公式是2/8项目二例题精讲【例1】.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,共有4个选项:A.1.5小时以上B.1~1.5小时C.0.5—1小时D.0.5小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:(1)本次一共调查了多少名学生?(2)在图1中将选项B的部分补充完整;(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下.图1图2【例2】:某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示鞋的尺码(cm)23.52424.52526销售量(双)13462这组数据的众数和中位数各是多少?3/8【例3】.我市部分学生参加了2004年全国初中数学竞赛决赛,并取得优异成绩.已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:分数段0-1920-3940-5960-7980-99100-119120-140人数0376895563212请根据以上信息解答下列问题:(1)全市共有多少人参加本次数学竞赛决赛?最低分和最高分在什么分数范围?(2)经竞赛组委会评定,竞赛成绩在60分以上(含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;(3)决赛成绩分数的中位数落在哪个分数段内?(4)上表还提供了其他信息,例如:“没获奖的人数为105人”等等.请你再写出两条此表提供的信息.【例4】:某班甲小组有6人,数学平均成绩为80分,乙小组有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?【例5】:求数据1,3,8,4,9,7,5的中位数。4/8【例6】:某次数学测验满分100分,某班的平均成绩为75分,方差为10,若把每位同学的成绩按满分120分进行换算,则换算后的平均成绩与方差分别为()和()。项目三冲刺必练一、判断题1、若一组数据的众数是5,则这组数据中出现次数最多的是5。()2、一组数据的平均数、众数、中位数有可能相同。()3、一组数据的平均数一定大于其中的每一个数据。()4、一组数据中处于最中间位置的一个数据,叫做这组数据的中位数。()5、某产品的销量占某城市同类产品销量的40%,由此可判断该产品在国内同类产品的销量占40%。()二、填空题1、某班45名学生中,14岁的15人,15岁的18人,16岁的11人,17岁的1人,则这个班学生的平均年龄是岁(保留两个有效数字)。2、一组数据1、3、6、a、b的平均数是4,则a与b的和是。3、某公司招聘推销人员,小亮的成绩是:形象84分,语言能力78分,应变能力88分,这三种成绩平均分是,若三种成绩依次按3:4:3的比例来计算,那么这三种测试的平均分是。4、样本数据10、10、x、8的众数与平均数相同,那么这组数据的中位数是。5、已知某次测验的最高分、最低分、平均分、中位数,同学甲要知道自己的成绩,属于班级中较高的一半还是较低的一半,应利用上述数据中的_________。6、如果样本方差s2=14[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2],那么这个样本的平均数为__________,样本容量为________.三、选择题1、若一组数据x1、x2、x3、x4、x5的平均数是a,则另一组数据x1、x2+1、x3+2、x4+3、x5+4的平均数是()(A)a(B)a+2(C)a+5/2(D)a+105/82、当五个整数从小到大排列,其中位数为4,若这组数中的惟一众数为6,则这5个整数可能的最大和为()(A)21(B)22(C)23(D)243、在共有15人参加的“讲诚信”演讲比赛中,参赛选手的成绩各不相同,因此选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的()(A)平均数(B)中位数(C)众数(D)以上答案都不正确4、某校在预防“非典型肺炎”过程中,坚持每日检查体温,下表是该校八年级四班同学一天的体温数据统计表,则该班40名学生体温的中位数是()体温(t℃)36.036.136.236.336.436.536.636.736.836.937.0人数02057563831(A)36.8℃(B)36.5℃(C)36.6℃(D)36.4℃5、A、B、C、D、E五名射击运动员在一次比赛中的平均成绩是80环,而A、B、C三人的平均成绩是78环,那么下列说法中一定正确的是()A.D、E的成绩比其他三人好B.B、E两人的平均成绩是83环C.最高分得主不是A、B、CD.D、E中至少有1人的成绩不少于83环。6、如果a、b、c的中位数与众数都是5,平均数是4,那么a可能是()A.2B.3C.4D.67、由小到大排列一组数据a1、a2、a3、a4、a5,其中每个数据都小于0,则对于样本a1、a2、-a3、-a4、-a5、0的中位数可表示为()A.232aaB.252aaC.205aD.203a6/88、下列说法中正确的有()(1)描述一组数据的平均数只有一个;(2)描述一组数据的中位数只有一个;(3)描述一组数据的众数只有一个;(4)描述一组数据的平均数,中位数,众数都一定是这组数据里的数;(5)一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数,众数,中位数。A.1个B.2个C.3个D.4个9、一城市准备选购一千株高度大约为2m的某种风景树来进行街道绿化,有四个苗圃生产基地投标(单株树的价格都一样).采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下:树苗平均高度(单位:m)标准差甲苗圃1.80.2乙苗圃1.80.6丙苗圃2.00.6丁苗圃2.00.2请你帮采购小组出谋划策,应选购().A.甲苗圃的树苗B.乙苗圃的树苗C.丙苗圃的树苗D.丁苗圃的树苗10、衡量样本和总体的波动大小的特征数是().A.平均数B.方差C.众数D.中位数四、解答题1.已知两组数x1,x2…xn和y1,y2…yn;它们的平均数分别是x和y。分别求下列各组新数据的平均数:(1)5x1,5x2,…,5xn;(2)x1-y1,x2-y2,…,xn-yn;(3)x1,y1,x2,y2,…,xn,yn。7/82.某商厦在“十一长假期间”平均每天的营业额为20万元,由此推断10月份该商厦的总营业额约为20×30=620(万元)。根据你所学的数理统计知识,你认为这样的推断是否合理?为什么?3.右图是某班学生某次英语考试成绩分析图,其中纵轴表示学生数,横轴表示分数,观察图形填空或回答下列问题。(1)全班共有人_______;(2)如果80分以上的成绩算优良,那么该班学生此次英语考试成绩的优良率为______;(3)请估算该班此次考试的平均成绩。4.某中学为了了解全校的耗电情况,抽查了10天中每天的耗电量数据如下表(1)写出上表中数据的众数和平均数;(2)由上题获得的数据,估计该校一个月的耗电量(按30天计算);(3)若当地每度电的价格是0.5元,写出该校应付电费y(元)与天数x(x取正数,单位:天)之间的函数关系式。度数(度)9093102113114120天数(天)1123128/85、汶川地震牵动着全国亿万人民的心,某校为地震灾区开展了“献出我们的爱”赈灾捐款活动。八年级(1)班50名同学积极参加,班长统计了全班捐款情况如下表,因不慎有两处被墨水污染,已无法看清。但知全班平均每人捐款38元,根据以上信息,请你求出捐款40元,50元的学生人数,并写出解答过程;6、在某旅游景区上山的一条小路上,有一些断断续续的台阶,下图是其中的甲、乙两段台阶的示意图(图中的数字表示每一级台阶的高度(单位:cm).并且数据15,16,16,14,14,15的方差,数据11,15,18,17,10,19的方差)。请你用所学过的有关统计的知识(平均数、中位数、方差和极差)回答下列问题:(1)两段台阶路有哪些相同点和不同点?(2)哪段台阶路走起来更舒服?为什么?(3)为方便游客行走,需要重新整修上山的小路.对于这两段台阶路,在台阶数不变的情况下,请提出合理的整修建议.223s甲2353s乙
本文标题:数据分析初步-复习讲义
链接地址:https://www.777doc.com/doc-5819000 .html