您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 第三讲数据分析初步(一)(含答案)
第三讲数据分析初步(一)知识要点1、平均数、中位数和众数①有n个数x1,x2,…,xn,则x=叫这n个数的平均数.若x1,x2,…,xn的平均数是x,则ax1,ax2,…,axn的平均数是;x1+b,x2+b,…,xn+b的平均数是;ax1+b,ax2+b,…,axn+b的平均数是.②一组数据中出现次数最多的数叫这组数据的众数.③将一组数据按大小依次排列,把处在最中间位置的一个数或最中间的两个数的平均数叫这组数据的中位数.注:平均数、中位数和众数它们都有各自的的特点:平均数:(1)需要全组所有数据来计算;(2)唯一的;(3)易受数据中极端数值的影响.中位数:(1)仅需把数据按顺序排列后即可确定;(2)唯一的;(3)不易受数据中极端数值的影响.众数:(1)通过计数得到;(2)不一定唯一;(3)不易受数据中极端数值的影响.2、加权平均值、算数平均值、几何平均值的计算方法①加权平均值:一般地,对于f1个x1,f2个x2,…,fn个xn,共f1+f2+…+fn个数组成的一组数据的加权平均数为112212nnnxfxfxffff.其中f1,f2,…,fn叫做权,这个“权”,含有权衡所占份量的轻重之意,即if(i=1,2,…k)越大,表明ix的个数越,“权”就越.②有n个数x1,x2,…,xn,则x=叫这n个数的算数平均值.③有n个数x1,x2,…,xn,则x=叫这n个数的几何平均值.典例分析1、(2011苏州)有一组数椐:3,4,5,6,6,则下列四个结论中正确的是()A.这组数据的平均数、众数、中位数分别是4.8,6,6B.这組数据的平均数、众数、中位数分别是5,5,5C.这组数据的平均数、众数、中位数分别是4.8,6,5D.这组数据的平均数、众数、中位数分别是5,6,6解:数椐:3,4,5,6,6的平均数=(3+4+5+6+6)÷5=24÷5=4.8.6出现的次数最多,故众数是6.2、(2008佳木斯)若正数的平均数是,则数据的平均数和中位数是(D)A.B.C.D.3、(2011凉山)为离家某班学生每天使用零花钱的使用情况,张华随机调查了15名同学,结果如下表:每天使用零花钱(单位:元)01345人数13542关于这15名同同学每天使用的零花钱,下列说法正确的是()A.众数是5元B.平均数是2.5元C.极差是4元D.中位数是3元解:∵众数为3元;极差为:5-0=5;一共有15人,∴中位数为第8人所花钱数,∴中位数为3元.245315244351310x≈2.93,故选D.4、(2011百色)我们知道:一个正整数p(p>1)的正因数有两个:1和p,除此之外没有别的正因数,这样的数p称为素数,也称质数.如图是某年某月的日历表,日期31个数中所有的素数的中位数是()A.11B.12C.13D.17解:根据素数的定义,日历表中的素数有:2、3、5、7、11、13、17、19、23、29、31,共11个,∴这组数据的中位数是13.故选C.5、(2011舟山)多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()A.极差是47B.众数是42C.中位数是58D.每月阅读数量超过40的有4个月解:A.极差为:83-28=55,故本选项错误;B.众数为:58,故本选项错误;C.中位数为:(58+58)÷2=58,故本选项正确;D.每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误;故选C.6、(2008衢州)汶川大地震牵动每个人的心,一方有难,八方支援,5位衢州籍在外打工人员也捐款献爱心.已知5人平均捐款560元(每人捐款数额均为百元的整数倍),捐款数额最少的也捐了200元,最多的(只有1人)捐了800元,其中一人捐600元,600元恰好是5人捐款数额的中位数,那么其余两人的捐款数额分别是___________;答案:500元、700元或600元、600元7、(2011浙江衢州)下列材料来自2006年5月衢州有关媒体的真实报道:有关部门进行民众安全感满意度调查,方法是:在全市内采用等距抽样,抽取32个小区,共960户,每户抽一名年满16周岁并能清楚表达意见的人,同时,对比前一年的调查结果,得到统计图如下:写出2005年民众安全感满意度的众数选项是安全;该统计图存在一个明显的错误是2004年满意度统计选项总和不到100%.8、(2011日照)卫生部修订的《公共场所卫生管理条例实施细则》从今年5月1日开始正式实施,这意味着“室内公共场所禁止吸烟”新规正式生效.为配合该项新规的落实,某校组织了部分同学在“城阳社区”开展了“你最支持哪种戒烟方式”的问卷调查,并将调查结果整理后分别制成了如图所示的扇形统计图和条形统计图,但均不完整.请你根据统计图解答下列问题:(1)这次调查中同学们一共调查了多少人?(2)请你把两种统计图补充完整;(3)求以上五种戒烟方式人数的众数.解:(1)这次调查中同学们调查的总人数为20÷10%=200(人);(2)由(1)可知,总人数是300人.药物戒烟:200×15%=45(人);警示戒烟:200×30%=60,强制戒烟:70÷200=35%.完整的统计图如图所示:(3)以上五种戒烟方式人数的众数是20.9、(2011咸宁)某公司为了调动员工的积极性,决定实行目标管理,即确定个人年利润目标,根据目标完成的情况对员工进行适当的奖惩.为了确定这一目标,公司对上一年员工所创的年利润进行了抽样调查,并制成了如右的统计图.(1)求样本容量,并补全条形统计图;(2)求样本的众数,中位数和平均数;(3)如果想让一半左右的员工都能达到目标,你认为个人年利润定为多少合适?如果想确定一个较高的目标,个人年利润又该怎样定才合适?并说明理由.解:(1)设样本容量为x,则5360120x,所以x=15.即样本容量为15.(补全条形统计图如图)(2)样本的众数为4万元;中位数为6万元;平均数为(万元);(3)如果想让一半左右的员工都能达到目标,个人年利润可以定为6万元.因为从样本情况看,个人年利润在6万元以上的有7人,占总数的一半左右.可以估计,如果个人年利润定为6万元,将有一半左右的员工获得奖励.如果想确定一个较高的目标,个人年利润可以定为7.4万元.因为在样本的众数,中位数和平均数中,平均数最大.可以估计,如果个人年利润定为7.4万元,大约会有的员工获得奖励.提高训练1、(2011台湾)下表为某班成绩的次数分配表.已知全班共有38人,且众数为50分,中位数为60分,求x2-2y之值为何()成绩(分)20304050607090100次数(人)235x6y34A.33B.50C.69D.90解:∵全班共有38人,∴x+y=50-(2+3+5+6+3+4)=15,又∵众数为50分,∴x≥8,当x=8时,y=7,中位数是第19,20两个数的平均数,都为60分,则中位数为60分,合题意;当x=9时,y=6,中位数是第19,20两个数的平均数,则中位数为(50+60)÷2=55分,不合题意;同理当x=10,11,12,13,14,15时,中位数都不等于60分,不符合题意.则x=8,y=7.则x2-2y=64-14=50.故选B.2、(2011江西)一组数据:2,3,4,x中,若中位数与平均数相等,则数x不可能是()A、1B、2C、3D、5解:(1)将这组数据从大到小的顺序排列为2,3,x,4,处于中间位置的数是3,x,中位数是(3+x)÷2,平均数为(2+3+4+x)÷4,∴(3+x)÷2=(2+3+4+x)÷4,解得x=3,大小位置与3对调,不影响结果,符合题意;(2)将这组数据从大到小的顺序排列后2,3,4,x,中位数是(3+4)÷2=3.5,此时平均数是(2+3+4+x)÷4=7,解得x=5,符合排列顺序;(3)将这组数据从大到小的顺序排列后x,2,3,4,中位数是(2+3)÷2=2.5,平均数(2+3+4+x)÷4=2.5,解得x=1,符合排列顺序.∴x的值为1、3或5.故选B.3、(2011泰安)甲.乙两人在5次体育测试中的成绩(成绩为整数,满分为100分)如下表,其中乙的第5次成绩的个位数被污损.第1次第2次第3次第4次第5次甲9088879392乙848785989■则乙的平均成绩高于甲的平均成绩的概率是________.解:甲的平均成绩为:9059293878890,乙的被污损的成绩可能是90,91,92,93,94,95,96,97,98,99共10中可能,乙的成绩为97,98,99的时候,平均成绩大于甲的成绩,乙的平均成绩高于甲的平均成绩的概率是103.故答案为:103.4、(2011三明市)某校为庆祝中国共产党90周年,组织全校1800名学生进行党史知识竞赛.为了解本次知识竞赛成绩的分布情况,从中随机抽取了部分学生的成绩进行统计分析,得到如下统计表:根据统计表提供的信息,回答下列问题:(1)a=,b=,c=;(2)上述学生成绩的中位数落在组范围内;(3)如果用扇形统计图表示这次抽样成绩,那么成绩在89.5~100.5范围内的扇形的圆心角为度;(4)若竞赛成绩80分(含80分)以上为优秀,请估计该校本次竞赛成绩优秀的学生有人.解:(1)a=1﹣0.05﹣0.40﹣0.35=0.2,b=3÷0.05×0.40=24,c=3÷0.05=60.(2)从频率分表可看出中位数在79.5~89.5内.(3)360°×0.35=126°(4)1800×(0.40+0.35)=1350.分组频数频率59.5~69.530.0569.5~79.512a79.5~89.5b0.4089.5~100.5210.35合计c15、(2011淄博)“十年树木,百年树人”,教师的素养关系到国家的未来.我市某区招聘音乐教师采用笔试、专业技能测试、说课三种形式进行选拔,这三项的成绩满分均为100分,并按2:3:5的比例折合纳入总分,最后,按照成绩的排序从高到低依次录取.该区要招聘2名音乐教师,通过笔试、专业技能测试筛选出前6名选手进入说课环节,这6名选手的各项成绩见下表:序号123456笔试成绩669086646584专业技能测试成绩959293808892说课成绩857886889485(1)笔试成绩的极差是多少?(2)写出说课成绩的中位数、众数;(3)已知序号为1,2,3,4号选手的成绩分别为84.2分,84.6分,88.1分,80.8分,请你判断这六位选手中序号是多少的选手将被录用?为什么?解:(1)笔试成绩的最高分是90,最低分是64,∴极差=90﹣64=26.(2)将说课成绩按从小到大的顺序排列:78、85、85、86、88、94,∴中位数是(85+86)÷2=85.5,85出现的次数最多,∴众数是85.(3)5号选手的成绩为:65×0.2+88×0.3+94×0.5=86.4分;6号选手的成绩为:84×0.2+92×0.3+85×0.5=86.9分.∵序号为1,2,3,4号选手的成绩分别为84.2分,84.6分,88.1分,80.8分,∴3号选手的成绩最高,应被录取.6、某校260名学生参加植树活动,要求每人植4~7棵,活动结束后随机抽查了20名学生每人的植树量,并分为四种类型,A:4棵;B:5棵;C:6棵;D:7棵.将各类的人数绘制成扇形图(如图14-1)和条形图(如图14-2),经确认扇形图是正确的,而条形图尚有一处错误.回答下列问题:(1)写出条形图中存在的错误,并说明理由;(2)写出这20名学生每人植树量的众数、中位数;(3)在求这20名学生每人植树量的平均数时,小宇是这样分析的:①小宇的分析是从哪一步开始出现错误的?②请你帮他计算出正确的平均数,并估计这260名学生共植树多少棵.解:(1)D有错,理由:10%20=23;(2)众数为5;中位数为5;(3)①第二步;②4458667220x=5.3.估计学生共植树:5.3260=1378(棵).7、为了解某校学生的身高情况
本文标题:第三讲数据分析初步(一)(含答案)
链接地址:https://www.777doc.com/doc-2183817 .html