您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 高三总复习52-变量间的相关关系与统计案例
课时作业(五十四)一、选择题1.下列两个变量之间的关系是相关关系的是()A.正方体的棱长与体积B.单位面积的产量为常数时,土地面积与总产量C.日照时间与水稻的亩产量D.电压一定时,电流与电阻解析:A、B、D中两个变量间的关系都是确定的,所以是函数关系;C中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,故选C.答案:C2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生.答案:D3.(2011年陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是()A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)解析:选项具体分析结论A相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度,它们的计算公式也不相同不正确B相关系数的值有正有负,还可以是0,当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量负相关不正确Cl两侧的样本点的个数分布与n的奇偶性无关,也不一定是平均分布不正确D回归直线l一定过样本点中心(x,y);由回归直线方程的计算公式a^=y-b^x可知直线l必过点(x,y)正确答案:D4.(2011年山东)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析:由表可计算x=4+2+3+54=72,y=49+26+39+544=42,因为点72,42在回归直线y^=b^x+a^上,且b^为9.4,所以42=9.4×72+a^,解得a^=9.1,故回归直线方程为y^=9.4x+9.1,令x=6得y^=65.5.答案:B5.(2012年湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重为58.79kg解析:由回归方程求得的数据为近似值,不是确定值.答案:D6.(2013年福建六校联考)在某个物理实验中,测量得变量x和变量y的几组数据,如下表:x0.500.992.013.98y-0.990.010.982.00则对x,y最适合的拟合函数是()A.y=2xB.y=x2-1C.y=2x-2D.y=log2x解析:A选项,y=2x,当x=2时,y=4,与题设坐标相差太远,舍去;B选项,当x=2时,y=3,与题设坐标相差太远,舍去;C选项,当x=2时,y=2,x=4时,y=6,与题设坐标相差太远,舍去;故选择D.答案:D二、填空题7.(2012年东莞模拟)下列是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由其散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y^=-0.7x+a^,则a^=________.解析:a^=y-b^x=3.5+0.7×2.5=5.25.答案:5.258.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:∵k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%9.(2012年洛阳一模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,根据试验数据得到如右图所示的散点图,其中x表示零件的个数,y表示加工时间,则y关于x的线性回归方程是________.解析:x=2+3+4+54=3.5,y=2.5+3+4+4.54=3.5,所以b^=i=14xiyi-4x-y-i=1nx2i-4x2=2×2.5+3×3+4×4+5×4.5-4×3.5222+32+42+52-4×3.52=3.55=0.7.a^=y-b^x=3.5-0.7×3.5=1.05,所以线性回归方程为y^=0.7x+1.05.答案:y^=0.7x+1.05三、解答题10.某地10户家庭的年收入和年饮食支出的统计资料如下:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出是否具有相关关系;(2)若(1)具有线性相关关系,求出y关于x的回归直线方程.解:(1)由题意知,年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示.从图中可以看出,样本点呈条状分布,年收入和年饮食支出具有线性相关关系,因此可以用回归直线方程刻画它们之间的关系.(2)∵x=6,y=1.83,i=110x2i=406,i=110xiyi=117.7,∴b^=i=110xiyi-10x-y-i=110x2i-10x2≈0.172,a^=y-b^x=1.83-0.172×6=0.798.从而得到回归直线方程为y^=0.172x+0.798.11.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:下图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.甲(50岁以下)乙(50岁以上)15386784532023456789015676237964528158(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成2×2列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.解:(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.(2)如表所示.主食蔬菜主食肉类合计50岁以下481250岁以上16218合计201030(3)χ2=30×8-128212×18×20×10=30×120×12012×18×20×10=106.635.∴有99%的把握认为其亲属的饮食习惯与年龄有关.12.(2012年惠州模拟)甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数34815分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数1289分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算x,y的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.10的前提下认为两所学校的数学成绩有差异.甲校乙校总计优秀非优秀总计参考数据与公式:由列联表中数据计算χ2=nad-bc2a+bc+da+cb+d.临界值表P(χ2≥k0)0.100.050.010k02.7063.8416.635解:(1)从甲校抽取110×12001200+1000=60(人),从乙校抽取110×10001200+1000=50(人),故x=10,y=7.(2)估计甲校数学成绩的优秀率为1560×100%=25%,乙校数学成绩的优秀率为2050×100%=40%.(3)表格填写如图,甲校乙校总计优秀152035非优秀453075总计6050110χ2的观测值k=110×15×30-20×45260×50×35×75≈2.8292.706,故在犯错误的概率不超过0.10的前提下认为两个学校的数学成绩有差异.[热点预测]13.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下解析:用回归模型y=7.19x+73.93,只能作预测,其结果不一定是个确定值.答案:C14.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为y^=0.7x+0.35,那么表中t的值为________.解析:样本中心点是(x,y),即4.5,11+t4.因为回归直线过该点,所以11+t4=0.7×4.5+0.35,解得t=3.答案:315.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下表是该生7次考试的成绩.数学888311792108100112物理949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解:(1)x=100+-12-17+17-8+8+0+127=100,y=100+-6-9+8-4+4+1+67=100,所以s2数学=9947=142,s2物理=2507.从而s2数学s2物理,所以物理成绩更稳定.(2)由于x与y之间具有线性相关关系,根据回归系数公式,得到b=497994=0.5,a=100-0.5×100=50,所以线性回归方程为y^=0.5x+50.当y=115时,x=130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
本文标题:高三总复习52-变量间的相关关系与统计案例
链接地址:https://www.777doc.com/doc-1935560 .html