您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 31回归分析的基本思想及初步应用(1)
1.(3,4),(3)0.05,(39)XNPXPX已知且则1231232.(10,),(,0.1),(,),3,2.7.XBpXBnXBnpEXDXDX已知且,求3.X已知的分布列为:X37a11Pb0.10.30.26.8,EXab且,求324.()26652fxxxx已知(1)求函数在(2,f(2))处的切线方程;()求该函数的单调区间。(3)求函数在[0,3]上的最值。5.()()()fxfxfx已知函数的导函数的图像如图所示,求的单调区间,和极大值点,极小值点。xy0滨海中学高二数学组必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析统计的基本思想y=f(x)y=f(x)y=f(x)实际样本模拟抽样分析问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-------有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):2、现实生活中存在着大量的相关关系。如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455散点图1020304050500450400350300·······xy施化肥量水稻产量n2iii=1Q(a,b)=(y-bx-a)取最小值时,a,b的值.推导过程请阅读P92ii(x,y)ii(x,y)|ii|y-y最小二乘法:ˆˆˆy=bx+a(x,y)称为样本中心点ˆˆˆn(x-x)(y-y)iii=1b=n2(x-x)ii=1a=y-bx.nn11其中x=x,y=y.iinni=1i=1niii=1n22ii=1xy-nxy=,x-nx3、对两个变量进行的线性分析叫做线性回归分析。2、回归直线方程:ˆˆˆnniiiii=1i=1nn222iii=1i=1(x-x)(y-y)x-nxyb==,(x-x)x-nxa=y-bxy2.相应的直线叫做回归直线。1、所求直线方程叫做回归直---线方程;其中ˆˆˆy=bx+a1.如下是一组样本数据表,x123456y0.91.83.14.24.96ˆˆˆybxa则回归直线恒过点().(1,1)A.(3,3)B.(6,6)C.(3.5,10.45)D相关系数•1.计算公式•2.相关系数的性质•(1)|r|≤1.•(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.•问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?niii=1nn22iii=1i=1(x-x)(y-y)r=(x-x)(y-y)n(x-x)(y-y)iii=1r=nn22(x-x)×(y-y)iii=1i=1相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;正相关负相关·······1020304050500450400350300xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455解:1.画出散点图2.求出b=4.75,a=256.793.写出回归方程ˆy=4.75x+256.794.计算相关系数r=0.9718练习:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产品x吨与相应的生产能耗y(吨标准煤)的几组对照数据,求出相关的线性回归方程。x3456y2.5344.54.5,3.5,xy解:经计算7ˆ0.710ˆˆ0.35inniiii=1i=1nn222iii=1i=1(x-x)(y-y)xy-nxyb==(x-x)x-nxa=y-bxˆ0.70.35yx所以回归直线为例题1从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。ˆy=0.849x-85.172分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.ˆ身高172cm女大学生体重y=0.849×172-85.712=60.316(kg)经计算(1)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。ˆy图表标题=0.8485x-85.712020406080150160170180体重线性(体重)线性(体重)线性(体重)ˆy(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差。ˆy图表标题y=0.8485x-85.712020406080150160170180体重线性(体重)线性(体重)线性(体重)2它的均值E(e)=0,方差D(e)=σ0线性回归模型y=bx+a+e2E(e)=0,D(e)=σˆyy=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差。为了衡量预报的精度,需要估计的σ2值?(1,2,....)ˆˆˆˆˆiiiiiiybxainyyybxaiiiii随机误差e其估计值为:ee称为相应点(x,y)的残差22111ˆˆˆˆ(,)(2)22ˆˆ(,)niieQabnnnQab类比样本方差估计总体方差的思想称为残差平方和21(,)()niiiQyx(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差来判断模型拟合的效果这种分析工作称为残差分析1,2,3,,ˆˆˆˆ.....neeee残差-4000-20000200040006000024681012残差使学生了解残差图的制作及作用。P98•坐标纵轴为残差变量,横轴可以有不同的选择;•若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;•对于远离横轴的点,要特别注意。•错误数据•模型问题身高与体重残差图异常点作业:P104习题3.1第1题
本文标题:31回归分析的基本思想及初步应用(1)
链接地址:https://www.777doc.com/doc-3340578 .html