您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 第6.2节 多元线性回归分析
第6.2节多元线性回归分析一、多元线性回归模型二、参数的估计三、参数估计量的分布与性质四、回归系数与回归方程的显著性检验五、最优回归方程的选择六、稳健回归121,,,().mYxxxm实际问题中的随机变量通常与多个普通变量有关1212,,,,,,,,,.mmxxxYYxxx对于自变量的一组确定值具有一定的分布若的数学期望存在则它是的函数1212,,,(,,,)mmYxxxxxx的回归函数关于xY一、多元线性回归的数学模型1212(,,,),,,mmxxxxxx若是的线性函数,即20110,(,).mmYxxN~2011,,,,,,.mmxx是与无关的未知参数称其为多元线性回归模型12,,,mxxx01m其中称为回归变量,,,,称为回121212(,,,,)(,,,)(,,,,)iiimimxxxYinxxxYn归系数,是的个观测值,同时它们满足关系0112012,(,),,,,,iimimiiiYxxNin~相互独立.iiY由于相互独立,因而相互独立,且服从正态分布,即201112~(,),,,,iimimYNxxin011,mmEYxx因为则称011ˆmmYxx12,,,mYxxx为关于的线性回归方程为了表述方便,引入矩阵111212122212111,mmnnnmxxxxxxXxxx,21nyyyY01,mB01.m2011012,(,),,,,,iimimiiiYxxNin则~相互独立,此式可以用矩阵表示为YXEYX同时2cov(,)nYYI二、参数的估计221010ˆ()min()nmnmijijijijijijYxYx22ˆ||||min||||YXYXˆ,利用微分法求解即1.参数向量的最小二乘估计上式可以用矩阵表示为10001ˆ(),,,,nmijijikijYxxkm将上式可以改写为1100101ˆˆ(),,,,nnmmniikjijikijikjiijjiYxxxxxkm此式可以用矩阵改写为ˆ()TTXYXX1,TXmXX此方程称为正规方程。由于的秩为所以1(),TXX是正定矩阵,因而存在拟矩阵则1ˆ()TTXXXYˆ将代入回归方程,可得011ˆˆˆˆmmYxx.Y此方程也称为线性回归方程,此方程可以对预测23.未知参数的估计222112*ˆˆˆˆ[()]niiiYxn由6.1节可知,的估计为=2221011*ˆˆˆ[]nmijijijYxnm类似的可以得到多元情形时,的估计为=其矩阵形式为:211*ˆˆˆ()()TYXYXnm=111(())TTTnYIXXXXYnm=11ˆ[()]TTTYYXXnm=例1(p201例6.5)某种水泥在凝固时放出的热量Y与水泥中下列4种化学成份有关:123221323():;():xCaOAlOxCaOSiO32323423442():;():xCaOAlOFeOxCaOSiO通过实验得到下列数据:序号1%x2%x3%x4%xiY172666078.52129155274.331156820104.34113184787.6575263395.661155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.412,,,mYxxx试求关于的线性回归方程解1ˆ()TTXXXY由于,代入相关数据,得01462451550510100144ˆˆˆ(,,,)(.,.,.,.,.)Tˆ将代入回归方程,011ˆˆˆˆmmYxx可以得到回归方程为123462451550510100144ˆ.....Yxxxx3930iˆˆmax(||).,min(||)iiiiiYYYY三、估计量的分布及性质12ˆ,,,nYYY的每一个分量都是的线性组合,因而1ˆm由多元分布理论可知,随机向量服从维正态分布,其期望向量为由上一小节内容可知:11ˆ()()TTTTEXXXEYXXXXˆ因而,是的无偏估计11ˆˆcov(,)()cov(,)()TTTXXXYYXXX12121()()()()TTTnTXXXIXXXXX11ˆ(),TCXXm若令则服从维正态分布,其密度函数为111221122()()||exp{()()},.mTmfxCXCXxR其中性质11ˆYm是的线性函数,服从维正态分布,21,().TXX均值为协方差矩阵为性质2ˆ是的最小方差线性无偏估计..Y若估计量为的线性函数,则称其为线性估计证TT设是的任一线性无偏估计,则必可表为TAY().ETEAYAEYAX而且由的任意性,则1mAXI由于2cov(,)cov(,)()TTTTAYYAAA又考虑到11[()][()]TTTTTAXXXAXXX111()()()()TTTTTTAAXXXXXAAXXX111()()()()TTTTAAXXXXXX1()()TTAAXX1()()TTAAXXT则为非负定的,又由的任意性可知ˆ是的最小方差线性无偏估计.1ˆ,[()],TTnYYXYIXXXXY令则有称其为残差向量.性质3ˆY与互不相关证计算二者的协方差矩阵11ˆcov(,)[()]cov(,)[()]TTTTTnYIXXXXYYXXX2110[()][()]TTTTTnIXXXXXXXˆY因而与互不相关.性质40EY21cov(,)[()]TTnYYIXXXX证这是因为0ˆ()EYEYXXX11cov(,)[()]cov(,)[()]TTTTTnnYYIXXXXYYIXXXX211[()][()]TTTTTnnIXXXXIXXXX21[()]TTnIXXXX估计量的分布2||||,TQYYY设称其为残差平方和,则211nnTiiiiEQEYYEYDY21tr|cov(,)|tr[()]TTnYYIXXXX2211[tr][]mnInm1trAniiiannA其中表示矩阵的迹.2221**ˆˆEQEnm因此,由的定义可知:定理6.21212,(,,,)(,,,)iiimixxxYin若满足多元线性回归模型,则1ˆ()Y与相互独立,且服从正态分布;22*ˆˆ()与相互独立;222311*ˆ()()/~()nmnm证1ˆ()(,)Y由于为相互独立的且服从正态分布的12,,,nYYY的线性组合,因而由多元正态分布理论ˆˆ(,)YY可知,服从正态分布,由性质三可知,与不.相关,因而二者独立22221**ˆˆ()ˆTYYnm由于,结合性质可知,与相互独立.222111*ˆˆˆ()()()()()TnmnmYXYXnm(3)这是由于2ˆˆ()()TYXYX112(())(())TTTTTYXXXXYYXXXXY112(())(())TTTTTTnnYIXXXXIXXXXY12(())TTTnYIXXXXY1(),TTBXXXXBnn设=由于是非负定矩阵,秩为1,mnD则存在阶正交矩阵使得1m+100TDBD0121,,,,,TniDDIim其中211()[()]TTTTTTBBBXXXXXXXXB同时2TTDBDDBD因而2121i=1,,,,iiim即1000mTIDBD则12()(,,,),TnZDYXZZZD令其中为正交矩阵0()EZDEYEXcov(,)cov(,)TZZDYXYXD22cov(,)TTnnDDDIDI12,,,nZZZZ又因为为正态随机向量,上式可以表明20(,)N相互独立,同服从于分布.1ˆ()TTXXXXXXYX由11()()()TTTTTXXXXYXXXXXDZ11ˆˆ()()()()TTTTTTTXXXXZDXXXXXXXXDZ则1()TTTTTTTZDXXXXDZZDBDZTTTTTBB,BBB)BBB,.B由于则=(因而对称1ˆˆ()()0=00TTTTmTTTXXXXZDBDZIZDBDZZZ则222121mZZZ因而12221*ˆ(())()TTTnYIXXXXYnm12()(())()TTTnYXIXXXXYX12(())TTTTnZDIXXXXDZ12(())TTTTnZDIXXXXDZ22221112()nmZZZZ2222mnZZ220112~(,),,,,,,iZNin同时,且相互独立,22211*ˆ()~()nmnm因而推论122221ˆ||||ˆ||||~()QXXXXm与相互独立,且四、回归系数及回归方程的显著性检验01001::(,,)jjHHjm假设检验11()TjjCCXXj设是矩阵的主对角线上第个元素ˆ,jjjC2则D因而1.回归系数的显著性检验构造检验统计量201ˆ~(,)jjjjNC又因为221ˆ~(),jQnmQ且与相互独立,在假设成立时,11ˆ~()/()jjjjTtnmCQnm对于给定的显著性水平,拒绝域为:21{|||()}jjWTTtnmjjT当属于拒绝域时,拒绝原假设,即系数显著不为0.2.回归方程的显著性检验假设检验2211ˆˆ()[()()]nnTiiiiiiQYYYYYY构造检验统计量01100::mjHH至少一个2211ˆˆ()()nniiiABiiYYYYQQ则222211ˆ/()/~()nAiiiQYYnm22221ˆ/()/~()nBiiQYYm22111/()~(,)/()BBAAQmnmQFFmnmQnmmQ对于给定的显著性水平,拒绝域为:1{|(,)}WFFFmnmjF当属于拒绝域时,拒绝原假设,即所有系数显著不为0.例2(续例1)(p207例6.6)005..当时,试检验线性回归方程的显著性解有给定的数据可以计算得到13212715763ˆ().TiiiQyy132147863ˆ().AiiQyy00581114795483844..(,).BAQFFQ因此拒绝原假设,认为线性回归方程是显著的.26679.BTAQQQ例3(续例1)(p207例6.7)00501...当以及时,试检验线性回归方程中回归系数是否显著为0解有给定的数据可以计算得到132147863ˆ().AiiQyy123415511051010101901441ˆˆˆˆ.,.,.,.4786324461341*.ˆ.因此=0.05时,4个系数均显著为0.121211112081707046**
本文标题:第6.2节 多元线性回归分析
链接地址:https://www.777doc.com/doc-3979218 .html