您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 集美大学-实用统计方法-信计专业
-1-第一章:最小二乘估计、检验统计量的最小二乘估计:选择时的误差项的平方和最小21()nTiiS,最后导出1()TTXXXY的最大释然估计:21122221221111()exp{()}exp{()}22(2)(2)niiinnjnnLYXXS也是使得()S所以和上面相同。【作业2】考虑回归模型:1122iiiiYXX,1,2in其中(1,2)iin互不相关且()0iE,2()iVar(1)求1和2的最小二乘估计(2)设2~(0,)iN求1,2的极大似然估计,它们和(1)中的最小二乘估计是否相同?解:(1)最小二乘估计:令12nYYYY,1121212212nnXXXXXXX,12,12n则该回归模型课简化为:YX,要使误差项的平方和:2^22211221111()()()()()nnnTTiiijjiiiiijiSYXYXYXYXX达到最小,则分别对1,2求偏导并令其为0,得:211()2()0(1,2)niijjikijkSYXXk即:2211111(),(1,2)nnniikijikjijikjiijjiYXXXXXk,即:TTXXXY()()2TrankXXrankX,1()TXX存在所以解正规方程即得:12的最小二乘估计112()TTXXXY,即为所求。(2)2~(0,)iN,则(1,2)iYin相互独立,且21122~(,)iiiYNXX所以12(,,)TnYYYY的似然函数为:21122221221111()exp{()}exp{()}22(2)(2)niiinnjnnLYXXS求使()L达最大,即使()S达最小,1()TTXXXY即1,2的极大似然估计和(1)中最小二乘估计相同-2-【作业6】在某水源问题的研究中,考虑下述回归模型:0112231243,1,2iiiiiiiYXXXXXin写出下列情况下的约简模型,检验统计量及检验准则:(1)340(3)125解:(1)约简模型01122(1,2)iiiiYXXin,检验统计量()()()RFFSSERSSEFffFSSEFf1212343412()()(,)(,,,)(,|,)SSERSSEFSSExxSSExxxxSSRxxxx3Rfn,5Ffn,34123412(,|,)(,|,)225SSRxxxxSSRxxxxFSSEMSEn,检验准则:检验假设034134:0:HH,给定显著性水平,则0000(2,5),(2,5),FFFnHFFFnH若的观测值接受若的观测值拒绝(2)因为125,所以约简模型:012312435)iiiiYXXXXX(120312435)(1,2)iiiiYXXXXXin(检验统计量120312435)(1,2)iiiiYXXXXXin(3Rfn,5Ffn,()()()()~(2,5)()RFFSSERSSEFffSSERSSEFFFnSSEFMSFf假设检验012112:5:HH,则0000(2,5),(2,5),FFFnHFFFnH若的观测值接受若的观测值拒绝第二章:1.主成分分析:11122122(,)(,)(,)(,)CovXXCovXXCovXXCovXX,(,)ijijiijjCovXX方法:①由协方差矩阵求特征值;②正交单位化特征向量ie(将特征值代入,算出X,可以得到关系式,再加上22121XX)③各个主成分就是TiiYeX;④第一主成分即为最大除以总和2.相关矩阵:另外,在各个变量方差差别太大的情况下,需要将协方差矩阵转换成相关矩阵【作业1】设总体12TXXX的协方差矩阵为5222E,求X的主成分1Y和2Y并计算第一主成分1Y的贡献率解:设特征值为,52022,得126,1,相应的特征向量125555Te,252555Te-3-因此X的主成分111225555TYeXXX,221252555TYeXXX,第一主成分的贡献率为661=85.7%【作业2】变换协方差矩阵5222为相关矩阵(1)求其标准化变量的主成分*1Y和*2Y及第一主成分*1Y的贡献率;(2)与第一题中的结果作比较有什么差异?(3)计算*1Y与*1X,*1Y与*2X及*2Y与*1X之间的相关系数,其中*1X与*2X为1X与2X的标准化变量,这些量有何统计意义?解:(1)2101152521011525得其特征值及其相应的正交单位化特征向量:*11015,得*12222Te,*21015,*22222Te则*X的两个主成分:***11211222210122102YXXXX***21211222210122102YXXXX,第一主成分的贡献率为:101581.6%2(2)第一主成分的贡献率有所下降,且1X,2X的权重由255和55变为22和22,即2X的相对重要性得到提升********11211221221221110110()()()2(,)()12222222525VarYVarXXVarXCovXXVarX********21211222221221110110()()()2(,)()12222222525VarYVarXXVarXCovXXVarX*********111211112222222102552(,)(,)(,)(,)222222510CovYXCovXXXCovXXCovXX*****121222222105225(,)(,)2222510CovYXCovXXX*****211212222105225(,)(,)2222510CovYXCovXXX**11**11,**11(,)2552()()101015YXCovYXVarYVarX,**12**12,**12(,)2552()()101015YXCovYXVarYVarX-4-**21**21,**21(,)5225()()101015YXCovYXVarYVarX统计意义:它反应了变量之间的相关程度,因为*1Y是第一主成分,所以相关度比较高第三章:距离判别和Bayes判别1.距离判别:①计算样本均值()()11knkkkiikxxn②协方差矩阵()()()()11()()1knkkkkTiikikSxxxxn③无偏估计112212(1)(1)2nSnSnn④判断1是否等于2,得出判别函数W(x)分以下两种情况:若不等11212211()TTWxxxxx,若相等112()TWxx注:这里需要求逆矩阵:用矩阵行变换1AIIA2.Bayes判别:概率密度函数:1()fx和2()fx,先验概率分布为12,qq误判损失为(2|1),(1|2)cc,则判别函数为:1212112221()(1|2),()(2|1)()(1|2),()(2|1)fxqcxGfxqcfxqcxGfxqc若若【作业1】设1G2G为两个二维总体,从中分别抽取容量为3的训练样本如下:12137:2447xxG,12269:5748xxG(1)求两样本的样本均值向量(1)(2),xx和样本协方差矩阵1S2S;(2)假定两总体协方差矩阵相等,记为,用1S2S联合估计;(3)建立距离判别法的判别准则;(4)设有一新样品012,(2,7)TTxxx,利用(3)中判别准则判定它属于哪一个。解:(1)(1)1(3,6)Tx,(2)2(5,8)Tx,3(1)(1)(1)(1)1101123111()()(01)(12)(11)121363122TiiiSxxxx3(2)(2)(2)(2)2110121111()()(11)(01)(10)110123122TiiiSxxxx(2)121211(31)(31)22123324SSSS(3)由上可知12,(1)1(3,6)Tx,(2)2(5,8)Tx,可求得12111,122,2T-5-判别函数估计11212121()()()4,72,24,72,08211TTTTWxxxxxx当12()0,()0,WxxGWxxG,即11224,4,xxGxxG(4)把02,7Tx代入判别函数,可知()40Wx,所以01xG【作业3】已知两总体的概率密度函数分别为1()fx和2()fx,且总体的先验概率分布为120.2,0.8qq误判损失为(2|1)50,(1|2)100cc.(1)按总期望损失达到最小,建立Bayes判别准则;(2)设有一新样品0x满足1020()0.3,()0.5fxfx,判定0x的归属问题解:(1)要使总期望损失L最小,根据题目已知条件可建立Bayes判别准则:1212112221()(1|2)0.8100,8()(2|1)0.250()(1|2),8()(2|1)fxqcxGfxqcfxqcxGfxqc若若(2)把1020()0.3,()0.5fxfx代入判别函数可得1020()0.30.68()0.5fxfx,所以0x属于2G第四章:谱系聚类和模糊聚类1.谱系聚类:有三种方法,最短距离法、最长距离法、类平均法方法:参考【作业1】,三种方法主要在于合并时产生新类的元素不同(min,max,avg)对样品的距离矩阵不管用什么方法每次都是选取最小距离来做对于变量的相关系数矩阵不管用什么方法每次都是用最大的系数来做,2.模糊聚类:褶积的计算:(把i行和j行写下来,两行中相对应列的元素取最小(两两比较),得到一行,在这行中取最大)方法:①计算相似系数矩阵R或样品的距离矩阵D;②对于距离矩阵D由1,11max{}ijijijijndad得到模糊矩阵A;③判断模糊等价矩阵:计算褶积2422,AAAAAA直到2kkAA,kA就是一个模糊等价矩阵记为()ijAa~~;④对ija~按从大到小排列;⑤依次从大开始取,得到-截阵(ija取1,否则取0),元素1的归为一类;画图;【作业1】考虑下列四个样品的距离矩阵{1}{2}{3}{4}{1}0{2}10{3}1120{4}5340D(1)用最短距离法、
本文标题:集美大学-实用统计方法-信计专业
链接地址:https://www.777doc.com/doc-4767399 .html