您好,欢迎访问三七文档
多元数据分析练习题第二章多元正态的参数估计一.判断题(1)若),,(~),,,(21pTpNXXXX是对角矩阵,则pXXX,,,21相互独立。()(2)多元正态分布的任何边缘分布为正态分布,反之也成立。()(3)对任意的随机向量TpXXXX),,,(21来说,其协方差矩阵是对称矩阵,并且总是半正定的。()(4)对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。()(5)若),,(~),,,(21pTpNXXXXSX,分别为样本均值和样本协差阵,则SnX1,分别为,的无偏估计。()二.计算题1.假设随机向量TXXXX),,(321的协方差矩阵为9232443416,试求相关系数矩阵R。131413112141211R2.假设随机向量Txxx),(21的协方差矩阵为20119,令212211,2xxyxxy,试求Tyyy),(21的协方差矩阵。2733603.假设5.005.05.015.0),,(~3ANX,其中T)1,2,1(,411121112,试求Axy的分布。)2224,02(2N三.证明题1.设)()2()1(,,,nXXX是来自),(pN的随机样本,X为样本均值。试证明:)(XE,nXD1)(。2.设)()2()1(,,,nXXX是来自),(pN的随机样本,Sn11为样本协差阵。试证明:)11(SnE。3.证明:若p维正态随机向量),,,(21pXXXX的协差阵为对角矩阵,则X的各分量是相互独立的随机变量。第四章判别分析一.判断题1.从某种意义上讲,距离判别是Bayes判别的一种特例。()2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。()3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。欧氏距离是马氏距离的一种特例。()4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。()5.在贝叶斯判别法中,),,,(21kRRRR是一个划分,)(xhi是将样品误判给总体iG的加权平均损失,则kixhxhxRjkjii,,2,1)},(min)({1。()6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。()二.计算题1.设有两个正态总体21,GG,已知:1114,4223,32)2(,52)1(21(1)建立距离判别法的判别准则;(2)判断:样品:31X,应归属于哪一类?2Gx(答案:)52281024(31),(),51224434(81),(212122212212122211xxxxxxGxDxxxxxxGxD)2.设G1,G2为两个二元总体,从中分别抽取容量为3的样本如下:x1x2x1x23724:G1476957:G248(1)求两样本的样本均值)2()1(,xx及协方差矩阵21,SS;TTxx)8,5(,)6,3()2()1(2112,633221SS(2)假定两总体协方差矩阵相等,记为,用21,SS联合估计;111221,211121(3)建立距离判别法则;2211212121,0),(;,0),(),253(2),(GxxxWGxxxWxxxxW(4)假设有一新样品TTxxx)7,2()2,1(0,进行距离判别。2Gx3.已知两总体的概率密度分别为)(1xf和)(2xf,且总体的先验分布为8.0,2.021pp,误判损失为100)21(,50)12(cc。(1)建立Bayes判别准则;(2)假设有一新样品0x满足3.6)(01xf和5.0)(02xf,判定0x的归属问题。4.假设两总体G1,G2的概率密度分别为1,1)(1xxxf和5.15.0,5.01)(2xxxf。(1)做出)(1xf和)(2xf的图像。若假定先验概率21pp,)21()12(cc,求Bayes判别区间的临界点;(0.25)(2)若8.0,2.021pp,)21()12(cc,求Bayes判别区间的临界点;(-0.33)5.假定有321,,GGG三个组,已知30.0,65.0,05.0321ppp,10.0)(01xf和63.0)(02xf,4.2)(03xf。(1)若不计误判损失,判定0x属于哪个组;(3G)(后验概率分别为0.004,0.361,0.635)(2)假定误判代价矩阵为1G误判为2G3G真实组1G2G0)11(c20)21(c10)12(c0)22(c200)13(c100)23(c3G60)31(c50)32(c0)33(c判定0x属于哪个组。(误判的平均损失为51.39,36.05,41.952G)6.已知两总体的概率密度分别为)(1xf和)(2xf,且总体的先验分布为4.0,6.021pp,误判损失为12)21(,4)12(cc。(1)建立Bayes判别准则;(2)假设有一新样品0x满足36.0)(01xf和24.0)(02xf,判定0x的归属问题。(2G)7.假设先验概率,误判代价及概率密度值已列于下表。试用贝叶斯判别法将样品分到组321,,GGG中的一个。若不考虑误判代价,则判别结果又将如何?1G判别为2G3G真实组1G2G3G0)11(c400)21(c100)31(c20)12(c0)22(c50)32(c80)13(c200)23(c0)33(c先验概率概率密度55.01p46.0)(01xf15.02p5.1)(02xf3.03p70.0)(03xf8.金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布,协差阵相等),今测得两个总体的若干数据,并由这些数据得到4111ˆ,24ˆ,62ˆ21(1)假设对某一金融分析员进行测量得到两个指标为Tx)4,5(,判别这一分析员是否能满足这项工作。(满足)(2)当两组先验概率分别为731.0,269.021qq,损失相同。问该金融分析员满足要求吗?为什么?(不满足)第五章聚类分析一.判断题1.快速(动态)聚类分析中,分类的个数是确定的,不可改变。()2.K均值聚类分析中,样品一旦划入某一类就不可改变。()3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。()4.系统聚类可以对不同的类数产生一系列的聚类结果。()5.K均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。()6.K均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。()二.计算题1.下面是5个样品两两间的距离矩阵0853601071096040)0(D试用最长距离法作系统聚类,并画出谱系聚类图。2.假设有6个样本,每个样本只测量一个指标,数据如表。样本点间使用绝对值距离,类间使用最长距离,利用系统聚类法对这6个样本进行分类。要求:(1)写出距离矩阵及类的合并过程;(2)画出聚类的谱系图;(3)写出样本分成两类时的结果。样本编号123456指标11243-4-23.假定我们对CBA,,三个样品分别测量两个变量1X和2X得到结果如表:用快速聚类法将以上样品聚成两类。样品变量X1X2A53B-11C124.检验某产品的重量,抽了6个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。5.考虑下列4个样品的距离矩阵:04350211010,用最短距离,最长距离法和类平均法对这4个样品进行聚类,并画出谱系图。6.有8个样本,每个样本两个指标,数据如表。样本点间使用欧氏距离,类间使用最短距离法,利用系统聚类法对这8个样本进行分类。样本编号12345678指标12244-4-2-3-1指标25343322-37.检验某产品的重量,抽了5个样品,每个样品只测了一个指标,分别为1,2,6,11,试用快速聚类法将样品分为两类。三.简答题1.判别分析与聚类分析有何区别?判别分析是对于n个给定的样本,已知每个样本属于k个类别中的某一类,利用这些数据,找到一种判别方法,使得这种判别方法具有某种最优性质,能把属于不同种类的样本点尽可能的区别开来,并对测得同样指标数据的新样本,能够判别这个样本归属于哪一类。聚类分析是在样品和类之间定义一种距离,按照距离的大小对样品进行聚类,距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。聚类分析没有判别函数,对新的样品无法判别它应该归属哪一类,必须重新进行聚类过程,才能判别它属于哪类。系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,而判别分析没有这种功能,但判别分析的距离判别法与聚类分析非常相似,也是根据距离的远近判别样本的归属问题。2.K均值法与系统聚类法的异同(1)K均值法事先必须确定分类的个数,分类的个数确定,而系统聚类分析系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,可以根据需要将样品分为几类。(2)K均值法可以随意将样品分为K类,根据样品到类中心的距离远近重新进行分类,而系统聚类中样品一旦划入某一类就不能更改。(3)K均值法样品与不同类间的距离采用点到类中心的平方欧氏距离,而系统聚类中点间距离有很多种定义方法。3.简述系统聚类法的思想。4.简述快速聚类法的思想。第六章主成分分析一.判断题1.主成分分析数学模型中的正交变换,在几何上就是做一个坐标旋转。()2.假设pXXX,...,,21为某实际问题所涉及的p个变量,pYYY,...,,21是其p个主成分,判断下列说法是否正确:(1)由原始变量pXXX,...,,21的协方差矩阵和相关矩阵出发,求得的主成分是一致的。()(2)对变量做主成分分析之前,必须对原始数据进行标准化。()(3)由标准化数据的协方差矩阵出发求得的主成分与由原始数据的相关系数矩阵出发求得的主成分一致。()(4)jiYYCovji,0),(。()(5)由于pYYY,...,,21包含原始变量的信息量递减,因而实际应用中选取前几个主成分代替原来的原始变量。()(6)当各个变量取值范围相差不大或者是度量单位相同的指标时,一般选择直接从协方差矩阵求解。()(7)piipiiXVarYVar11)()(。()(8)假设pXXX,...,,21的协方差矩阵为,m,...,,21为的非零特征根,mii,...,2,1,为对应的单位化的特征向量,则第i个主成分为miXYTii,...,2,1,。()(9)iY是pXXX,...,,21的线性组合。()(10)piYDii,...,2,1,)(。()(11)主成分的协方差矩阵是对角阵。()(12)方差贡献率表明了主成分综合原始变量的能力。()3.主成分分析中的信息,是用变量期望的大小来表示的。()二.计算题1.假设总体TXXX),(21的协方差矩阵为2225,求X的主成分,,21YY并计算第一主成分1Y的累计贡献率。2.假设总体TXXXX),,(321的相关矩阵为111R,)11(求X的标准化变量的主成分,,,321YYY并计算各主成分的贡献率和累计贡献率。(1
本文标题:多元统计期末复习题
链接地址:https://www.777doc.com/doc-5659580 .html