您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 石油大学研究生应用统计2011届考试题B卷
1.某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,纤维强度数据见下表,试考察它们生产的纤维在强度上是否有显著差异?自动生产线纤维强度甲7.07.46.16.57.5乙5.56.77.25.8丙6.77.28.27.37.56.9解:三条生产线可以看做三个水平,即3k,以(1,2,3)iri表分别示各水平所做的重复试验次数,即1235,4,6rrr,由上表计算得123103.5,34.5,25.2,43.8TTTT222211113103.5721.217.06546irkijijTSyrrr总22222221113T34.525.243.8103.52.4546546kiiiTSrrrr组间222=7.062.4=4.66SSS误总组间221232.4/(1)23.09014.66/()12SkFSrrrk组间误将有关结果列入方差分析表(表1-1)。方差来源平方和自由度平均平方和F值因素A(组间)2.421.23.0901误差(组内)4.66120.3883总和7.0614—-对于给定,由PF查(2,12)F表可得,则F,所以三条生产线上的纤维强度差异。2.设有来自不同总体的四个样本分别为(2,5),(2,3),(5,1),(6,2),试用重心法和离差平方和法进行聚类,并提出您的分类建议。解:(1)重心法:首先将四个样品分别看做一类,计算距离矩阵2(0)D。2(0)D1G2G3G4G1G02G403G251304G251720由2(0)D可以看出,3G和4G之间距离最短,因此可以合并为一个新类534,GGG,然后计算1G、2G、5G之间的距离,得相应的2(1)D如下2(1)D1G2G5G1G02G405G24.514.50由2(1)D可以看出,1G和2G之间距离最短,因此可以合并为一个新类612,GGG,然后计算5G、6G之间的距离,得相应的2(2)D如下2(2)D5G6G5G06G18.50最后将5G与6G合为一类71234,,,GGGGG。上述聚类过程用聚类图表示为图2-1。(2)离差平方和法:由(1)中已计算的重心法的距离平方及22()pqpqpqpqnnDDCnn计算距离矩阵2(0)D。2(0)D1G2G3G4G1G02G203G12.56.504G12.58.510由2(0)D可以看出,3G和4G之间距离最短,因此可以合并为一个新类534,GGG,然后计算1G、2G、5G之间的距离,得相应的2(1)D如下2(1)D1G2G5G1G02G205G16.33339.66670由2(1)D可以看出,1G和2G之间距离最短,因此可以合并为一个新类612,GGG,然后计算5G、6G之间的距离,得相应的2(2)D如下2(2)D5G6G5G06G18.50最后将5G与6G合为一类71234,,,GGGGG。上述聚类过程用聚类图表示为图2-2。3.设有总体1,2,且分别服从均匀分布U(-1,1),U(0,3),试:分别用贝叶斯判别法(取12,(1|2)(2|1)qqCC)和距离(采用马氏距离)判别法判别样品10.7x及21.1x所属的类i。解:(1)贝叶斯判别法:由题意得,1211(0.7)(0.7)23pp,故10.7x所属的类为1。121(1.1)0(1.1)3pp,故21.1x所属的类为2。(2)距离判别法:对于总体1:10,121111023Dxdx;对于总体2:132,32210133()324Dxdx110.70(0.7)(0.7,)0.7313dd220.71.5(0.7)(0.7,)0.53334dd显然12(0.7,)(0.7,)dd,故10.7x属于2。111.10(1.1)(1.1,)1.1313dd221.11.5(1.1)(1.1,)0.27334dd显然12(1.1,)(1.1,)dd,故21.1x属于2。4.在异乡试验中测得关于12,,xxy的部分数据如下:1x-4-3-3-12014652x-7-7-3-1-137653y-10-8-4-124891011(1)试建立y与12,xx的回归方程。并就0.05检验所的回归方程是否有意义;(2)检验12,xx对y的影响是否显著(0.05);解:(1)建立数据预处理表表4-1数据预处理计算1x2xy21x22x12xx1xy2xy2y1-4-7-1016492840701002-3-7-8949212456643-3-3-49991212164-1-1-111111152-1241-24-2460340900121671781497856648469163624365481965103625306050100105311259155533121∑7521117237133240342567由表4-1得2210211111710117112.110iilxx101212122117510133129.510iiilxxxxl2210222221510237234.510iilxx10111172110240225.310yiiilyxxy10222152110342331.510yiiilyxxy221010221121()10567522.910yyiiiilyyyy变量序号解正规方程1212112.1129.5225.3129.5234.5331.5bbbb得11.0406b$,20.8390b$,从而0121221751.04060.83900.9521101010bybxbx$$$得回归方程120.95211.04060.8390yxx$(2)21212225.31.0406331.50.8390512.5757yySlblb回$$2222522.9512.575710.3243yySSSlS总回回残22/2173.7663/(1021)SFS回残对于给定的0.05,查(2,7)F表(附表5)得临界值4.74,由于173.76634.74F,所以检验效果显著,即回归方程有意义。(3)检验12,xx对y的影响的显著性。122221112.1129.5129.5234.5llllLll则12234.5129.51129.5112.1112.1234.5129.5L取统计量22/,1,2/(1021)iiiiblFiS残$计算得12.9797F,240.5196F。对给定的0.10,查表(1,7)F(附表5)得临界值5.59。由于12.97975.59F240.51965.59F故在检验水平0.05下1x对y影响不显著,而2x对y影响显著。论述题:(任选一题)1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。2.解释正交试验设计的特点及理论依据。
本文标题:石油大学研究生应用统计2011届考试题B卷
链接地址:https://www.777doc.com/doc-2176681 .html