您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 地学数据分析与数据挖掘
2013.11.28作业一1、校园操场年久失修,其地形起伏高程服从正态分布,假定其平均相对高度为170cm,标准差为8cm。求满足以下条件的场地面积比例:⑴、高度155cm以下;⑵、高度176cm以上;⑶、高度155cm~176cm之间。解:若X服从正态分布N(,2),则有如下性质:()()xFx{}()()baPaXb由题意可知,=170,=8.155170155170(){155}{}()(1.875)88xIPxP1(1.875)0.03176176170(){176}1()1()1(0.75)0.22668IIPx176170155170(){155176}()()0.77340.030.743488IIIPxdxxfxFx)()(=()1()xx作业一2、甲、乙二人约定了这样一个赌博规则:有无穷多个盒子,编号为n的盒子中有n个红球和1个白球(n=1,2,…)。然后,甲拿一个均匀铜板掷到出现正面为止,若到这时甲掷了n次,则甲在编号为n的盒子中抽出一个球,如抽到白球算甲胜,否则乙胜。你认为这个规则对谁更有利,为什么?解:甲胜的概率为112(1)nnPn易证,因为12P31114122(1)nnPn311111113423442nn分析:第一次甲胜的概率,11211第二次甲胜的概率,211221对乙更有利作业一3、某电视机厂某种型号电视机的销售价为2000元,成本为1200元。产品中有一部分可能会在保持期内损坏,因此厂家得免费维修,假设修理费平均而言每台500元。现假设电视机的使用寿命呈正态分布,均值为7年,标准差为3年。如果厂家希望每台电视机的平均利润达到750元,其应承诺的保修期大概是几年?解:设保修期为x年,P为保修期内损坏的概率。在保修期内,成本为1200+500=1700(元)不在保修期内成本为1200(元)则平均成本为:17001200(1)1250PP解得,0.1P()0.11.28uu71.283x73.663.16x那么,保质期大约为三年作业一4、翻译(略)5、ComparethevariancesoftwogroupsofdataF-distributionTestthedifferenceofmeansNormaldistributionT-distribution作业二1、设X1,X2,…,Xn是独立同分布随机变量,且每个随机变量服从正态分布,试证明平均数服从正态分布。2(,)N11niiXXn2(,)Nn1niiX1nX解:独立正态变量之和仍为正变量,乘上因子所得的也是正变量。又1111()()()nniiiinEXEXEXnnn22221111()()()nniiiinDXDXDXnnnn方差的性质2()()DcXcDX或者定义X所以,服从正态分布。作业二2、测得两批电子器材的电阻的子样值为A批x(Ω):0.140,0.138,0.143,0.142,0.144,0.137B批y(Ω):0.135,0.140,0.142,0.136,0.138,0.140设这两批器材的电阻值分别服从分布与(1)检验假设H0:,(2)检验假设H0:,211(,)N222(,)N22125%125%解:计算可得n1=6,10.1407x*2617.866710sn2=6,20.1385x*2627.100010s(1)检验两个正态母体方差相等—F检验作业二按照题意,这是检验两个正态母体方差是否相等的问题。因而*21*221.108sFs给定=0.05,查表得F0.025(5,5)=7.15,F0.975(5,5)=1/F0.025(5,5)=0.13986易见,F0.975(5,5)FF0.025(5,5),故认为两个正态母体方差无显著差异。(2)检验两个正态母体均值相等—t检验(假设方差相等)*2511(1)3.933310ns*2522(1)3.550010ns55*263.9333103.5500107.483310662s12*6120.00221.3931117.4833103XXtsnn作业二又因为=0.05,查表得t0.025(10)=2.2281,计算120.14070.13850.0022xx*0.0251211(10)0.0035tsnn120.0035xx故认为两均值相等作业二3、设应力张量所对应的矩阵为:求主应力及主方向。1201-121-1101=121-110-112,解:(1)对于求解可分为两步:1011101110(I)1()0ijjn(II)1iinn特征方程:10ij21231111(2)(1)01,211,正交化单位化作业二当带入(I)得121123nnn令1231,0,1nnn,则1(1,0,1)n令1231,1,0nnn则2(1,1,0)n将12(1,0,1)(1,1,0)nn,进行施密特正交化可得,12(1,0,1)2N26(1,2,1)6N当32代入(I)可得123nnn再将其代入(II)可得,33(1,1,1)3N故主应力为1231,2,主方向为123,,NNN对于,2211121112主应力为,1230,3主方向为13(1,1,1)3N22(1,0,1)2N36(1,2,1)6N作业二4、试证:(1)a×(b×c)=(a〃c)b-(a〃b)c(2)a×A=-(AT×a)T(3)A×a=-(a×AT)T.其中A为二阶张量,a为矢量。解:(1)a×(b×c)=a×(blel×cmem)=a×(elmjblcmej)=elmjeijkaiblcmek=ejlmejkiaiblcmek又因为eijkeimn=δjmδkn-δjnδkm,则ejlmejkiaiblcmek=(δlkδmi-δliδkm)aiblcmek=aicibkek-aibickek=(a〃c)b-(a〃b)c1001,()0100,001ijifijnosumifijjijiaa作业二(2)令a=aiei,A=Ajlejel,假设A是对称张量a×A=aiei×Ajlejel=aiAjleijkekel(AT×a)T=(Aljejel×aiei)T=(aiAljelikejek)T因为l与j均为哑指标可以交换,则=(aiAjlejikelek)T=aiAjlejikelek=-aiAjleijkekel(3)与题(2)解法相同。5、编程(略)作业三1、一车间加工出某种零件个数标准差为1.2。从某日生产出的一批零件中,随机地抽16个进行只数测量,算得子样标准差s*为2.1,问其均匀度有无显著变化(取=0.05)?假定母体分布是正态的。解:该日生产出的零件个数构成一个正态母体,按题意要检验假设H0:2=1.22是否成立。计算*2222202.1(1)1545.941.2sn由=0.05,查表可得,20.975(15)6.26220.025(15)27.448易见,因而有显著变化。227.4482、简述一元线性回归的模型中参数估计的基本原理。(略)检验正态母体的方差用检验2作业三3、钢的强度和硬度都是反映钢质量的指标。现在炼20炉中碳钢,他们的抗拉强度Y与硬度x的20对实验值(下表)。试求Y对x的经验回归直线方程,并计算的估计量,并绘出点图。2^2编号12345678910xi277257255278306268285286272285yi10399.59310511098103.5103104103编号11121314151617181920xi286269246255253255269297257250yi10810096.59294949910995.591解:从实验值的点图上看,一些点分布在直线附近,看作一元线性回归比较合适。为计算简单起见,作变量替换u=x240,v=y90按题意n=20,计算可得于是ui=xi240,vi=yi901606niiu1201.5niiv作业三进而2123748niiu212664.25niiv17805.5niiiuv160630.320u1201.510.07520v对变量u,v用最小二乘法配直线^^''v,由拟合公式可得,^'11122211207805.5606201.50.31562023748606()nnniiiiiiinniiiinuvuvnuu于是得到经验回归直线方程v=0.5123+0.3156u换成原来的变量y90=0.5123+0.3156(x240)y=0.3156x+14.7683(0.31492),14.9282这是y对x的经验回归直线方程。即计算2用x,y的数据与用u、v的数据结果应当相同。于是2^^222'21111()()nniiiivvuunn22211(2664.2510.075)0.3156(2374830.3)4.488220205.2661作业三4、在题2中,对x=230的Y进行预测,取=0.05。解:先计算x=230的值y|x=230=0.3156×230+14.7683=87.36按题意n=20.由δ(x)的表达式,2^*0221()1()(2)1()niixxxnnxxt易见2^*0.0252211(230240)(230)(18)120niiuunut221(1030.3)2.100912.335.7020237482030.3Y的置信下限是,y1=87.365.70=81.66而置信上限是,y2=87.36+5.70=93.06预测区间是(81.66,93.06).作业三5、分布的参数为什么称为自由度?2作业四1、将课件最后一页的英文翻译成中文,并试图给出问题(a),(b),(c)的答案。(略)2、已知某种半成品在生产过程中的废品率Y与它的某种化学成分x有关,现将实验观察得到的一批数据列于下表:化学成分x3436373839393940废品率y1.301.000.730.900.810.700.600.50化学成分x4041424343454748废品率y0.440.560.300.420.350.400.410.60解:把16对数据(xi,yi),i=1,2,…16画出点图。又图形可见,废品率Y最初随化学成分x的增加而降低,而当x超过一定值后,Y有所回升。根据点图的形状,可认为是抛物线回归2012Ybbxbx作业四经验抛物线回归方程是:y=18.2560.8093x+0.0092x23、解:采用多项式拟合230123y+.....+miiiimibbxbxbxbx2=0.1050.777525.5476YxxLogarithmicTransformationsinRegression作业四4、给定数据表如下:jx0.250.300.390.450.53jy0.50000.54770.62450.67080.7280试求三次样条插值S(x),并满足条件:''(1)(0.25)1.0000,(0.53)0.6868;SS(2
本文标题:地学数据分析与数据挖掘
链接地址:https://www.777doc.com/doc-6137103 .html