您好,欢迎访问三七文档
统计学第一次作业(2012年3月15日)注意:作业全部为课后习题,请将必要的推导过程写出,不能只写答案。本次作业共包括前四章的14道题目,个别题目有删减:第一章统计学的性质1-3答:(1)对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果(n=1500)年度共和党民主党民主党候选人P*(1-P)/n95%置信度总体比例的置信区间(%)实际选举结果(%)1960尼克松49%肯尼迪51%0.000166651±2.5298肯尼迪50.11964戈德沃特36%约翰逊64%0.0001536☆64±2.4291约翰逊61.31968尼克松57%汉弗莱50%0.000163450±2.5303汉弗莱49.71972尼克松62%麦戈文38%0.000157138±2.4564麦戈文38.21976福特49%卡特51%0.000166651±2.5298卡特51.11980里根52%卡特48%0.0001664☆48±2.5283卡特44.7(2)注☆:实际选举结果证明错误的置信区间2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:18201661617121416181414169201812151316162l2l9162014141616第二章描述性统计学2-2答:1)将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;解:(1)数据分组如下:表:丈夫所受教育年限X频数分布表(n=30)分组编号组下、上限组中值X值(年)频数(f)相对频率(f/n)累积频率(%)1[4.5,7.5)6610.03333.332[7.5,10.5)99、920.066610.003[10.5,13.5)1212、12、1330.100020.004[13.5,16.5)1514、14、14、14、14、15、16、16、16、16、16、16、16、16、16150.500070.005[16.5,19.5)1817、18、18、1840.133383.006[19.5,22.5)2120、20、20、21、2150.1666100.00总计463301.00002)作出频数分布的直方图;解:(图)丈夫所受教育年限X数据直方图(单位:年;n=30)3)问10.5年的教育在第几百分位数上?13年呢?解:10.5年的教育,累积频率为10.00%,前面有10.00%个样本,所以在第10个百分位数上;13年的教育,累积频率为20.00%,前面有20.00%个样本,所以在第20个百分位数上。2-62-13答:解:表:美国九十年代两个5年失业率表(假设1990年~1999年总人口稳定)年度失业率(%)X相对频率f/nX-(X-)2(X-)2*f/n19905.60.2-0.980.96040.1920819916.80.20.220.04840.0096819927.50.20.920.84640.1692819936.90.20.320.10240.0204819946.10.2-0.480.23040.04608X-(X-)2(X-)2*f/n19955.60.20.680.46240.0924819965.40.20.480.23040.0460819974.90.2-0.020.00040.0000819984.50.2-0.420.17640.0352819994.20.2-0.720.51840.10368前5年间:平均失业率(%):=∑X=5.6*0.2+6.8*0.2+7.5*0.2+6.9*0.2+6.1*0.2=6.58;方差:S2=*∑(X-)2*=*0.4376=0.547;标准差:S==0.740;后5年间:平均失业率(%):=∑X=5.6*0.2+5.4*0.2+4.9*0.2+4.5*0.2+4.2*0.2=4.92;方差:S2=*∑(X-)2*=*0.2776=0.347;标准差:S==0.589;表:美国九十年代失业率表(假设1990年~1999年总人口稳定,n=10)年度失业率(%)X相对频率f/nX-(X-)2(X-)2*f/n19905.60.1-0.150.02250.0022519916.80.11.051.10250.1102519927.50.11.753.06250.3062519936.90.11.151.32250.1322519946.10.10.350.12250.0122519955.60.1-0.150.02250.0022519965.40.1-0.350.12250.0122519974.90.1-0.850.72250.0722519984.50.1-1.251.56250.1562519994.20.1-1.552.40250.24025总共10年间:平均失业率(%):=∑X=5.6*0.1+6.8*0.1+7.5*0.1+6.9*0.1+6.1*0.1+5.6*0.1+5.4*0.1+4.9*0.1+4.5*0.1+4.2*0.1=5.75;方差:S2=*∑(X-)2*=*1.0465=1.1628;标准差:S==1.078;比较这三组均值和方差,发现这都与分组情况相关。分组会影响到均值和方差。第三章概率分布3-5答:使用概率树进行计算,结果如下:表:射击了两次时失败的次数X的概率分布(有总结经验提高命中率)XP(X)(累加过程)P(X)(合计)P(X)累积(%)0120.6*0.80.6*0.2+0.4*0.70.4*0.30.480.400.124888100表:射击了三次时失败的次数X的概率分布(有总结经验提高命中率)XP(X)(累加过程)P(X)(合计)P(X)累积(%)01230.6*0.8*0.80.6*0.8*0.2+0.6*0.2*0.7+0.4*0.7*0.80.6*0.2*0.3+0.4*0.7*0.2+0.4*0.3*0.70.4*0.3*0.30.3840.4040.1760.03638.478.896.4100.03-9答:1)求X的概率分布解:表:2004年北京某高校本科新生所拥有的电子邮箱数X概率及其它计算(n=2820人)XfP(X)X*P(X)(X-μ)2(X-μ)2*P(X)04300.15248206.250.95301314900.1737590.1737592.250.39095827000.2482270.4964540.250.06205734800.1702130.5106390.250.04255342900.1028370.4113482.250.23138364300.1524820.91489212.251.8679052)求平均电子邮箱数解:3)求标准差解:μ≡∑X*P(X)=2.50σ2≡MSD≡∑(X-μ)2*P(X)=3.5479σ=1.88363-12答:1)样本中至少有一半人是“经常听”的;解:将问题转化为求二项分布n=8,π=0.6,时求k=4时的二项分布右侧尾部累积概率,查P574表,得:P=0.82632)样本中没有一个人是“不听”的;解:先求二项分布n=8,π=0.1,时求k=1时的二项分布右侧尾部累积概率,查P573表,得:P1=0.5695则样本中没有一个人是“不听”的概率为:P2=1–P1=1–0.5695=0.43053)样本中恰好有3个人是“偶尔听”的。解:问题转化为计算二项分布n=8,π=0.3,时求k=3的二项分布概率,查P572表,得:Pr(X=3)=0.25413-133-17答:1)Pr(X<7.1),如果=5,=2;解:使用公式将正态分布标准化:Z=Z=1.05;Pr(X<7.1)=Pr(Z<1.05)=1-Pr(Z1.05)=1-0.1469=0.85312)Pr(X<860),如果=500,=300;解:Z=1.2;Pr(X860)=1-Pr(X860)=1-Pr(Z1.2)=1–0.1151=0.88493)Pr(9.8<X<10.2),如果=10,=0.2;解:Z1=-1;Z2=1;Pr(9.8X10.2)=Pr(-1Z1)=Pr(Z-1)-Pr(Z1)=1-Pr(Z1)-Pr(Z1)=1–2*Pr(Z1)=1–2*0.1587=0.68264)Pr(10<X<11),如果=10.73,=0.213.解:Z1=-3.42723;Z2=1.2676;Pr(10X11)=Pr(-3.42723Z1.2676)=Pr(Z-3.42723)-Pr(Z1.2676)=1-Pr(Z3.42723)-Pr(Z1.2676)=1–0.000233–0.1020=0.89783-19答:1)得分在450~550之间的参赛者的百分比;解:将X1=450、X2=550标准化:Z1===0.4;Z2===1.4;问题是求Pr(450X550);Pr(450X550)=Pr(ZZ1)-Pr(ZZ2)=Pr(Z0.4)-Pr(Z1.4)=0.3446–0.0808=0.26382)第75百分位上的得分;解:由Pr(ZZ3)=1–0.75=0.25,反查正态分布表得知:Z3=0.67,则X3=Z3*σ+μ=0.67*100+410=477;3)第25百分位上的得分;解:由Pr(ZZ4)=1–0.25=0.750.5,可以知道Z4在数学期望的左侧,右侧对称的是Pr(Z0.25),反查正态分布表得知:Z4=-0.67,则X4=Z4*σ+μ=-0.67*100+410=-67+410=343;4)以上两个四分位数间的间距。解:四分位差为:477–343=133第四章抽样4-7答:解:按照正态近似性定理,近似地服从正态分布,其期望值=μ=8.2,标准误差SE=σ=3=0.6。先将受教育水平X=7年、9年,按μ=8.2,SE=0.6对X值进行标准化,得:Z1==(-1.2)/0.6=-2Z2==0.8/0.6=1.3333因此,问题转化为Pr(7X9)=Pr(Z1ZZ2)Pr(Z1ZZ2)=Pr(-2Z)-Pr(Z1.3333)=1-Pr(X2)–Pr(Z1.3333)=1-0.0918–0.0228=0.88544-94-234-24第一章统计学的性质(1题)1-3、近年来,美国6次总统选举预测情况如下,其中括号内的数表示盖洛普在选举前对1500位选民的民意调查结果(注意:此题目相对书上原题有所删减):年度民主党共和党196019641968肯尼迪(51%)约翰逊(64%)汉弗莱(50%)尼克松(49%)戈德沃特(36%)尼克松(57%)1)计算各年中民主党支持者总体比例的95%置信区间;答:对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果(n=1500)年度共和党民主党民主党候选人P*(1-P)/n95%置信度总体比例的置信区间(%)实际选举结果(%)1960尼克松49%肯尼迪51%0.000166651±2.5298肯尼迪50.11964戈德沃特36%约翰逊64%0.0001536☆64±2.4291约翰逊61.31968尼克松57%汉弗莱50%0.000163450±2.5303汉弗莱49.71972尼克松62%麦戈文38%0.000157138±2.4564麦戈文38.21976福特49%卡特51%0.000166651±2.5298卡特51.11980里根52%卡特48%0.0001664☆48±2.5283卡特44.72)对照下面所给出的真正选举结果,对错误的置信区间(即没能把真正的比例包括在内的)打上星号标志。1960年1964年1968年肯尼迪约翰逊汉弗莱50.1%61.3%49.7%第二章描述性统计学2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:1820166
本文标题:统计学作业1
链接地址:https://www.777doc.com/doc-4999408 .html