您好,欢迎访问三七文档
复习题一、简答题1.解释总体与样本、参数和统计量的含义。答:总体:所研究的全部个体(元素)的集合。样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。统计量:根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。2.解释总体分布、样本分布和抽样分布的含义。答:总体分布就是与总体相联系的随机变量的概率分布,样本分布是与样本相联系的随机向量的联合概率分布,抽样分布就是作为样本的函数的统计量的分布。3.3.3.3.甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?答:不一样。因为计算的对象不同,所使用的方法不同。平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:四年的平均增长率=()()()()%100%61%81%71%914−+×+×+×+平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权算术平均得到的,设四年的产品量分别为A、B、C、D,则四年的平均次品率=(9%A+7%B+8%C+6%D)/(A+B+C+D)4.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。答:在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。假设检验中犯第一类错误的概率被称为显著性水平。它们的联系是:置信水平越高,置信区间越宽,显著性水平越低。5.样本统计量的分布和总体分布的关系是什么?答:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间的关系已经被证明了。例如:样本均值的分布,根据中心极限定理,不管总体分布是什么(不管是正态还是非正态,已知或未知),都会近似的服从正态分布(条件是样本容量足够大),而且均值相等,样本标准差是总体标准差的根好N倍关系。6.6.6.6.简述假设检验的一般步骤。答:⑴陈述原假设和备择假设⑵从所研究的总体中抽出一个随机样本⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可以直接利用PPPP值作出决策,PPPP值小于显著性水平的拒绝H0,否则不拒绝H0。7.简述第Ⅰ类错误和第Ⅱ类错误的概念,它们发生的概率之间存在怎样的关系?答:当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误,犯第Ⅰ类错误的概率通常记为a。当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误,犯第Ⅱ类错误的概率通常记为b。两者的关系:当a增大时,b减小;当b增大时,a减小。8.简述众数、中位数和均值的特点和应用场合。答:众数是一种位置代表值,它的应用场合比较有限;中位数具有稳健性,数据值与中位数之差的绝对值之和最小;均值就是算术平均数,是数据集中趋势的最主要测度值。众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。9.9.9.9.简述移动平均法的基本原理和特点。答:移动平均法的基本原理,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。移动平均具有如下特点:当时间数列的变动趋势为线性状态时,可采用移动平均法进行描述和分析。该方法是通过扩大原时间数列的时间间隔,并按一定的间隔长度逐期移动,分别计算一系列移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。10.简述加权平均指数的基本编制原理。答:(1)为了对复杂现象总体进行对比分析,首先对构成总体的个别元素计算个体指数,所得到的无量纲化的相对数是编制总指数的基础;(2)为了反映个别元素在总体中的重要性的差异,必须以相应的总值指标作为权数对个体指数进行加权平均,就得到说明总体现象数量对比关系的总指数。11.11.11.11.简述编制总指数的两种方法的区别与联系。答:编制总指数的两种基本形式是综合指数和平均指数。区别主要表现在三个方面:(1)解决复杂总体不能直接同度量问题的基本思路不同。综合指数的特点是“先综合,后对比”;而平均数指数的特点是“先对比,后综合”。(2)运用资料的条件不同。综合指数要求全面调查的资料;而平均指数既可以用于全面调查资料的情况,也可以用于非全面调查资料的情况。(3)在经济分析中的作用不同。平均指数除作为综合指数变形加以应用的情况外,主要是用以反映复杂总体的变动方向和程度,一般不用于因素分析;而综合指数则由于用以对比的问题指标有明确的经济内容,因此,在经济分析中,不仅用以表明复杂总体的变动方向和程度,而且用以进行因素分析,且能表明因素变动对对象变动影响的绝对量。联系的表现:在一定的权数条件下,两类指数之间有变形关系,即平均指数可作为综合指数的变形形式加以应用。12.简述样本容量与置信水平、总体方差、允许误差的关系。答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。13.比较单侧检验和双侧检验的区别。答:双侧检验(two-sidedtest)的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:mm0或mm0,无方向性。单侧检验(one-sidedtest)的备择假设带有方向性,如:mm0或者mm0,实际中只可能出现一种情况。14.简述方差分析的基本思想。答:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。或者是,根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度v分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。15.解释因子和处理的含义。16.简述相关分析与回归分析的联系与区别。答:区别:(1)相关分析:通过定性(实质性科学理论)和定量分析(相关表、相关图、相关系数)来反映两个或两个以上变量之间相关的方向和相关程度。在相关关系中,变量之间是平等关系,不存在自变量和因变量,都是随机变量。(2)回归分析:回归分析就是研究一个因变量与一个或几个自变量之间数量关系(即求出回归方程)的方法;联系:在定量分析时,一般是先对变量进行相关分析,当变量之间确实存在相关关系时,再对变量进行回归分析。二、计算题1.1.1.1.某洗涤剂厂有一台瓶装洗洁精的灌装机,在生产正常时,每瓶洗洁精的净重服从正态分布,均值为454克,标准差为12克。为检验近期机器是否正常,从中抽出16瓶,称得其净重的平均值为456.64克。(1)试对机器是否正常作出判断。(取α=0.01,并假定方差不变)(2)若标准差未知,但测得16瓶洗洁精的样本标准差为12克,试对机器是否正常作出判断。(取α=0.01)(z0.005=2.58,t0.005(15)=2.9467)解:(1)0H:µ=454,1H:µ≠454。在α=0.01时,/20.005zzα==2.58,从而拒绝域为|z|≥2.58。现由样本求得456.6445412/16z−==0.88由于|z|2.58,故不能拒绝H。,即认为机器正常。(2)当方差未知时,假设形式与上一问是相同的,只是检验统计量变为0456.64454/12/16xtsnµ−−===0.88在α=0.01时,/20.005(1)(15)tntα−==2.9467,拒绝域为|t|≥2.9467。由于|t|=0.882.9467,故不能拒绝H。,即认为机器正常。2.从一个正态总体中随机抽取容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值在95%的置信区间。(z0.025=1.96;t0.025(7)=2.3646)解:已知:n=8,X~N(μ,σ2),σ2未知且小样本则用t0.025(7)=2.36461088081151361512810==+++++++==∑nxx()()()()127841811011108101022222==−+++=−=−−−∑−Λnxxs8960.2102247.13646.210812*3646.2102±=×±=±=±nsxtα即(7.1040,12.8960),总体均值在95%的置信区间为:(7.1040,12.8960)3.若X表示在一家分店工作的售货员人数,Y表示这家分店的年销售额(千元),已经求出Y对X的回归方程的估计结果如下表所示:方差分析离差来源平方和自由度方差回归6828.616828.6残差2298.82882.1总离差9127.429系数标准差t值常数项80.011.3337.06X50.05.4829.12(1)写出估计的回归方程。(2)在研究中涉及多少家分店?(3)计算F统计量,在5%显著水平下检验方程的显著性。(0.05(1,28)4.2F=)(4)预测有12名售货员时该分店的年销售收入。解:(1)估计的回归方程为:∝80.050.0iiYX=+(2)在研究中涉及30家分店;(3)F统计量为6828.683.1782.1F==临界值0.05(1,28)4.2F=因为F=83.17>4.2,所以在5%显著性水平下,回归方程是显著有效的。(4)∝80.050.080.050.012680(iiYX=+=+×=千元)4.已知某地区1997年的农副产品收购总额为360亿元,1998年与上年相比收购总额增长12%,收购价格总指数为105%。1998年与1997年相比:(1)农民因交售农副产品共增加多少收入?(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3)农副产品收购价格上涨了百分之几?农民因此又增加了多少收入?(4)验证以上三方面的分析结论是否一致。解:由于有:)()(001010110011001010110011∑∑∑∑∑∑∑∑∑∑∑∑−+−=−×=qpqpqpqpqpqpqpqpqpqpqpqp其中已知:36000=∑qp,%121/0011=−∑∑qpqp,%105/1011=∑∑qpqp所以:(1)360×12%=43.2;(2)112%÷105%-1=6.67%,360×6.67%=24.0;(3)105%-1=5%,360×106.67%×5%=19.2;(4)106.67%×105%=112%,24.0+19.2=43.2。5.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:方差分析表差异源SSdfMSFP值F临界值组间2100.2459463.354131组内3836———总计29————(1)完成上面的方差分析表;(2)若显著性水平α=005.,(3)检验三种方法组装的产品数量之间是否有显著差异?解:方差分析表中所缺的数值如下表:差异源SSdfMSFP值F临界值组间42042042042022222101.4781.4781.4781.4780.2459463.354131组内383627272727142.07142.07142.07142.07———总计425642564256425629————H0
本文标题:统计学复习-大二
链接地址:https://www.777doc.com/doc-5404614 .html