您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 薪酬管理 > 2008年中国人民大学805统计学考研专业课真题及答案
点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网考研学习中,专业课占的分值较大。对于考研专业课复习一定要引起高度的重视,中公考研为大家整理了2008年中国人民大学845社会理论考研专业课真题及答案,并且可以提供中国人民大学考研专业课辅导,希望更多考生能够在专业课上赢得高分,升入理想的院校。中国人民大学805统计学2008年硕士研究生入学考试试题2008年人大统计学专业课初试题及答案试题一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。四、(30分)食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。(1)请具体指明这些假设有哪些?(2)说明这些假设所发挥的主要作用;(3)请讨论这些假设最终产生的影响。六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。(1)以大坝为例,概略说明需考虑的主要因素;(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。(画出框图,并尽量避免过多使用文字)2008年人大统计学专业课初试题参考解答一、用中位数来描述家庭收入数据的集中趋势有优点亦有不足。1.中位数是指一组数据排序后处于中间位置的变量值,不受极端值影响,对偏斜程度较大的顺序或数值型数据代表性较好,所以它能够排除过高收入或过低收入带来的不良影响。2.作为描述数据集中趋势的指标,中位数的应用远不及平均值广泛,中位数只是一组数据中的一个值,因而对整个香港家庭收入信息有较大浪费;而点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网平均值能包含所有收入信息,而且具有优良的数学性质,不过它易受极端值的影响,主要适用于测度偏斜度不大的数据。3.用中位数作为判别低收入的指标,那么低收入的比例一直都是50%,这显然与“比例在增长”相矛盾。二、方差分析表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源,所以叫做方差分析。观察到的数据一般是参差不齐的,我们用SST(总平方和)度量数据总的变异,将它分解为可追溯到来源的部分变异SSE(组内平方和)与SSA(组间平方和)之和,若后者的平均MSA(组间均方)明显比前者的平均MSE(组内均方)大,就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。所谓基本假定就是,各总体服从正态分布;各总体方差相同;各观测值相互独立。三、有多种预测模型可供选择:1.时间序列分解模型①加法模型:ttttxTSI;②乘法模型:ttttxTSI;③混合模型:ttttxSTI,()ttttxSTI。其中tx为时刻t的序列值,tT,tS,tI分别表示趋势、季节性、随机波动,下同。2.季节多元回归模型01112233ttxaatbQbQbQI趋势随机波动季节成分其中(1,2,3)iQi为0-1虚拟变量。3.ARIMA(p,q,d,T)模型(求和自回归移动平均模型)点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网2()()()0,(),()0()()0()dTttttststBxBEVarEstExst符号说明a.B为一阶延迟算子(1ttBxx);b.1()1(0)pppBBB为自回归系数多项式;c.1()1(0)qqqBBB为移动平均系数多项式;d.(1)ddB为d阶差分算子,用于消除趋势成分;e.T为步长为周期T的T步差分算子,用于消除季节成分。四、(1)厂家从自身利益出发,当然希望每袋平均重量250g,这样有利于提高产品销量,于是可以把250g放在“被保护”的位置,而原假设正具有“被保护”的特性,于是可提出如下检验假设:01:250:250HgHg(2)从消费者利益出发,我们担心每袋平均重量250g,如果要我们相信250g,那么厂家就得拿出充分的证据来证明,所以250g应放在“不利”的位置,即放在备择假设中,于是有:01:250:250HgHg(3)在0.5的显著性水平和(2)中的检验假设下,0.4297p意味着250是显著不成立的,即拒绝原假设,我们可以相信厂家所言。p值的含义是当原假设为真时,检验统计量取其实现值以及更极端值的概率,它是检验的真实显著性水平。(4)这里的区间(241.1,257.5)是一个确定的区间,而食品的实际平均重量点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网要么在其中,要么不在其中,无概率可言。该区间是95%的随机置信区间的一个实现,后者的意思是食品的实际平均重量以95%的概率落入其中。五、经典多元线性回归模型为yX其中y是n维随机向量,X是(1)np设计矩阵,是1p维系数向量,是n维随机误差向量。关于自变量1,,pxx的假设主要有:1.自变量都是确定性变量。回归分析中的自变量与因变量地位是不等的,其中后者是随机的,这与相关分析二者都是随机的不同。从而自变量与随机误差(以及因变量)也就不相关,保证了回归分析理论的顺利进行。2.自变量不存在多重共线性。这就要求设计矩阵X列满秩,进而观测次数(样本量)n必须大于自变量个数p。该假设保证了的普通最小二乘估计可表示为1ˆ()XXXy并且具有良好的数学性质,更方便了进一步的假设检验和回归分析的实际操作与应用。否则出现多重共线性,就会带来上述诸多方面的麻烦。六、常见的(概率)抽样方式有①简单随机抽样、②分层抽样、③整群抽样、④多阶段抽样和⑤系统抽样,其中简单随机抽样是最基本的,是其他抽样方式的基础。所谓基本抽样方式,我觉得以不同的标准或不同的思维角度会得出不同的分类方式,比如:1.如果将整群抽样(通常指一阶)看作特殊的二阶段抽样(二阶段抽样比100%),则有①②④⑤四种基本抽样方式。2.如果又将分层抽样视为特殊的二阶段抽样(一阶段抽样比100%),则有①④⑤三种基本抽样方式。3.如果将系统抽样看作特殊的分层抽样(每层抽一个单元)或者特殊的整群点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网抽样(只抽一个群),则有①②③④四种基本抽样方式。七、贝叶斯判别分析的原理是将贝叶斯统计思想用于判别分析。具体说来,设有k个总体1,,kGG,分别有密度函数1(),,()kpxpx(一般假定总体都服从正态分布,协方差阵都相等,各均值有显著差异),已知出现这k个总体的先验概率为1,,kqq。我们希望给出一种判别法,也就是给出空间mR的一种划分:1{,,}kDDD,当x落入iD时,将其判给iG,使得在该判别法下所带来的平均损失11()(|)(|)kkiijECMDqLjiPji达到最小。其中(|)Lji为样品来自iG而被判给jG的错判损失,(|)()jiDPjipxdx为错判概率。(1)与聚类分析数据都是未知类别的相比,贝叶斯判别分析的数据结构中有一部分数据是已知类别的,还有一部分属于待判别归类的未知类别的。(2)贝叶斯判别法最终是将样品判给平均损失最小的总体。而其他判别法,比如距离判别法是将样品判给相距最小的总体;逐步判别法是先选择最优判别变量,再结合其它判别法进行判别等等。八、(1)建造大坝是一项复杂的工程,要综合水利、建筑、地质、数学、统计等多学科的知识,要考虑方方面面的因素。就其中坝高设计这一点来说,要考虑的主要因素我认为有河流宽度与两岸高度、周围地质构造、河水各季度平均流量、地域旱涝特征,还有建坝的预估资金和时间等等。(2)具体步骤如下:①制定计算坝高的详细计划;②确定影响坝高的主要指标;③充分收集整理指标数据;点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网④综合利用各学科知识建立坝高数学模型;⑤检验优化模型;⑥利用模型计算坝高估计值,给出置信度和置信区间。流程图如下:4.2中国人民大学805统计学2009年硕士研究生入学考试试题2009年人大统计学专业课初试题及答案试题一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。三、周期过程cos()ttXA,其中频率和振幅A都是常数,而相位是一个在区间[-π,π]上服从均匀分布的随机变量。问{tX}是否平稳?说明原因。四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机点这里,看更多考研真题中公考研,让考研变得简单!更多资料,请关注中公考研网抽样有相同的估计量方差。(假设各层总体单位数量hN都充分大,忽略“有限总体校正系数”)层总体权重预估的层内总体比例10.50.520.30.730.20.6五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。六、若有线性回归模型,其中,,,则(1)该模型是否违背古典线性回归模型的假定?请简要说明。(2)如果对该模型进行估计,你会采用什么方法?请说明理由。七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。(2)要采用该分析方法,数据
本文标题:2008年中国人民大学805统计学考研专业课真题及答案
链接地址:https://www.777doc.com/doc-3031628 .html