您好,欢迎访问三七文档
1.获得数据的概率抽样方法有哪些?(1)简单随机抽样。就是从包括总体N个单位的抽样框中随机地,一个个抽取n个单位作为样本,每个单位的入样概率是相等的。(2)分层抽样。是将抽样单位按某种规则划分为不同的层,然后从不同的层里独立、随机的抽取样本。(3)整群抽样。将总体若干个单位合并成组,这样的组成为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。(4)系统抽样。将总体中所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。(5)多阶段抽样。首先抽取群,然后再进一步抽样,从若干个单位进行调查,将这种方法推广,使抽样的段数增多,及称为多阶段抽样。2.什么是统计学?统计学数据可分为哪几类数据?统计学就是收集、处理、分析、解释数据并从中得出结论的科学。按所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据、和数值数据。分类数据是只能归于某种类型的非数字型数据;顺序数据是只能归于某种有序类别的分数字型数据;数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。按统计数据的收集方法,可以将数据分为观测数据和实验数据。观测数据是欧诺个过调查或观测收集到的数据;实验数据则是在实验中控制实验对象而收集到的数据。按照被描述的现象的时间关系,可以将推荐数据分为截面数据和时间序列顺序。截面数据是在相同或近似相同的时间点上收集的数据;时间序列数据是在不同时间收集到的数据。3、说明平均数、中位数和众数的特点及应用场合。数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。4、搜集数据的基本方法有哪些?(1)自填式。指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。(2)面访式。指现场调查中调查员提问、被调查者回答的调查方式。(3)电话式。指调查人员通过打电话的方式向被调查者实施调查。5、叙述正态分布曲线的特点(1)集中性。正态曲线的高峰位于正中央,即均数所在位置。(2)对称性。正态曲线一均数为中心,左右对称,曲线两端永远不与横轴相交。(3)均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;(4)正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平;(5)u变换:为了便于描述和应用,常将正态变量作数据转换;,6、数据的预处理包含那些内容,并对内容简单解析?数据预处理是对数据分类之前所做的必要处理,内容包括数据的审核、筛选、排序等。数据审核就是检查数据中是否有错误。通过调查取得的原始数据,主要从完整性和准确性两个方面去审核;对于通过其他渠道取得的二手数据,应着重审核数据的实效性和使用性。数据筛选时根据需要找出符合特定条件的某类数据。数据排序是指按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决解决问题的线索。7、什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?统计量是统计理论中用来对数据进行分析、检验的变量。设X1,X2,……XN是从总体X中抽取的容量为N德一个样本,如果由此样本构造一个函数T=T(X1,X2,……XN),不依赖于任何未知参数,则称此函数为一个统计量。常用的统计量有:样本均值(即n个样本的算术平均值),样本方差(即n个样本与样本均值之间平均偏离程度的度量),样本极差(样本中最大值减最小值),众数,样本的各阶原点矩和中心矩。由样本构造具体的统计量,实际上是对样本所有的总体信息按某种要求进行加工处理,把分撒在样本信息集中到统计量的取值上,因此统计推断问题就由样本信息推断总体特征转变为由样本构成的统计量推断总体参数,而且对于不同的统计推断问题可以根据同一样本构造不同的统计量进行研究。由于样本室已经抽出来的,所以统计量总是知道的,故统计量不含任何未知参数。8、怎样理解置信区间?置信区间:由样本统计量所构造的总体参数的估计区间9、评价估计量的标准有哪些?无偏性:指估计量分布的数学期望等于被估计的总体参数。有效性:指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。一致性:指随着样本量的增大,点估计量的值越来越接近被估计总体参数。10、如何理解显著性水平?通常以α表示,是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。α越小,犯拒绝“假设”的错误可能性越小。11、抽样估计中在不同样本状况下使用什么统计量、分布及其假设条件是什么?12什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?假设检验中我们可能犯的错误类型有两种:一类错误是原假设H0为真却被我们拒绝了,另一类是原假设为伪我们却没有拒绝。对于一定样本量n,不能同时做到犯这两类错误的概率都很小。如果减少第一类错误,就会增大犯第二类错误的机会,反之亦然。13、什么是P值,利用p值和利用统计量检验有什么不同?当原假设为真时锁得到的样本观察结果或更极端结果出现的概率不同:1.P值决策优先于统计量决策。与传统的统计量相比,P值决策提供了更多的信息。2.根据统计量决策,如果拒绝原假设,也仅仅是知道犯错误的可能性是那么大,但究竟是多少却不知道。而P值则是算出的犯第I类错误的实际概率。14什么是方差分析?方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。15、方差分析的基本原理是什么?16、一元线性回归模型中有哪些基本的假定?(1)因变量Y与自变量X之间有线性关系。(2)在重复抽样中自变量X的取值是固定的,即假定X是非随机的。(3)误差项ε是一个期望值为0的随机变量,即E(ε)=0(4)对于所有的X值,ε的方差δ2都相同。(5)误差项ε是一个服从正态分布的随机变量17、判定系数R²及其含义判定系数R²是回归平方和SSR占总平方和SST的比,测度了回归直线对观测数据的拟合程度。若R2=1则拟合是完全的,R2越接近于0,回归直线拟合程度越差。18、简述相关系数的性质(1)r的取值范围是[0,1]。(2)r具有对称性。(3)r的数值大小与x和y的原点和尺度无关。(4)r仅仅是x与y之间的一个度量,它不能用于描述非线性关系。19、什么是回归分析中的随机误差项和残差?它们之间的区别是什么?20、简述时间序列模型的四种成分21、简述指数平滑法的基本含义。指数平滑法是通过对过去的观测值加权平均进行预测的一种方法,该方法使t+1期的值等于t期值的实际观察值与t期的预测值的加权平均值。
本文标题:统计学简答题
链接地址:https://www.777doc.com/doc-5685797 .html