您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 教育统计学总复习(含答案)
1h教育统计学总复习一、问答题1什么是描述统计和推断统计?描述统计:用来描述或概括获得数据的基本情况,显示其基本特征。推断统计:根据样本数据提供的信息,运用概率理论进行分析论证,在一定可靠程度上推断总体的有关特征。2为什么要使用抽样推断,而不用全体研究原因:3样本容量的大小对统计研究有何影响?影响:4变量有哪些种类,各有什么特点,能否相互转换?5数值变量就是连续变量吗?为什么6频数分布的作用是什么7什么是集中量数,哪些属于集中量数?集中量数是代表一组数据的典型水平或集中趋势的量;常用的集中量数有平均数、中位数和众数8什么是差异量数,哪些属于差异量数?差异量数是指表示一组数据彼此间的变异程度或离散程度的统计量,又称为离中趋势。9平均数和标准差有哪些特点平均数使用广泛,简单易懂,能反映一组数据资料的集中趋势,包括算数平均数、加权平均数、几何平均数和调和平均数;标准差是方差的平方根,标准差的单位和原始数据的单位一致,且对极值得敏感程度较低,标准差的值越小,说明数据离散程度越小,数据月整齐和集中,反之就情况相反。10差异系数的概念与应用差异系数(coefficientofvariation),也称变差系数、离散系数、变异系数,用CV表示。它是一组数据的标准差与其算数平均均数的百分比,是测算数据离散程度的相对指标。计算公式为:CV=标准差÷算术平均数·100%11什么是百分等级,有哪些应用一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。换句话说,百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置越低。运算公式为:PR=100-{(100R-50)/N|},其中R是原始分数排列顺序数,N是指总人数(样本的总人数)。例如小东在30名同学中语文成绩是80分,排列第5名,则其百分等级为:PR=100-{(100*5-50)/30}=85,百分等级为85即指,在100名被试中,语文成绩低于小东的80分的有85人12什么是标准分数,有哪些应用对于来自不同均值的和标准差的总体的个体数据,往往不能直接对比,需要将其化为统一规格、尺度的数据后再比较。即标准分数。标准分数=(X-均值)|标准差。运用:a用于比较不同对象相同科目成绩在整体中所处2的位置,b用于比较不同对象几个科目的综合成绩在整体中的位置13如何理解两个变量的相关关系,相关关系是与函数关系吗?两个变量的相关关系是指两个变量之间的不精确、不稳定的变化关系;函数关系刻画了事物之间的严格的依存关系,当自变量发生变化时,因变量也是随之发生确定性的、可在数量上准确预测的变化,即是一种一一对应的关系。14什么是正相关与负相关正相关:两个变量之间的得变化方向一致,一个变量变大,另一个变量也随之变大,一个变量变小,另一个变量也随之变小。负相关:两个变量的变化方向相反,一个变量变大,另一个变量随之变小,一个变量变小,另一个变量随之变大。15相关分析的方法有哪些方法有:积差相关系数、等级相关系数、质量相关系数、四分相关系数。16积差相关的条件是什么条件是:1两列数据都是等距连续变量的观察数据或是等比的测量数据;2都来自于正态分布的数据整体;3两列数据必须具备一一对应的关系。17等级相关的条件是什么条件是:两列具有等级顺序的测量数据,或总体为非正态分布的等距、等比数据。18·什么是二列相关和点二列相关两个变量都是来自于正态总体的等距或等比变量,而且其中一个被认为的划分为两个类别,成为二分变量。当两变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关;点二列相关是指两个变量中的一个是来自正态总体的等距或等比数据,另一个是二分称名变量,即按事物的某一性质只能分为相互独立的两类变量,譬如男与女,生与死等等。19解释相关系数时要注意什么1、相关系数常以小数表示。2、正值表示正相关,负值表示负相关。3、注意:完全正相关,完全负相关,零相关。4、判定相关是否密切时,考虑计算相关系数时样本量的大小]①相关系数表明两个变量之间的关系密切程度,比较相关系数时,不能用倍数关系说明。②相关系数的大小表明了两列测量数据相互间的相关程度;绝对值相同的正负相关系数值表示的相关关系程度一样,方向不同。③当两个变量间的关系受其他变量影响时,两者之间可出现伪相关,这时两列变量之间的相关系数没有任何实际意义。④相关关系不是因果关系,相关值较大的两类事物之间,不一定存在因果关系。20·什么是回归分析,回归方程有什么意义回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法;回归方程的意义:x和y之间本来没有严格的关系,也不是对群体中任一个体都适用,而是用一个简练的形式总括了x,y之间的复杂关系的大趋势,使我们能从量的角度认识两个变量之间的依存关系。21·简述相关分析和回归分析的区别和联系1、在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由3回归方程进行数量上的预测和控制。22·统计推断的基本问题是什么统计推断:通过选取适当的样本作为总体的代表,去推断总体的统计特征;样本要对总体有良好的代表性,关键是找到样本和总体的特定关系,并用数学语言表达出来,也就是建立数学模型。23·什么是随机事件与概率随机试验的每一种结果或随机现象的每一种表现称为随机事件;随机事件发生可能性的大小称为概率。24·概率分布有什么意义25·什么是正态分布,正态分布曲线有什么特点正态分布(Normaldistribution)是一种概率分布。正态分布是具有两个参数μx和σ^2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ^2)。遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。特点:μx—均值,σx—标准差。正态分布概率密度曲线f(x)特点:1,以μx为对称,曲线与X轴间的面积在μx两边各为0.5,2,曲线在μx±σx处有拐点,3,在μx±σx区间的面积为68.26%,在μx±2σx区间的面积为95.44%,在μx±3σx区间的面积为99.73%。26`什么是点估计和区间估计点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。(2)区间估计也是参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。前者得出的是一个具体的值,后者是一个区间。联系:都是统计学中常用的参数估计方法。27`简述什么是抽样分布抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。(如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。)28·中心极限定理的主要内容是什么?设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布。设随机变量序列X1,X2,、、、Xn,、、、相互独立,均具有相同的数学期望与方差,且E(Xi)=Ui,D(Xi)=Ri^20,i=1,2,、、、,令:Yn=X1+X2+、、、+Xn4Zn=〔Yn-E(Yn)〕/√D(Yn)=∑(Xi-Ui)/√∑Ri^2(i=1,2、、、、n)则称随机变量Zn为随机变量序列X1,X2,、、、,Xn的规范和。29·标准误及其意义标准误(英文:StandardError)衡量对应样本统计量抽样误差大小的尺度。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。此外,还需要特别指出的是,标准误还可以指样本标准差、方差等统计量的标准差,不仅仅只是样本均数的标准差。30·假设检验的思想与步骤假设检验的基本思想是小概率反证法思想。基本依据是“小概率原理”.所谓小概率原理就是:概率很小的随机事件在一次试验中一般不会发生.根据这一原理,我们从H0出发,在一定的显著性水平α下,从总体中抽取一个子样进行检验,在H0成立的条件下,若发现“相应统计量(即随机变量)取到此子样代入统计量后的值”是一个小概率事件,亦即小概率事件在一次试验中发生了,这与“小概率原理”矛盾,所以,此时就拒绝H0并接受H1;反之,就只有被迫接受H0.假设检验的一般步骤1)根据实际问题提出原假设H0与备选假设H1,即说明需要检验的假设的具体内容;2)选择适当的检验统计量,并在原假设H0成立的条件下确定该统计量的分布及原H0的拒绝域的形式;3)按问题的具体要求,选取适当的显著性水平α,并根据统计量的分布查表,确定对应于α的临界值,求出H0的拒绝域;31·什么是原假设和备择假设原假设就是关于样本所代表的总体参数(如平均数、方差、相关系数等)与假设总体参数(如平均数、方差、相关系数等)之间无差异的假设,或者两个以及多个样本所代表的总体参数之间的无差异假设。备择假设是关于样本所代表的总体参数与假设总体参数之间存在差异的假设,或者两个以及多个样本所代表的总体参数之间存在差异假设。32·简述假设检验中零假设和研究假设的作用研究者可以根据数据分析、经验判断或经过周密思考后确定零假设,研究者依据样本信息的计算直接证明零假设是否正确;如果研究者拒绝了零假设,那么就必须用研究假设,并推定研究假设的真实性,然后做出拒绝零假设接受研究假设的统计决策。什么是小概率原理与显著性水平小概率事件:概率很小的事件在一次试验中几乎不可能发生显著性水平:假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假设;大于这个标准则接受原假设。这样显著性水平把概率分布分为两个区间:拒绝区间,接受区间。(通常假设检验时只考虑到了第一类错误,而忽视掉了第二类错误,所以将此时的假设检验称为显著性检验)33.单侧检验和双侧检验有什么不同根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小;单侧检验则强调差异的方向性,即关心研究对象是高于还是低于某一总体水平。在实际操作中要根据研究的目的和假设来选择单侧检验还是双侧检验,如果假设中有一参数和另一参数方向性的比较,比如大于、好于、差于等,一般选择单侧检验。如果只是检验两参数之间是否有差异,就选择双侧检验。双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两5种情况,一是独立样本t检验,一是配对样本t检验。34.统计假设检验的判断法则是什么35.单总体、双总体平均数检验的假设是什么单总体检验:检验一个样本平均数与它的总体平均数之间差异的显著性程度双总体检验:根据两个平均数之差检验与之对应的两个总体平均数之间差
本文标题:教育统计学总复习(含答案)
链接地址:https://www.777doc.com/doc-2387265 .html