您好,欢迎访问三七文档
124.统计量(对应样本)是用来描述样本特征的概括性数字度量。是根据样本数据计算出来来的一个量,由于抽样时随机的,因此统计量是样本的函数。37.统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。1.分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表示的。2.四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值。3.方差分析:是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。4.相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。5.居民消费价格指数:是度量居民消费品和服务项目价格随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平的变动情况。6.顺序数据:是只能归于某一有序类别的非数字型数据。抽样误差:是由于抽样的随机性引起的样本结果与总体真值之间的误差。7.置信区间:在区间估计中,由样本统计量所构成的总体参数的估计区间。8.点估计:用样本统计量^θ的某个取值直接作为总体参数θ的估计值。9.系统抽样:将总体中的所有单位(抽样单位)按一定的顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按后按事先规定好的规则确定其他样本单位。10.中心极限定理:设从均值为、方差为2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为、方差为2/n的正态分布。11.回归模型:描述因变量y如何依赖于自变量x和误差项的方程。对于只涉及一个自变量的一元线性回归模型可表示为y=β0+β1x+ε。12.指数平滑法:是通过对过去的观察值加权平均进行预测的一种方法,该方法是t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。13.非概率抽样:是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。14.时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。15.指数:或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。16.显著性水平:在原假设正确的情况下,错误地拒绝原假设的概率。显著性水平用α表示。17.泊松分布:是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。18.股票价格指数:反应某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数,其单位一般用“点”表示。19.独立性检验:对两个分类型变量是否存在相依关系的检验。如果存在相依关系,有必要对这种相关性进行进一步测定。20.参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。21.截面数据:是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。22.数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。23.β错误:是原假设为伪我们却没有拒绝,犯这类错误的概率用β表示。或叫做取伪错误。25.集中趋势:一组数据向某一中心值靠拢的程度,反映了一组数据中心点的位置所在26.相对离散程度:离散系数:也成为变异系数,是一组数据的标准差与其相应的平均数之2比。离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;小,说明数据的离散程度也小。27.偏态:是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。如果分布式对称的,则偏态系数等于0。大于1或小于-1,成为高度偏态分布,在0.5-1或-1到--0.5,被认为是中等偏态分布;越接近0,偏斜程度越低。0.4表示右偏,偏斜程度不大。SK为正值时,表示正离差值较大,可以判断为正偏或右偏;负值时,表示负离差值较大,判断为负偏或左偏。数值越大,偏斜程度越大。28.峰态:是对数据分布平峰或尖锋程度的测度。测度峰态的统计量是峰态系数。峰态通常是与标准正态分布相比较而言的。服从标准正态分布,峰态系数的值等于0;不等于0,表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。当K0,尖峰分布,数据的分布更集中;小于0,扁平分布,数据的分布越分散。29.置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,区间的最小值称为置信下限,最大值称为置信上限。30.置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数针织的次数所占的比例称为置信水平,为成为置信度或置信系数。31.评估估计量的标准:无偏性(小样本中)、有效性(小样本中)、一致性(大样本中)。32.无偏性:估计量抽样分布的数学期望等于被估计的总体参数。33.有效性:对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。34.一致性:随着样本量的增大,点估计量的值越来越接近被估计总体的参数。35.t分布:类似正态分布的一种对称分布,通常要比正态分布平摊和分散。一个特定的t分布依赖于称之为自由度的参数。随着自由度的增大,t分布也逐渐趋于正态分布。36.P值:当原假设为真时所得到的样本观察结果或更极端结果出现的概率。P值越小,我们拒绝原假设的理由越充分。38.描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。39.推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。40.指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。41.直条图:用直条(或矩形)的长短表示统计数据多少的图形。42.直方图:以矩形面积表示连续变量的统计图。43.折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。44.散点图:表示事物相互关系的图形。45.圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重或百分比的统计图。46.枝叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。47.方差(S2/V/MS):一列数据离差平方的算术平均数。一列数据平均差距地平方。48.标准差(S/SD):方差的算术平方根。一列数据的平均差距。49.平均差(AD):离差绝对值的平均数。50.正相关:指一列变量由大到小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。51.负相关:指一列变量由小到大或由大而小变化时,另一列变量却由小而大或由大而小的3变化,即两列变量是反方向变化的,属“此增彼减”的关系。52.零相关:又称无相关,指两列变量的变化看不出一定的趋势。53.自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为自由度。df/’n’54.参数估计:根据样本统计量去估计相应总体的参数。55.总体平均数估计:用样本的均数去估计总体的均数。56.点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。57.区间估计:以统计量的区间值来估计相应总体。58.置信系数:指被估计的总体参数落在置信区间内的概率D,或以1-α表示,又叫置信水平,置信度,可靠性系数,置信概率。59.无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是极少见的,当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值,其偏差为0。即∑(X-μ)=0。这时的统计量被称为无偏估计量。60.假设检验:由于在进行差异检验时需要先对事物是否存在差异作出假设,然后再作统计检验,因此称为假设检验,又称差异的显著性检验。61.α错误:指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使做出了拒绝虚无假设的结论,又称Ⅰ型错误。62.β错误:指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使作出了接受虚无假设的结论,又称Ⅱ型错误。63.双侧检验:把拒绝性概率值置于理论分布的两端或两侧。64.单侧检验:把拒绝性概率值置于理论分布的一尾或一侧。65.方差分析:就是对多个平均数进行比较的一种统计方法,又称变异数分析。66.回归分析:根据一个已知变量来预测另一个变量平均值的统计方法。67.回归线:分别用两列变量做横、纵轴描点。如没有随机误差的影响,这些点将落在一条直线上,此直线叫回归线。68.回归系数:线性回归方程中自变量的系数。69.最小二乘法:找到这样一条直线,使所有的点到直线的垂直距离(与X轴垂直)的平方和最小。
本文标题:统计名词解释用
链接地址:https://www.777doc.com/doc-5448301 .html