您好,欢迎访问三七文档
所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。平均数、标准误中位数、众数、全距标准差、方差四分位、十分位、百分位数频数分布、峰度、偏度标准分数及其线性转换探索分析交叉列联表分析第二章描述性统计分析过程1.平均数、标准误返回本章首页基本的描述性统计量中位数、众数、全距返回本章首页标准差、方差返回本章首页严格地讲,在方差和标准差的计算中,分母应取n-1,因为数据变异的自由度是n-1。但在大样本情况下,使用n和n-1差别不大。四分位、十分位、百分位数返回本章首页频数分布、峰度、偏度频数(Frequency)就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。峰度(Kurtosis):是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于0,其数据分布的陡缓程度与正态分布相同;峰度大于0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。返回本章首页实例演示偏度(Skewness)是描述数据分布对称性的统计量,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于0,则其数据分布的对称性与正态分布相同;如果偏度大于0,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于0,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。返回本章首页实例演示标准分数及其线性转换Z分数:从平均数为,标准差为的总体中抽取一观测值,该观测值的Z分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其他分数相比的相对位置。比如Z分数为1.5,则其比平均数大1.5个标准差。在实际应用中,为了避免小数的不便,可以对标准分数进行线性转换:T=10Z+50比如某人在艾森克人格问卷的测量中,其精神质得分比同年龄人的平均成绩高2.0个标准差,则其换算后的标准分数为70分;如果另一人的测试分数正好等于平均数,则其标准分数为50。返回本章首页探索分析探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:1.用直方图反映数据的分布直观形式;2.用箱图(或叫框图)反映数据的集中趋势和奇异值;3.用Levene检验考察多组间方差是否齐性;4.用Q-Q概率图检验数据是否正态分布或接近正态分布。返回本章首页1.用直方图直观地反映数据的总体分布调用数据文件并得到直方图选择反应时间600.0575.0550.0525.0500.0475.0450.0425.0400.0375.0350.0325.0300.0HistogramFrequency3020100Std.Dev=48.43Mean=435.8N=120.00返回本章首页直方图:是一种频数分布图,它反映处在某一观测值范围内的个案数。图中每个直方条下部的中点坐标是该观测值范围的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围内的个案数或人数比例。2.用箱图(或叫框图)反映数据的集中趋势和特异值调用数据文件并得到箱图30303030N=不同颜色的灯光刺激4321选择反应时间700600500400300200100733649552027返回本章首页批注:箱图可以直观地反映一组观测值的集中趋势、离散趋势、不正常观测值(奇异值和极值,均可被排除后重新分析)。左图中箱图的高度代表了25%位数到75%位数的距离;箱图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,触须线的上下截止线分别对应于观测值的最大值和最小值;用O标记的是奇异值(与框边距离超出框高1.5倍)、用*标记的为极大值或极小值(与框边距离超出框高3倍)。3.用Levene检验方差是否齐性方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性(homogeneity)的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用Levene方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的结果中p0.05,则认为方差齐性(即方差具有相同性);方差分析的结果中p0.05,则认为方差不齐性(即方差具有不同质性)。方差齐性检验举例与spss过程演示返回本章首页4.用Q-Q概率图检验数据是否正态分布可以用正态概率Q-Q图和离散正态概率Q-Q图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图,如果实际值为正态分布,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横线周围时,数据分布接近于正态分布。正态概率图(NormalQ-QPlot)的SPSS过程离散正态概率图(DetrendedNormalQ-QPlot)的SPSS过程返回本章首页NormalQ-QPlotof选择反应时间ObservedValue700600500400300200100ExpectedNormal3210-1-2-3DetrendedNormalQ-QPlotof选择反应时间ObservedValue700600500400300200100DevfromNormal1.51.0.50.0-.5-1.0-1.5-2.0返回本章首页描述性统计,是心理学研究、教育研究中资料分析的基本内容和进一步分析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。本章要求熟练掌握的内容包括:平均数、标准差、中位数、众数、频数分布、标准分数(Z)及其线性转换、峰度计算、偏度计算、奇异值和极值检测、方差齐性检验等方面的SPSS过程;准确理解直方图和箱图的各种特征及其所代表的含义。返回本章首页本章练习题及数据表练习题1.表2-lx-1所示的数据是某中学初二5班学生的期末考试成绩。(1)请建立SPSS数据文件,然后计算全班同学各门功课成绩的平均数、标准误、标准差、中位数、众数、全距;(2)作出各门课程成绩的直方图,从直方图大致判断其偏度、峰度是大于0还是小于0,然后计算各自的偏度和峰度,并与你的估计作比较;(3)将学生各门课程成绩均转换为标准差为10、平均数为100的标准分数,然后计算每一学生标准分数的总和,找出成绩最好的学生的编号;(4)考察分数分布是否正态或接近正态。练习题数据表2.某研究者为考察汉字加工中双字词语音识别中的半测优势,以及这种半测优势所受语义关联性的影响。他选用若干语义无关双字音节和语义关联双字音节作为实验材料。从某学院300名男大学生中随机抽取了30名学生,再将其随机分成A、B两组,分别采用左耳和右耳输入音节,要求其听到输入的音节时尽量快速大声复述该音节。实验利用计算机程序控制,自动记录其反应时间,结果如表2-lx-2所示。(1)建立正确的SPSS数据文件;(2)考察两组被试的反应时间是否接近正态分布;(3)作箱图,检查是否存在奇异值和极值;(4)进行反应时间的组间方差齐性检验。练习题数据表转到第三章练习题
本文标题:描述性统计分析过程
链接地址:https://www.777doc.com/doc-3580982 .html