您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > MJ心理学考研大纲解析--心理统计(小白修订版)
1考研专业课大纲解析心理统计学2心理统计大纲解析一、描述统计心理统计中常见的基本概念1.变量及其种类(1)变量变量又称随机变量,即不断变化的,可取不同值的量。如实验中出现的自变量、因变量与额外变量(2)变量与数据的区别心理统计学中,一旦对变量进行了观测,或者进行了取值,这个数值也就是这个变量的一个观测值,即数据,一个变量可以有无数多的数据值。(3)变量和数据的分类1.根据变量性质的划分①名称变量:如性别、颜色等,也称类目变量,若属性只有两种结果,亦称二分名称变量。其所属数据是计数数据,即各类属的数量。②顺序变量:按事物的某一属性的大小或多少按顺序排列起来的数据,相邻两个等级的间隔是不等距的,只有等级上的差别,无单位又无绝对0点。③等距变量:这类数据只有相等的单位,而无绝对0点,如测验分数、温度等。④比率变量:又称等比变量,是一种既有相等单位,又有绝对零点的变量,如距离、时间、人的身高、体重等。后三种变量的数据都是用一定的测量工具或测量标准测量时所获得的数据,统称度量数据。2.根据变量的连续性划分①连续变量:即可无限划分的变量,如长度可划分为千米、米、厘米、微米等②离散变量:指测量单位间不能再细分的数据,常取整数,如名称变量3.根据变量间的关系划分:即自变量、因变量与额外变量的划分2.统计术语初步总体是指具有某些共同的,可观测特征的一类事物的全体个体是构成总体的基本单位或单元,又称元素或个案样本即从总体中抽出的一部分个体,一般30以上的样本称大样本,30一下的称小样本参数是总体的特征量数,一般只是理论假设时存在,实际无法测量,如μ(总体平均数)、σ(总体标准差)、ρ(总体相关系数)等统计量则是直接从样本计算出的量数,代表的是样本的特征,如M(样本平均数)、S3(样本标准差)、r(样本相关系数)等(一)统计图表统计表和统计图都是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:(1)数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列,其具体方法一般有如下三种:①顺序分布法:将数据按大小排列,后用频数f表示相同数据的出现次数②等级分布法:先按顺序排列数据,后以事物本身的性质标上相应的等级R,若有重复等级时,应在划分等级时根据其实际的排序位置求平均等级③次数分布法(2)统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去1.统计图统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注图形的种类:直条图(条形图)和圆形图(饼图)都是用于绘制离散型数据的统计图次数多边形图(线性图)与直方图是用于绘制连续型数据的统计图散点图则是用于表示对事物相互关系的统计图此外还有茎叶图、测量中用来表示结果的剖面图等2.统计表统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表次数分布表的编制过程与方法:(1)求全距(Range,R)maxmingRXX(2)定组数和组距经验法是根据经验将数据分为10~20组,其中10~15组为最佳,组距一般选择2、3、4、5、10等当数据来自于一个正态分布的总体时,可以用计算法:4251.87(1)kN;gRiK或(1)gRiK;其中i为组距,k为组数(3)定组限组限是指每一组的起止点表达界限:即根据第二步人为确定的上下限精确界限:上限or下限分别+/-0.5(或0.05、0.005)所得的界限(4)登记与汇总即写出各组频数f与总数∑f(二)集中量数集中量数即表示集中趋势的一种参数或统计量,反映的是频数分布中大量数据向某一点集中的情况。1.算术平均数(1)定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数。1niiXXN(2)特点①在一组数据中每个变量与平均数之差的总和等于零:()0XX②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C:1()iXCXCn③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C:1()iXCXCn(3)意义算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。2.中数(1)定义:中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据5比它大,一半数据比它小,以Md或Mdn表示。(2)算法:①数列总个数为奇数时,第(N+1)/2个数就是中数②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法注:有相等数数列的中数计算不容易,要自己好好摸索,我通常是采取如下方法:总个数为奇时取第(N+1)/2个数的组中值;总个数为偶时取第N/2个数的精确上限与第(N+1)/2个数的精确下限的均值3.众数众数:在次数分布中出现次数最多的那个数的数值,以Mo表示。众数可能不只一个。均数、中数、众数的关系与应用比较:(1)关系当数据分布呈正态时:M=Mdn=Mo呈偏态分布时,众数位于峰值最高点上,中数位于均值与众数之间,且有Mo=3Mdn-2M即正偏态分布时MoMdnM;负偏态分布时MMdnMo(2)比较与应用一个优良集中量应具备以下六个条件:1.感应灵敏;2.严密确定;3.意义简明;4.容易计算;5.适合代数法则处理以便进一步运算;6.受抽样变动的影响较小。三种集中量数的比较:平均数中数众数优点1.符合优良集中量的全部要求2.便于加权处理3.统计推断结果更可靠稳定1.符合优良集中量的2346条要求2.少受极端值影响1.符合优良集中量的第3条要求应用1.加权平均数2.离差、相关计算,进行统计推断等3.用于等距、等比数据1.数列中有极端数值时2.测量单位的性质不确定时3.上下端距离不确定时4.采用百分体制时5.用于顺序量表1.粗略估计时2.出现多峰分布时不足1.易受极端值影响2.组距不确定时无法计算1.易受抽样偏差影响2.不适合代数运算补充:其他集中量数(1)几何平均数121ngnnMxxxx……或lglgigxMn6主要用于:1.一组数据中有少数数据偏大或偏小,多用于心理物理学的等距与等比量表中;2.一组数据彼此间变异较大,且几乎是按一定比例关系变化时。(2)调和平均数1211111111()HnniNMnxxxxx……多用于描述速度方面的集中趋势(三)差异量数1.离差与平均差离差:分布中的某点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离。Xx一数列中所有数的离差之和始终为零,因此不同数据间差异无法用离差来比较。平均差:次数分布中所有原始数据与平均数绝对离差的平均值。..iXXADn缺点:进行了绝对值处理,无法进行下一步代数运算2.方差与标准差由于离差正负值互相抵消无法代表离中趋势,我们引入和方的概念和方:每一个离差值平方求和222()iixSSxxN(1)总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方。2SSN标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号σ表示。2(2)样本的方差和标准差7样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:21SSSn2SS方差、标准差的合成:22iiiiTiNSNdSN其中()TidXX(3)性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数(4)意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数3.变异系数当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是变异系数。①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大变异系数:一种最常用的相对差异量,为标准差对平均数的百分比100%sCVX使用变异系数时应注意:①所用数据应都是等比数据;②只能用于描述,不可进行统计推论。各种差异量数间的比较:方差与标准差全距平均差优点1.感应灵敏2.严密确定3.适合代数法则处理4.受抽样变动影响小1.意义简明2.计算简单1.意义简明2.计算简单3.严密确定缺点1.原理难理解,计算复杂2.受极端值影响较大1.极易受极端值影响2.无法反映全部数据的差异情况1.易受极端值影响2.不适合代数运算应用1.反映数据离散程度2.进行推论统计和检验使用价值很小少用83.用于判断数据可否舍弃4.计算CV、Z和标准误(四)相对量数1.百分位数百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比所对应的分数,实质上就是在某个百分位置上的数值。第P百分位数就是指,在某值为P的数据以下,包括分布中全部数据的P%。2.百分等级百分等级:常模团体中低于该分数的人所占总体的百分比:10050100RRPN其中R为某一原始分数在按大小排列的数列中的名次百分等级的应用:1.建立百分等级常模;2.衡量考绩的优劣;3.比较群体间成绩的优劣。3.标准分数(1)定义标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数,表示原始分数在平均数以上或以下几个标准差的位置。XXZS(2)性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,其分布形状与为转换前的原始分布相同③原始数据的Z分数分布标准差均为1④若原始分数呈正态分布,则转换得到的均值为0,标准差为1的标准正态分布(3)应用①比较不同测量单位时变量值的相对位置②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③异常值的取舍(通常在一个正态分布中,若一个数据的取值落在±3σ之外,则在整理数据时可将此数据作为异常值舍弃)学习时需要记忆几个经典Z分数及其对应的百分比值:1S=34.14%;2S=47.72%;3S=49.875%;1.64S=45%;1.96S=47.5%;2.33S=49%;2.58S=49.5%(4)导出分数导出分数便是为克服Z分数的某些不足而对其进行线性变换所得的分数,其转换形式为9Z’=aZ+b,转换后分布均值为b,标准差为a。几种常见的导出分数:正态化标准分数:T=10Z+50注:分数分布的转换有两种,一种是正态化转换,即根据原始分数计算出百分等级,再查正态分布表得到每个数据的P值,由此将整个分布转换为正态分布,这是一种非线性转换;另一种即是由Z分数经公式直接转换为T分数,这就是线性转换了,若不经正态化,其分数分布仍与原始分数的分布形态一致。一组非正态数据若要转换为正态化标准分数,则同时需要以上两步转换过程。韦氏成人智力量表:IQ=15Z+100比奈—西蒙量表:Z’=16Z+100(五)相关量数由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系。相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论。相关系数:两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用ρ表示。正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化测定系数:相关系数
本文标题:MJ心理学考研大纲解析--心理统计(小白修订版)
链接地址:https://www.777doc.com/doc-4703174 .html