您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 0272《心理统计学》2013年6月期末考试指导
0272《心理统计学》2013年6月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。考试题型可能有以下几种:1、选择题2、判断题3、名词解释4、填空题5、简答题6、应用计算题二、重点复习内容(一)绪论1、心理学统计学的内容:描述统计、推论统计、实验设计。描述统计:主要研究如何整理心理学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事件的性质。推论统计:主要研究如何通过局部数据所提供的信息,推论总体的情况。实验设计:主要目的在于研究如何科学地、经济地以及更有效地进行实验。2、心理统计基础概念:计数数据:是指计算个数的数据,一般属性的调查获得的是此类的数据,具有独立的分类单位。测量数据:是指借助于一定的测量工具或一定的测量标准而获得的数据。称名数据:只说明某一事物与其他事物在属性上的不同或类别上的差异,只计算个数,并不说明事物之间差异的大小。顺序数据:指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。等距数据:具有相等单位,但无绝对零的数据,只能使用加减运算,不能使用乘除运算。比率数据:即表明量的大小,也有相等单位,同时还具有绝对零点。连续数据:指任何两个数据点之间都可以细分出无限多个大小不同的数值。离散数据:又称不连续数据,这一类数据在任何两个数据点之间所取得的数值的个数是有限的。其他概念:变量、观测值、随机变量、总体、个体、样本、次数、比率、频率、概率、参数。(二)统计图表1、数据的初步整理:在数据排序和统计分组。2、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。编制分组次数分布表的步骤包括求全距;决定组距与组数;列出分组区间;登记次数;计算次数。3、次数分布图:常用的次数分布图有直方图、次数多边形图以及累加次数分布图。直方图:又称等距直方图,以矩形的面积表示连续性随机变量次数分布的图形。纵轴表示频数,横轴表示数据的等距分组点,即各组区间的上下限,有时用组中值表示。次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。横坐标是用各组组中值表示的连续变量,纵坐标是数据的频数。其它常用的统计图:条形图、圆形图、线形图、散点图。(三)集中量数集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。平均数的计算方法:①未分组数据的计算方法是将所有的数据相加,然后再用数据的个数去除数据总和。②根据次数分布表计算平均数,需要使用各分组区间的组中值来代表落入该区间的各个原始数据,公式如下:平均数=(∑fXc)/N式中:Xc为各区间的组中值f为各区间的次数N为数据的总次数60,N=∑f2、中数与众数中数概念:又称中点数,中位数,中值。符号为Md或Mdn。中数是按一定顺序排列在一起的一组数据中居于中间位置的数。众数概念:又称为密集数、范数等,常用符号M0表示,众数是指在次数分布中出现次数最多的那个数的数值。3、平均数、中数与众数三者之间的关系在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。在负偏态分布中,平均数小于中数,中数小于众数。MMdMo。对于数据较多的资料,其算术平均数与中位数的值不会相差太大。4、其他集中量数:加权平均数、几何平均数和倒数平均数。加权平均数适合解决用各个平均数求整体平均数之类的问题,倒数平均数适用于求平均速率一类问题,几何平均数适用于解决求增长比率的平均数一类的问题(四)差异量数差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。1、全距与百分位差全距又称两极差,用符号R表示,用最大值减去最小值就是全距。百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。2、标准差、方差方差:也称变异数,均方。作为样本统计量,用符号s2表示,作为总体参数,用σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。其基本计算公式如下:2()/sXXN。X表示原始数据,X表示平均数,N为数据总数。标准差:即方差的平方根,用s或SD表示,若是总体则用σ表示。基本计算公式如下:2xsNf为各组区间的次数。N为总次数。方差性质:可加性、可分解性标准差特性:每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。每一个观察值都乘一个相同常数C,则所得到的标准差等于原标准差乘以常数C。以上两点结合,每一个观察值都乘以一个常数C(C不等于0),再加上一个常数d,所得标准差等于原标准差乘以常数C。方差、标准差的意义:是表示一组数据离散程度的最好指标。其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。3、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV表示,为标准差对平均数的百分比,计算公式:CV=标准差/平均数×100%。4、标准分数:又称Z分数,是以标准差为单位表示一个原始分数在团体中所在的位置量数。离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。计算公式:Z=(原始分数﹣平均数)/标准差标准分数的优点:可比性、可加性、明确性、稳定性。标准分数的应用:用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低;计算不同质的观测值的总和或平均数,以表示在团体中的相对位置;表示标准测验分数。不同的差异量数适用于描述特定的数据分布的离散程度。(五)相关系数相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。样本相关系数用r表示,总体一般用表示。1、相关系数的解释:不能做因果解释,只是表示两个变量之间关系的程度;相关系数取值的大小表示相关的强弱程度,不能用倍数关系来解释,只能说绝对值大者必绝对值小者相关更为密切;可能存在伪相关。2、积差相关适用的数据资料:要求成对数据,即若干个体中每个个体都有两种不同的观测值;两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布;两个相关的变量是连续变量(比率或等距数据),也即两列变量都是测量数据;两列变量之间的关系应该是直线性的。计算公式:xyxyrNss,其中x、y为两个变量的离均差,x=X-X,yYY。N为成对数据的数目,xs为X变量的标准差,ys为Y变量的标准差。原始数据公式NYYNXXNYXXYr2222)()(3、等级相关斯皮尔曼等级相关:适用于两列变量为等级变量性质的具有线性关系的资料,在于要用于解决称名数据和顺序数据的相关问题。肯德尔等级相关:肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量,用符号W表示。4、质与量相关,包括点二列相关和二列相关以及多系列相关。适用于处理的变量中有类别数据。点二列相关:主要用于处理二分称名数据和一个连续数据之间的相关程度。二列相关:处理的都是连续性数据资料,但其中一列变量被人为划分成了二分变量。多列相关:是二列相关的发展,其中一列变量被人为划分成了二个以上的类别。5、品质相关:处理的数据类型一般是计数数据,而非测量数据,主要有四分相关、相关、列联相关。6、相关系数的选择:主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。偏相关和部分相关:是研究消除第三变量(或其他多个变量)影响后的两列变量间相关程度的方法。(六)概率分布1、概率的基本性质概率的公理系统:任何一个随机事件A的概率都是非负的;在一定条件下,必然发生的必然事件的概率为1;在一定条件下必然不发生的事件,既不可能事件的概率为0。任何一个随机事件的概率介于0和1之间。在统计推断中小概率事件一般被称为不可能发生的事件。事件的概率仅由事件本身决定,与我们用什么方法去求它无关。2、正态分布正态分布的特征:正态分布的形式是对称的,它的对称轴是经过平均数点垂线,平均数、中数、众数相等;正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式先向内弯,然后向外弯。拐点位于负1个标准差处,曲线两端向靠近基线处无限延伸,但不能与基线相交;正态曲线下的面积为1,平均数将其分为左右相等的两部分,各位0.50;正态分布为一族分布。均值为0,标准差为1的正态分布为标准正态分布。3、二项分布二项分布是指试验仅有两种不同性质结果的概率分布,即各个变量都可以归结为两个不同性质中的一个,两个观测值是对立的,以因而二项分布也可说是两个对立事件的概率分布。4、样本分布:是样本统计量的分布,是统计推论的重要依据。常用的样本分布有平均数及方差的分布。(1)平均数的样本分布:所谓平均数的样本分布是指从随机变量为正态分布的总体中,采取有放回随机抽样方法,每次从这个总体中抽取大小为n的一个样本,计算出它的平均数,这样抽取无限多次就将获得无限多个平均数,这无限多个平均数构成的分布就是平均数的样本分布。当样本足够大时,样本分布与总体分布相同。正态分布以及渐进正态分布:①样本平均数的分布:总体分布为正态,方差已知,样本平均数的分布是正态分布。总体分布非正态,但2已知,样本容量足够大时(n≥30),样本平均数的分布为渐进正态分布。②方差与标准差的分布:自正态总体中抽取容量为n的样本,当n足够大时(n≥30),样本方差及标准差的分布,渐趋于正态分布。T分布:①t分布的特点:平均值为0;以平均值0左右对称的分布,左侧t为负值,右侧t为正值;变量取值在之间;当样本容量趋于时,t分布为正态分布,方差为1;当n-1>30以上时,t分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;当n-1<30时,t分布于正态分布相差较大,随n-1的减少,离散程度越大,分布图的中间变低但尾部变高。②样本平均数的分布:总体为正态分布,方差2未知时,样本平均数的分布为t分布;当总体分布为非正态而方差又未知时,若满足n>30这一条件,则样本平均数的分布近似为t分布。2分布:2分布为正偏态分布;2值都为正值;2分布的和也是2分布,即2分布具有可加性;2分布是连续型分布,但有些离散型的分布也近似2分布;若果df大于2,这是2分布的平均数:2xdf,方差222xdf。F分布:用于分析任意两样本方差是否取自同一整体。F分布为正偏态分布,F值总为正值,因为F两个方差的比率;当分子自由度为1,分母自由度为任意值时,F值与分母自由度相同概率的t值得平方相等。(七)参数估计:1、点估计、区间估计与标准误点估计:是用样本统计量来估计总体参数。样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以成为点估计。区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,能指出未知总体参数落入某一区间的概率有多大。置信区间:也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间的上下二端点值称为置信界限。显著性水平:是指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。1-为置信度或置信水平。区间估计的原理与标准误:区间估计是根据样本分布理论,即抽样分布是参数区间估计的基本原理。用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。样本分布可提供概率解释,标准误的大小决定区间估计的长度。2、总体平均数估计3、标准差与方差的区间估计4、相关系数的区间估计5、比率及比率差异的区间估计(八)假设检验假设检验是通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异。包括参数检验和非参数检验。(1)假设检验的原理假设检验的基本思想是“反证法”式的推理,通过检验虚无假设0H的真伪来反证研究真实假设1H的真伪,若0H为真,则1H为假,而0H为假,1H
本文标题:0272《心理统计学》2013年6月期末考试指导
链接地址:https://www.777doc.com/doc-3117228 .html