您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 第十章研究资料的整理与分析
1第十章研究资料的整理与分析本章学习目标:1.理解量化资料整理与分析中的几个基本概念。2.掌握几种常用的量化分析方法。3.掌握质性资料的整理分析方法。无论采用什么研究方法进行研究,都会搜集到大量的、杂乱的、复杂的研究资料。因此,对大量的、复杂的研究资料进行科学、合理的整理和分析,就成为教育科学研究活动的必不可少的一个环节。这一环节体现着研究者的洞见,是研究者对研究资料进行理性思维加工的过程。通过这一过程,产出研究结果。根据研究资料的性质,研究资料可以分为质性研究资料和量化研究资料。对研究资料的整理和分析就相应的分为:质性研究资料的整理与分析和量化资料的整理与分析。第一节定量资料的整理与分析一、定量资料分析中的几个基本概念1.随机变量在相同条件下进行试验或观察,其可能结果不止一个,而且事先无法确定,这类现象称为随机现象。表示随机现象中各种可能结果(事件)的变量就称为随机变量。教育研究中的变量,大多数都是随机变量。如身高、智商、学业测验分数等。2.总体和样本总体是具有某种或某些共同特征的研究对象的总和。样本是总体中抽出的部分个体,是直接观测和研究的对象。例如,要研究西安市5岁儿童的智力发展问题,西安市的5岁儿童就是研究的总体,从中抽取500名儿童,这500名儿童就成为研究的样本。3.统计量和参数统计量:反映样本数据分布特征的量称为统计量。例如:样本平均数、样本标准差、样本相关系数等,都属于统计量,它们分别用表示。统计量一般是根据样本数据直接计算而得出的。参数:反映总体数据分布特征的量称为参数。例如:总体平均数、总体标准差、总体相关系数等。它们分别用,,等符号来表示。总体参数常常需要根据样本统计量进行估计和推断。4.描述统计与推断统计描述统计是指对获得的杂乱的数据进行分类、整理和概括,以揭示一组数据2分布特征的统计方法。包括:编制统计表;绘制统计图;计算各种统计量:集中量、差异量、相关系数量等。根据样本所提供的信息,运用概率理论进行论证,在一定可靠程度上对总体分布特征进行估计、推测,这类统计方法叫做推断统计。推断统计的特征有三点:推断总是根据样本信息对总体进行推断;推断总是依据一定的概率理论进行推断;推断总是在一定置信度上的推断。推断统计又可分为参数估计和假设检验。最常用的推断统计方法是假设检验。5.集中量与差异量集中量:是表示一组数据典型水平或集中趋势的量。集中量是一组数据整体水平的代表值。不同群体间学生成绩比较时,需要用集中量指标。常用的集中量指标有算术平均数、中位数、众数。差异量:表示一组数据的离中趋势或变异程度的量称为差异量。常用的差异量指标有方差、标准差和差异系数。从下列两组数据可以看出,描述一组数据分布特征仅用集中量指标是不够的,还需用差异量指标。A:6065707580B:5060708090两个组的集中量指标算术平均数都是70,但A组数据的变异明显大于B组的变异,A组的全距是20(最大值减去最小值),而B组的全距是40。所以要全面描述一组数据的分布特征,既要用集中量指标,也要用差异量指标。二、方差和标准差的概念及其计算描述一组数据的分布特征,需要用到集中量指标和差异量指标。集中量最常用的指标是算术平均数,这在小学里都已经学过,这里不再赘述。最常用的差异量指标是方差和标准差。这里简单介绍方差和标准差的概念及其计算方法。1.方差:是一组数据离差平方的算术平均数(用表示)。定义公式为:NXXS22)(为数据个数。:;:为离差平方和为离差NXXXX2)(2.方差的方根即标准差NXXS22)(例如:利用定义公式求:5、6、8、6、4的方差和标准差。3解:33.1)3(77.158.548.568.588.568.55)2(8.546865)1(22222222])()()()()[()(5SSNXXSNXX:::标准差方差求平均数三、假设检验的逻辑原理常用的推断统计是假设检验。现以平均数的显著性检验为例来说明假设检验的逻辑原理。以平均数为例,看假设检验的基本原理。从已知总体中抽出的容量为n的一切可能样本的平均数形成的分布如右图,这就是平均数的抽样分布。当总体为正态分布时,平均数的抽样分布也符合正态分布。现有一个随机样本,其平均数为Xa,这个样本是来自0这一已知总体吗?或者说这个样本所代表的总体平均数和已知总体平均数0相等吗?这就是假设检验所要解决的问题。其逻辑原理是,视Xa在以0为中心的平均数抽样分布上出现的概率大小而定。若样本平均数Xa在以0为中心的抽样分布中出现的概率较大,则认为样本所属总体和已知总体为同一总体;若样本在抽样分布中出现的概率较小,则认为样本X所属总体与已知总体0有显著性差异。四、总体平均数的显著性检验总体平均数的显著性检验,也就是根据一个样本信息,来检验这个样本所代表的总体平均数,和一个已知的总体平均数是否有显著性差异。例如:某校初一年级英语测验的平均成绩为78分,标准差为7分。实验班40名学生的平均成绩为79.5分,问实验班成绩与全年级的成绩有无显著性差异?检验:其值选择检验统计量并计算)()提出假设:(::27878110HH假定总体为正态分布,总体σ已知,所以采用z检验436.1407785.79nXZ(3)确定检验形式没有资料说明实验班的成绩过去是高于还是低于全年级的成绩,所以采用双侧检验。(4)统计决断05.096.136.12/05.0||PZZ因此,在0.05水平上保留零假设,拒绝备择假设,结论为实验班的成绩与全年级的成绩差异不显著。(1.96和2.58是Z检验时的两个临界值,当计算出的Z值小于1.96时,概率P就大于0.05,这时差异不显著;当Z值大于1.96或者大于2.58时,P值就小于0.05或小于0.01,这时差异就显著或极其显著。)当总体标准未知时,应当使用t检验。五、平均数差异的显著性检验(独立大样本)平均数差异的显著性检验,也就是根据两个样本信息,对两个样本所代表的两个总体平均数之间是否有差异,所进行的检验。例如:在一次教学方法的实验研究中,实验后的测试结果为:实验班50名学生的平均分是83、标准差是6;对照班48名学生的平均分是80,标准差为5。试问,实验班的成绩与对照班的成绩有无显著性差异?检验:算其值、选择检验统计量并计、假设::2121121HHo假定总体为正态分布,未知,独立大样本,故采用Z检验42.248550680832222212121nSnSXXZ3、确定检验形式采用双侧检验。4、统计决断∵|Z|=>1.96=Z0.05∴P<0.05因此,在0.05水平上拒绝零假设,接受备择假设。结论为实验班的成绩与对照班的成绩差异极其显著。六、卡方检验对总体平均数之间是否有差异所进行的检验,被称为参数检验。常常适5用于教学实验研究。而对调查资料,常常需要运用非参数检验的方法进行检验。最常用的非参数检验就是卡方检验。2检验的统计量ttfff202)(为理论频数为实际频数,t0ff。例如:对100人进行某一态度问题的调查,60人否定,40人肯定。现在问肯定人数与否定人数差异是否显著?检验:1.假设0H:肯定与否定人数差异不显著;1H:肯定与否定人数差异显著。2.计算卡方值根据肯定与否定人数无显著性差异的零假设,肯定与否定人数的理论频数均为100/2=50。所以450)5040(50)5060()(22202ttfff3、统计决断因为205.0)1(284.34所以P<0.05因此在0.05水平上拒绝零假设,接受备择假设。结论为,肯定与否定人数差异显著。七、相关分析相关的概念1、相关关系相关关系:两个变量之间不精确、不稳定的变化关系就是相关关系。这一概念包括以下几层意思:(1)两个变量间存在着变化关系,即一个变量变化时,另一个变量也会发生变化;(2)两个变量的变化关系不精确、不稳定、不能用函数式表示;(3)两个变量间互为因果关系。2、相关关系的类型从两个变量的变化方向上分:(1)正相关:两个变量变化方向一致;6(2)负相关:两个变量变化方向相反;(3)零相关,两个变量变化方向无规律。3、从密切程度上分(1)高度相关;(2)中度相关;(3)弱相关。相关系数相关系数是表示两个变量之间的变化方向及密切程度的统计指标。样本相关系数用r表示,总体相关系数用表示。相关系数的取值范围:11r正负号表示变化方向,绝对值表示密切程度。含义不同。与如:3.070.0rr积差相关积差相关的概念与使用条件1、积差相关的概念积差相关:是指具有线性关系的两个正态连线变量的相关2、积差相关的作用条件(1)两个变量都是由测量而获得的连续型数据;(2)两个变量的总体都是正态分布或接近正态分布;(3)数据必须是成对的,且各对之间相互独立;(4)两个变量间呈线性关系(5)要排除共变因素;(6)。或样本容量)50(30nn3、积差相关系数的定义公式yxnYYXXr))((即7例:10个学生初一(X)与初二(Y)数学分数积差相关系数计算表序号XYXXYY))((YYXX2)(XX2)(YY(1)(2)(3)(4)(5)(6)(7)(8)1747633.711.1913.692717502.7007.29372711-1.3-1.311.6946870-3-2.36.995.295767653.718.52513.696737926.713.4444.8976765-4-7.329.21653.2987077-14.7-4.7122.0996562-6-10.361.836106.091074723-0.3-0.990.09总和710723134110268.10总和736411.503相关系数的显著性检验(一)相关系数的抽样分布一切可能的r值的频数分布是r的抽样分布。r抽样分布的形态:1、r的抽样分布形态随和n变化;2、0时,分布对称或为正态分布;3、0且较小,50n时,近似正态分布;4、较大时r抽样分布为偏态。(二)相关系数检验的基本原理8只有r在以0为中心的抽样分布上出现的概率很小时,才能认为X与Y有相关关系。(三)相关系数检验的方法1、0:0H时相关系数的显著性检验(1)当50n时,r的离差统计量近似正态分布:211rnrZ【例题】:随机抽取100名学生的数学与物理成绩,求得65.0r,问从总体上讲数学与物理成绩是否存在相关?检验:(1)假设0:0H0:1H(2)选择并计算统计量检验用且Zn50100,02.1165.01110065.01122rnrZ(3)统计决断01.058.2**2.11ZZ01.0P因此,在职0.01水平上拒绝零假设,接受备择假设。结论为学生的物理成绩与数学成绩存在正相关。(2)当50n时当050、n时,r的离差统计量为t分布。212rnrt2ndf【例题】:25名学生的身高与体重的相关系数为45.0r,问学生身高与体重是否存在正相关?检验:9(1)假设0:0H0:1H(2)选择并计算统计量,0且5025n.检验采用t42.245.0122545.02221rnrt(3)统计决断根据232252ndf查表知069.205.0)23(t05.0069.242.205.0)23(Ptt结论为学生的身高与体重存在正相关。注:一般可通过查积差相关系数临界值表(附表9)进行简便推断:)(505.0396.001.0)23(05.0)23(双侧rr05.0396.045.005.0)23(Prr结论同前等级相关表示等级次序变量之间的相关即为等级相关。常用的等级相关有两种:斯皮尔曼的二列等级相关和肯德尔和谐系数。斯皮尔曼等级相关1、斯皮尔曼等级相关的概念表示两个等级次序变量之间的相关,即
本文标题:第十章研究资料的整理与分析
链接地址:https://www.777doc.com/doc-2165765 .html