您好,欢迎访问三七文档
教育统计的基本方法参考书目•《教育统计学》,王孝玲编著,华东师范大学出版社2001.7。•《现代教育统计与测评技术》,朱德全、宋乃庆主编,西南师范大学出版社1998.7。•《教育统计的基本理论与SPSS操作技术》,王秀玲、刘兰英编著,杭州出版社2000.7。•《统计分析指导》,吴亚萍,教育科学出版社2003.9。一、统计的含义•统计:搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断。•教育统计:搜集、整理、分析有关教育研究和教育实践工作中的数字资料,并以此为依据进行科学推断,揭示教育现象所蕴涵的客观规律。二、统计的作用•统计是进行定量分析的方法与工具。•可用于教育科学研究、教育评价、教育管理等方面。•注意:统计不是万能的工具!课题实例•《现代中小学教育》2005.3--•对中小学教师教育科研情况的实证分析(陈桂梅、南纪稳)•教育硕士求学动机的调查研究(黄文锋、徐富明)•兴趣项目优先教学后学生若干体质指标的研究(胡加匡)•中学生合作学习能力评价的探讨(陈木兰)•《现代中小学教育》2005.2--•后进生家庭因素的调查与研究(屠丰庆、葛松定)•歧义容忍度与外语学习成绩的相关分析(邵玲)•新课程师资培训的问题与对策(杜志强,靳玉乐)•---《课程.教材.教法》2005.5三、教育统计资料的来源•㈠经常性资料:平时就有记载的资料。例如日常工作记录、学生档案、作业、统计报表等。•㈡专题性资料:平时没有记载,为某个目的或需要而专门去搜集的资料。通过调查、实验、观察、测验等方式进行搜集。四、抽样设计•㈠基本概念•总体:所研究的具有某种共同特性的一类事物的全体。•个体:总体中的基本单元或每个单位。•样本:从总体中抽出来的对总体具有代表性的一部分个体。•抽样:从总体中抽出一部分个体使其成为该总体的样本的过程。•样本容量:样本中所包含个体的数目。通常用字母n表示。•大样本:样本容量大于30的样本。•小样本:样本容量小于或等于30的样本。㈡抽样原则•随机性原则。即保证总体中每个个体被抽到的机会均等。•目的:保证样本对总体有比较好的代表性。㈢抽样方法•单纯随机抽样•机械抽样•分层抽样•整群抽样⒈单纯随机抽样•是保证抽样的随机性和独立性的抽样方法。•例如:•抽签法•随机数字表法⒉机械抽样•把总体中所有的个体按一定顺序编号,然后依固定的间隔取样。•可保证被抽到的个体在总体中的分布比较均匀。•如何确定取样间隔?•根据所需样本容量与总体中个体数目的比率而定。例如,要在100人中抽取10人,则需要从总体中抽取1/10的人,即间隔10人抽一人。•可将单纯随机抽样和机械抽样结合使用。⒊分层抽样•按照与研究内容有关的因素或指标先把总体划分成几部分(即几个层),然后从各部分(即各层)中进行单纯随机抽样或机械抽样。•步骤:•确定分层的标准。•确定样本容量的分配。•确定具体的抽样方法。⒋整群抽样•从总体中抽出来的研究对象不是以个体为单位,而是以整群为单位的抽样方法。•整群抽样经常与分层抽样相结合,即先把总体分层,然后再在各层中进行整群抽样。例:新课程师资培训的问题与对策杜志强,靳玉乐《课程.教材.教法》2005.5•采用随机抽样的方式,抽取100名参加新课程师资培训的中小学教师,进行问卷调查,回收有效问卷97份。例:小学新课程实施现状调查报告(胡卫平等)《课程.教材.教法》2005.2•本次调查采取分层整群抽样的方法,在山西省东、西、南、北、中各取一个市,并在每一个市随机抽取2所城市小学和3所农村小学,参加调查的对象共有10所城市小学的校领导22人(男10人、女12人)、参与课改的教师154人(男3人、女151人)和15所乡村小学的校领导24人(男15人、女9人)、参与课改的教师89人(男3人、女86人)。五、数据的种类•㈠根据来源可分为:•⒈点计数据:计算个数所获得的数据。如教师人数、班级数、教学仪器数、近视人数等。•⒉测量数据:用一定的工具或标准测量所获得的数据。如身高、智商、完成作业的时间、学科成绩等。•㈡根据随机变量取值情况可分为:⒈间断变量的数据:取值个数有限的数据。例如,人数、等级、名次等。⒉连续变量的数据:取值个数无限的数据。例如,身高、体重、百分制记分、完成作业的时间等。六、数据的统计分类•㈠统计分类的含义•统计分类是指按照研究对象的本质特征,根据分析研究的目的、任务以及分析时所用统计方法的可能性,将搜集到的数据进行分组归类。•统计分类是整理数据的第一步。••㈡分类的步骤•⒈删除不准确、不真实的无效数据。•⒉确定分类标志。分类的标准和依据称为分类标志。标志要明确。•分类标志可分为性质标志和数量标志:•性质标志是按事物的不同性质进行分类。例如,按性别、成绩等级、学校类别等分类。•数量标志是按数值大小进行分类。例如,按工龄、年龄、工资水平等分类。•⒊对全体数据进行分类。每次分类不能有遗漏。例1:后进生家庭因素的调查与研究(屠丰庆、葛松定)•学生类别:好生组、学习后进组、行为习惯后进组、学习与行为习惯后进组例2:教育硕士求学动机的调查研究黄文锋徐富明《现代中小学教育》2005.3•分类一:性别—男、女•分类二:学校类别—重点与非重点•分类三:教龄—五年一个阶段七、特征量•㈠集中量(平均指标)•㈡差异量(差异指标)•㈢相对量(相对指标)•㈣相关量(相关系数)㈠集中量•⒈集中量的含义与用途•集中量是反映一组数据的集中程度或典型水平的特征量。•它能反映一组数据的分布中大量数据向某一点集中的情况。⒉常用的集中量•集中量有算术平均数、中位数、众数、加权平均数、几何平均数和调和平均数等。•最常用的是算术平均数和加权平均数。⑴算术平均数•算术平均数是所有观察数据的总和除以数据个数所得的商,简称为平均数或均数、均值。定义公式为:•NXNXXXXN21•优点:反应灵敏﹑严密确定﹑简明易懂﹑计算简单﹑受抽样变动影响较小﹑适合代数运算等。是运用最广的集中量指标。•不足:易受极端数值的影响;当一组数据中某些数据不清楚或不准确时,不能计算其算术平均数。•适用条件:一组数据中每个数据都比较准确﹑可靠;无极端数值的影响。⑵加权平均数•加权平均数是权数不同的数据的平均数。•有时在一组数据中,数据的单位权重不相等,这时如果要计算平均数就不能用算术平均数,而应该使用加权平均数。权数可能是百分比、频数等。•在教育工作中,加权平均数的使用主要有两种类型。•例:某县采取自评和他评相结合的方式对学校进行评价,学校自评和他评的分数在学校最后的得分中各占40%和60%,一所学校自评的分数是85分,他评的分数是80分,这所学校最后的得分是多少?•解:826.04.0806.0854.0WWXWX•例:某年级对三个班进行了英语统一测验,一班共40人,平均分是86分;二班共45人,平均分是90分;三班共42人,平均分是75分。全年级的平均分是多少?•解:8.83424540427545904086NXNXt⑶中位数、百分位数•中位数是位于依一定顺序排列的一组数据中央位置的数值。它将数据分成较大的一半和较小的一半。中位数简称为中数,常用Md表示。•百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。一般用Pp表示。例如,P60、P50等。•中位数是第50百分位数。中位数计算法•排序:将原始数据其按一定顺序(从大到小或从小到大)排列;•确定中位数:如果数据个数N为奇数,则取序列为第(N+1)∕2的那个数据为中位数;如果N为偶数,则取序列为第N∕2与第(N∕2)+1个这两个数据的平均数为中位数。•例1:16、14、13、11、10、7、6、5、3这9个数的中位数是10。•例2:2、4、5、6、8、10、13、14这8个数的中位数Md=(6+8)÷2=7。⑷众数•众数可分为粗略众数和理论众数。粗略众数是指一组数据中出现频数最多的那个数。•理论众数是指与频数分布曲线中的最高点相对应的横坐标上的一点。•通常用Mo表示众数。㈡差异量⒈差异量的含义与用途是表示一组数据变异程度或离散程度的一类特征量。差异量越大,说明数据分布的范围越广,分布越不整齐;差异量越小,说明数据变动范围越小,分布就越集中。⒉常用差异量常用的差异量有全距、方差、标准差、差异系数等。⑴全距•全距是一组数据中的最大值与最小值之差,又称为极差。用R表示。⑵方差和标准差•方差和标准差是通过离差来定义的。•离差:是指一组数据中的各个数据与该组数据算术平均数之差。•方差:是一组数据离差平方的算术平均数,即方差可由离差的平方和除以数据个数所得。•标准差:是方差的算术平方根。方差和标准差的定义公式表示总频数。的差数,称为离差;表示每个数据与平均数表示标准差;表示方差,在式中,NXXNXXNXXXXXX2222•例:某校对5个教师的教学效果进行测评,满分为20分,5个教师的得分为14分、15分、13分、12分和14分,这五个教师得分的方差和标准差各是多少?02.104.104.196.18418656859305,930,68:222XXNXX解方差和标准差的优缺点及应用•优点:反应灵敏、严密确定、计算简单、适合代数运算等。•缺点:意义不易理解、易受两极端数值的影响、有个别数据不清楚时无法计算。•应用:是最常用的差异量数,标准差的应用尤其广泛。标准差往往和算术平均数配对使用,以反映一组数据的差异程度和集中程度。例:兴趣项目优先教学后学生若干体质指标的研究胡加匡《现代中小学教育》2005.5•实验前女生身体生理机能指标测试(平均数±标准差)身高/cm胸围/cm肺活量/ml安静脉搏(次/min)实验班155.9±9.5177.88±2.052118±20776.7±8.81对照班155.3±9.8577.32±2.262123±20676.8±8.85⑶相对差异量•前面的全距、方差和标准差都是带有单位的绝对差异量。•相对差异量(即差异系数):是指一组数据的标准差与算术平均数的百分比。它是没有单位的相对数。用CV表示差异系数,计算公式为:•%100XCVX差异系数的用途•差异系数越大,则该组数据内部的差异程度就越大,反之,差异程度就越小。因此,我们可以通过计算两组数据差异系数的大小来比较它们差异程度的大小。•具体用途:•比较不同单位数据组资料的差异程度。•比较单位相同而平均数相差较大的数据组资料的差异程度。㈢相对量•相对量是两个相互联系的现象数量的比率。•用以反映现象的发展程度、结构、强度、普遍程度或比例关系等。•对于点计数据,通常通过计算比率来反映其特征。•例如,学生的近视率、男女教师比例、完成任务的比例等。㈣相关量⒈相关关系的含义与种类•相关关系:是两个变量之间的不确定关系,它反映的是变量之间不十分严格,但却存在的依存关系。相关关系反映了偶然现象的规律性,它是一种大概如此但非绝对如此的关系,它不能用精确的数学表达式来表达。•例如,教育投资与教育发展速度的关系、教师教学水平和学生的学习效果之间的关系等。•根据两个变量变化的方向,可将相关关系分为正相关、负相关和零相关。•正相关:两个变量的变化方向一致的相关,即一个变量值变大时,另一个变量值也随着变大;一个变量值变小时,另一个变量也随着变小。例如,学生的学习能力与学习成绩的关系。•负相关:两个变量的变化方向相反的相关,即一个变量值变大时,另一个变量则变小;一个变量值变小时,另一个变量值则变大。例如,教师的身体状况与缺勤率的关系。•零相关:两个变量的变化方向无一定的规律的相关,即一个变量值变大时,另一个变量值可能变大,也可能变小,并且变大或变小没有规律。例如,教师的身高与教学能力的关系。⒉相关量的含义与用途•相关量也称为相关系数,是用来描述变量之间变化方向和密切程度的数字特征量,一般用r表示。•它的数值范围在-1到+1之间,它的正负号反映变量之间变化的方向;它的绝对值的大小反映变量之间关系的密切程度。⒊相关分析的含义与方法•研究两个变量之间是否存在相关关
本文标题:教育统计的基本方法
链接地址:https://www.777doc.com/doc-6426124 .html