您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > spss在教育研究中的应用
spss在教育研究中的应用主讲人:曹玉广西师范大学教育科学学院2012.12.3主要内容spss17.0数据分析软件的介绍spss17.0在数据分析中的具体应用数据管理与描述统计分析假设检验(均值差异比较)方差分析相关分析SPSS是“社会科学统计软件包”(StatisticalPackagefortheSocialScience)的简称,是一种集成化的计算机数据处理应用软件。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)。伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为StatisticalProductandServicesolutions(统计产品与服务解决方案)。1.1SPSS17.0简介20世纪60年代:美国斯坦福大学三位研究生研制20世纪70年代:SPSS总部成立于芝加哥,推出SPSSX中小型20世纪80年代:SPSS公司(SPSS/PC+微机版1~3)20世纪90年代:SPSS公司(SPSSWINDOWS版5~14)2000年以后:SPSS公司(SPSSWINDOWS版15~18)spss的发展1.2SPSS主要特点操作简便。绝大多数操作是通过菜单、按钮、对话框完成的。无需计算机编程、需记忆大量命令和参数。分析方法丰富、分析结果清晰、直观。可以直接读取其他软件格式的数据文件,如:dbf、xls、sas等。最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告与一般的办公软件直接兼容不方便1.3SPSS17.0运行的环境要求运行SPSS17.0对计算机的要求并不高,但是如果用户希望获得较快的处理速度则需要配置较大的内存。对于较大的数据处理和复杂的统计运算,计算机最好具有较大的内存。1.4SPSS基本运行方式完全窗口菜单方式:所有分析操作过程都是通过菜单和按钮及对话框方式进行的。是经常使用的一种运行方式,适用于一般分析和SPSS的初学者。程序运行方式:手工编写SPSS命令程序一次性提交计算机运行适用于大规模的分析工作和熟练的SPSS程序员.菜单程序混合运行方式:一般适用于熟练的SPSS程序员.1.5SPSS17.0的常用界面与窗口(1)数据编辑窗口功能:对SPSS的数据文件进行录入、修改、管理等基本操作的窗口。标题栏窗口控制按钮菜单栏常用工具按钮数据单元格信息显示栏系统状态栏视图转换栏数据编辑显示区导航窗口结果显示区标题栏窗口控制按钮菜单栏常用工具按钮系统状态栏(2)结果输出窗口功能:SPSS统计分析报表及图形的输出的窗口。(3)对象编辑窗口在结果输出窗口的显示窗口中,直接双击其中的表格或图形均可打开该输出结果对应的对象编辑窗口,如下图所示几种常见的对象编辑窗口在对象编辑窗口中我们可以对表格、图表等进行相应的编辑操作。功能:编写和修改SPSS程序的窗口。(4)语法编辑器窗口(5)脚本编写窗口依次选择菜单“文件”|“新建”|“脚本”命令或“文件”|“打开”|“脚本”命令均可打开脚本编写窗口,如下图所示。1.6SPSS17.0的安装SPSS17.0的启动启动SPSS17.0可以双击桌面上的SPSSStatistics17.0图标,也可以在“开始”菜单中依次选择“程序”|“SPSSStatistics”命令。2利用SPSS进行数据分析的步骤建立SPSS数据文件定义数据文件结构录入修改和编辑待分析数据数据的统计分析统计分析之前的预处理统计分析数据和分析结果的保存结果的说明和解释2.1建立spss数据方式有两种:(1)直接录入(2)从已有文件中读取数据(1)读取已有数据文件①在菜单栏中依次选择“文件”|“打开”|“数据”命令或单击工具栏中的按钮,打开如右图所示的“打开数据”对话框。②选择相应的文件。③双击需要打开的文件或单击“打开”按钮打开文件。(2)直接录入数据①运行spss软件,打开“数据编辑窗口”②“变量视图”—定义变量③“数据视图”——数据录入。举例说明例,将下面的数据按要求录入到SPSS中测站一月气温昂欠-6.9清水河-17.0要求①测站:字符型;宽度6;小数点0;列宽12;左对齐②一月气温:数字型;宽度10;小数点1;列宽8;右对齐名称(Name):变量名,不超过8个字符。类型(Type):变量类型,常用数值型(Numeric)、字符型(String)、日期型(Date)。宽度(Width):变量宽度,默认为8。小数(Decimals):小数位数,默认为2。标签(Label):变量编码,注释变量名的含义定义变量的属性值(Values):变量值编码,注释变量值的含义。缺失(Missing):缺失值。列宽(Columns):列宽,默认为8。对齐(Align):默认右对齐(Right)。测量(Measure):测度,包括三类:数值变量(Scale),名义变量(Nominal),有序变量(Ordinal)。2.2数据的管理与统计描述分析2.2.1数据的管理数据的管理功能有许多,其中有数据的排序,合并组合,数据的插入、转置、筛选等。排序、转置、筛选、分组(1)排序(2)转置(3)筛选将读取的数据按照给定的条件进行筛选,然后标识。操作过程如下所示(一月气温-10℃)(4)数据的分组转换——重新编码为不同变量——“赋值”年龄分组举例这里我们将要处理的数据,目的是要计算一下某地区1980-1990年七月平均气温的分布情况2.2.2描述统计分析用以计算数值变量的统计量,如平均数、标准差、方差等,并可对数值变量标准化频数统计分析可以产生频数分布表、集中趋势与离散趋势等15种以上的统计量,并可给出频数分布图。(1)频率分析结果输出统计量七月平均气温11024.23622.41.60583.922.422.40024.30026.100有效缺失N均值众数标准差全距极小值255075百分位数七月平均气温327.327.327.3218.218.245.519.19.154.519.19.163.619.19.172.7218.218.290.919.19.1100.011100.0100.022.423.124.325.125.326.126.3合计有效频率百分比有效百分比累积百分比七月平均气温26.326.125.325.124.323.122.4七月平均气温26.025.024.023.022.0七月平均气温Frequency3.53.02.52.01.51.0.50.0Std.Dev=1.61Mean=24.2N=11.00(2)描述性分析选择分析菜单下的统计描述命令,如图所示,系统将弹出下面的对话框,如下页所示。在描述对话框中选择要分析项目,然后导入变量栏,如图所示结果输出描述统计量113.922.426.324.236.48421.60582.57911七月平均气温有效的N(列表状态)统计量统计量统计量统计量统计量标准误统计量统计量N全距极小值极大值均值标准差方差参数假设检验的基本问题参数假设检验的方法零假设与备择假设显著性与显著性水平参数假设检验的两类错误总体均值的假设检验单个样本的T检验独立样本的T检验配对样本的T检验非参数检验:检验独立性检验一致性检验22.2.3假设检验参数假设检验:对某个未知参数(通常是指均值或方差)提出一个假设,然后利用样本信息,判断这一假设是否成立,做出接受或拒绝这个假设的决定。通常是假设未知参数(均值或方差)等于某一个值(检验值),或者是假设两个变量的均值或方差相等。与零假设对立的假设被称为备择假设.1H•备择假设:通常是假设未知参数(均值或方差)不等于某一个值(检验值),或者是假设两个变量的均值或方差不相等。0H•零假设:例子教育工作者与公司职员的平均假日支出是否存在显著差异?科技文教人员与公司职员的平均假日支出有显著差异。教育工作者与公司职员的平均假日支出无显著差异;1:H0:H012:H112:H两个值的差距多小时才能认为“无显著差异”?这两个值的差距多大时才能认为“有显著差异”?显著性(p值|Sig.):相伴概率显著性水平(α):即拒绝零假设的标准。α有两个水平,0.05或0.01.SPSS默认的显著性水平为0.05。当Sig.α时,拒绝零假设,即认为“有显著差异”。当Sig.α时,接受零假设,即认为“无显著差异”。比如正态分布曲线,通常5%或1%的概率被习惯认为是“不易发生”。因此,在5%点右边的值被认为是不符合零假设:我们拒绝零假设;在5%点左边的值则认为接受零假设。0.05如果Sig.小于0.0005,在SPSS的输出结果中,就会出现.000,因为SPSS只保留小数点后面三位数字。第Ⅰ类错误,当原假设H0为真时,却作出拒绝H0的判断,通常称之为弃真错误,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为,则有P{拒绝H0|H0为真}=。第Ⅱ类错误,当原假设H0不成立时,却作出接受H0的决定,这类错误称之为取伪错误,这类错误同样是不可避免的。若将犯这类错误的概率记为,则有P{接受H0|H0为假}=。假设检验中的两类错误假设检验的步骤:得出市场营销研究结论建立假设选择适当的检验方法选择显著性水平决定概率决定检验统计量的临界值决定临界值是否位于拒绝假设的区域与显著水平比较拒绝或不拒绝H0收集数据用于推断总体均值与检验值之间是否存在显著差异。(1)单样本T检验例:在职人员接受教育的平均年限是否可以认定为16年?即教育程度是否可以达到本科水平?总体均值:在职人员接受教育的平均年限检验值:16年总体均值的假设检验spss操作分析——比较均值——单样本t检验(2)独立样本的T检验(不同群体同一属性)独立样本的T检验目的是推断两个独立总体的均值是否存在显著差异。例:教育工作者与公司职员的平均假日支出是否存在显著差异?两个独立总体:教育工作者与公司职员均值:平均假日支出spss操作分析——比较均值——独立样本t检验T检验的结果应该以方差齐性成立(Equalvariancesassumed)的结果为准。(3)配对样本的T检验(同一总体不同属性)推断两个总体的均值是否存在显著差异。配对样本可以是同一个变量在“前与后”、“新与旧”等两种状态下的两组抽样数据,也可以是对某一问题两个不同侧面的表述。配对样本与独立样本的差异在于:配对样本的抽样不是相互独立的,而是相互关联的。spss操作分析——比较均值——配对样本t检验Sig.=.000<0.05,表明在“学习方面”和“就业方面”的选择上存在显著差异。(4)卡方检验方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。方差分析的假定条件为:(1)各处理条件下的样本是随机的。(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。(4)各处理条件下的样本方差相同,即具有齐性。2.2.4方差分析方差分析的种类单因素方差分析——一个控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析——各控制变量不同水平下观测变量的均值是否存在显著差异进行比较协方差分析——将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。单因素方差分析举例分析----比较均值------单因素方差分析客观事物之间的关系大致可分为两大类关系:(1)函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。(2)统计关系:两事物之间的一种非一一对应的关系,即当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。2.2.5相关分析(correlations)统计关系分为:(1)线性相关(Linearcorrelation):
本文标题:spss在教育研究中的应用
链接地址:https://www.777doc.com/doc-5363811 .html