您好,欢迎访问三七文档
当前位置:首页 > 法律文献 > 理论/案例 > apss培训第一、二、三、四、五章
统计知识及SPSS应用软件讲解第一章概述2020年1月20日2020/1/2032020/1/204Spss安装向导安装方法为“傻瓜式”安装主要通过点击“NEXT”按钮,就可以完成安装。通过双击SPSS11.5Eval.exe开始安装。2020/1/205启动安装2020/1/2062020/1/207设定安装路径2020/1/208用户信息2020/1/209继续点击“NEXT”按钮,就可以完成安装。该版本为SPSS公司的试用版,试用期30天。SPSS12EVAL.exe为SPSS公司spss12的试用版.也可以试用30天。2020/1/2010统计软件简介统计分析软件是数据分析的主要工具完整的数据分析过程为:数据的收集数据的整理数据的分析统计学为数据的分析提供了科学的方法论。统计软件为数据分析提供了实现手段。2020/1/2011常用权威统计软件简介SAS8.2真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。人机对话界面太不友好图形操作界面比较糟糕一切围绕编程设计学习起来较困难(编程)说明书非常难懂价格贵的人直跳2020/1/2012常用统计软件简介SPSS(Ver11.5)--统计软件中的贵族操作界面极为友好–所有统计软件中具有最友好的操作–精心设计的图形操作界面–美观的结果输出–强大的辅助教学功能输出结果与中文WORD尚存在一定兼容问题在国内深受欢迎,特别是市场调研行业在欧洲各研究机构中得到广泛应用2020/1/2013学习使用统计分析软件的基本方法弄清分析的目的正确收集待处理和分析的数据(目的、影响因素的剔除)弄清统计概念和统计含义,知道统计方法的适用范围,无需记忆公式。选择一种或几种统计分析方法探索性地分析数据。读懂计算机分析的数据结果,发现规律,得出分析2020/1/2014SPSS介绍SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。2020/1/2015SPSS11.5版的数据编辑窗口界面2020/1/2016菜单2020/1/20172020/1/20182020/1/20192020/1/20202020/1/20212020/1/20222020/1/20232020/1/20242020/1/20252020/1/2026SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,他使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件2020/1/2027比照格式输入数据,选取过程2020/1/2028点击箭头将VAR00001设置为分析变量2020/1/2029点击OK按钮得到描述统计结果2020/1/2030结果2020/1/2031基本界面介绍数据编辑窗口(数据编辑窗口dataeditor)功能:对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口组成:窗口主菜单(Data、Transform、Analyze、Graphs)、工具栏、数据编辑区、状态显示区SPSS运行过程中自动打开;且只能打开一个窗口;运行过程中无法关闭SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上2020/1/2032界面介绍2020/1/2033输出窗口(viewerviewer)输出窗口(viewerviewer)功能:SPSS统计分析报表及图形的输出窗口组成:窗口主菜单、工具栏、结果显示区、状态显示区在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭;状态栏上的!表示当前输出窗口窗口内容以.spo存于磁盘上2020/1/2034数据编辑窗口2020/1/2035统计学基本概念总体:所研究对象的全体为总体样本(sample):就是从总体中随机抽取部分观察单位,其实测值的集合。个体:组成总体的元素称为个体。指标或变量:表征个体特征(信息)的量,称为指标或变量。指标值(变量值)或数据(Data):指标或变量的具体值称为指标值(变量值)或数据。2020/1/2036参数与统计量(1)参数(parameter)总体指标在一定条件下为常数。(2)统计量从总体中随机抽取的样本所算得的指标值。2020/1/2037概率(probability):是描述随机事件发生的可能性大小的数值,用P表示。在一定条件下,肯定发生的事件称为必然事件,肯定不发生的事件称为不可能事件,可能发生也可能不发生的事件称为随机事件或偶然事件,必然事件的概率为1,不可能事件的概率为0,随机事件的概率介于0和1之间。P≤0.05或P≤0.01称为“小概率事件”,表明在一次观察或实验中该事件发生的可能性很小,可以看作很可能不发生。2020/1/2038数据类型定类(分类或计数资料)(Nominal)性别,职业次序资料或等级资料(Ordinal)治疗效果、化验结果定距数据细胞个数定比资料米,小时定距数据、定比资料一般我们通称计量资料。2020/1/20获得帮助Help利用SPSS的帮助窗口可以方便地获得SPSS软件中各种功能的使用方法,包括窗口的操作、图标操作、键盘和鼠标操作、语句的语法解释等各类操作。Help菜单或相应的Help按钮第二章数据文件的处理2020年1月20日2020/1/2041利用SPSS做数据分析的一般步骤建立建立SPSSSPSS数据文件数据文件•定义数据文件结构•录入修改和编辑待分析的数据分析数据分析数据•统计分析之前的数据预处理•统计分析和建模结果的说明和解释结果的说明和解释数据和分析结果的保存2020/1/2042SPSS数据文件的特点2020/1/2043定义变量的内容1、变量名(Variablename)变量名是变量存取的唯一标志。汉字4个,英文8个字符。2、变量类型(type):数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56字符型(String):存储字符数据8位。如:beijing处理时用双引号扩起来日期型(Date):存储日期数据,如:20-AUG-19991582年10月14日零点开始2020/1/20443.Width:变量宽度,默认为8。4.Decimals:小数位数,默认为2。5.Label:变量编码,注释变量名的含义。6.Values:变量值编码,注释变量值的含义。7.Missing:缺失值。8.Columns:列宽,默认为8。9.Align:对齐,默认右对齐(Right)。10.Measure:测度,包括三类:数值变量(Scale),名义变量(Nominal),有序变量(Ordinal)。2020/1/20452020/1/2046Name栏、type栏、Label栏、Values最常用!练习:建立变量keshi类型:数值型,Label为科室,Values为1内科;2外科;3妇产科;4;儿科2020/1/2047数据录入2020/1/2048数据录入技巧连续多个相同值的录入(COPY拖放粘贴)将EXCEL的数据直接复制进SPSS(文本除外)将WORD的数据表格直接引入SPSS(选中表格复制切换到SPSS粘贴)2020/1/20492.3.1数据的搜索将指针移动到指定观察值号(记录快速定位)相当于查找第?人的资料DataGotoCase点击搜索指定变量中的数据相当于查找某一属性等于某个值的人。EditFindMatchcase是指定是否区分大小写示例:EX.sav2020/1/2050冻结数据列可以通过在第一列变量名上点击右键,选择PinSelectedColumn,就可以将该列冻结在左侧。2020/1/20512.3.2观察值的增加和删除增加一个观察值左键选中序号单元格--右键显菜单--选“InsertCases”删除一个观察值左键选中序号单元格--右键显菜单--选“Cut”或“Clear”示例:EX.sav2020/1/20522.3.3数据的排序记录排序(SortCases)(加速、查错)2020/1/2053按照“height(身高)”的大小排序2020/1/20542.3.5选择观察了量的子集筛选记录(SelectCases)2020/1/2055筛选规则2020/1/2056筛选条件:有高血压家族史(genic0)2020/1/20572020/1/2058筛选结果2020/1/20592020/1/2060筛选示例EG2-1中学家长问卷.savD变量(家庭人口数)等于4的。D变量(家庭人口数)小于4的。D变量(家庭人口数)小于4并且g变量(家庭年收入)大于10000的。--and的用法2020/1/20612.3.9数据的剪切、复制和粘贴选择对象范围剪切、复制和粘贴2020/1/20622.4.1增加或删除一个变量点击列名,选中列右键点击出菜单选“Insertvariables”或“clear”2020/1/20632.6.1数据文件的存储删除ex.sav文件中id为5-7的case,将文件另存为ex_1.sav2020/1/2064删除ex.sav文件中id为1-4的case,将文件另存为ex_2.sav2020/1/2065删除ex.sav文件中变量sbp1-dbp2,删除id=6的记录,将文件另存为ex3.sav2020/1/2066只保留ex.sav文件中变量id、sbp1-dbp2,删除id=7的记录,将文件另存为ex4.sav2020/1/2067变量级别管理(菜单Transform)1、产生新变量:compute计算2020/1/2068产生一个新变量:bmi=体重/(身高**2)2020/1/2069结果2020/1/2070常用运算+-×/~=不等于&AND和|OR或**乘方~not2020/1/2071常用函数ABS(数值表达式):绝对值LG10(数值表达式):求10为底的对数sqrt(数值表达式):平方根RND(数值表达式):返回四舍五入的整数trunc(数值表达式):直接返回整数部分,不四舍五入MOD(数值表达式,除数):返回余数2020/1/2072常用字符函数SUBSTR(字符串,位置):返回字符串中从某位置开始到结尾的字符串SUBSTR(字符串,位置,长度):返回字符串中从某位置开始,某个长度的字符串应用:ICD编码的筛选取前3位?取前2位?2020/1/2073日期函数DATE.MDY(month,day,year)返回与月、日、年相对应的日期或DATE.DMY(day,month,year)2020/1/2074例子trunc((当前日期-过去日期)/60/60/24/365)统计年满岁数RND((当前日期-过去日期)/60/60/24/365)返回四舍五入年龄2004040404042004Date.dmy(d,m,y)2020/1/20752.对变量重新赋值:recode→Intodifferentvariables2020/1/20762020/1/2077根据bmi对7个记录进行分组,bmi:正常:18.0-23.9;超重:24.0-27.9;肥胖:28.02020/
本文标题:apss培训第一、二、三、四、五章
链接地址:https://www.777doc.com/doc-3205025 .html