您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > SPSS统计分析基础入门(含多重线性回归分析)
SPSS统计分析基础入门LOGOSPSS数据无处不在-----将数据转化为信息现象、问题在演绎------通过调查,求真数据准备+统计学+统计工具=信息Solution:为什么学SPSSStatistics?SPSSSAS难易LOGOSPSSSPSSStatistics是什么?StatisticalPackagefortheSocialSciences“社会科学统计软件包”:原名StatisticalProductandServiceSolutions“统计产品与服务解决方案”:2000年更改世界上最早的统计分析软件:1968年,由美国斯坦福大学的3位研究生于研制,广泛应用于自然科学、技术科学、社会科学的各个领域世界上应用最广泛的专业统计软件:目前世界上流行的三大统计分析软件之一(SAS、SPSS及SYSTAT)。全球约有28万家产品用户,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞影响和信誉极高:在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法目前最新版本:IBMSPSSStatistics20.0多国语言版SPSSSPSSStatistics的基本特点易用性强:“易学易用易普及”•操作界面极为友好,操作简单,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成•良好的帮助系统和自学功能•适用于非专业统计分析人员•也为高级用户提供编程功能兼容性好•数据输入:Excel、Lotus、Oracle、SQLServer、Access、dBASE、文本,以及各类统计软件的数据形式SAS,Stata文件•数据输出:Word、HTML、XML、Excel、PowerPoint、PDF功能强大•全面、成熟的统计过程:非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。•全面的统计技术:自带11种类型136个函数,提供了如数据汇总、计数、交叉分析、分类、描述性统计分析、因子分析、回归及聚类分析等广泛的基本统计分析功能。•全新的演示图形系统,能够产生更加专业的图片:高分辨率、色彩丰富的饼图、条形图、直方图、散点图、三维图形以及更多图表都是SPSSStatistics中的标准功能。LOGOSPSS怎么学习SPSSStatistics?•理论是研究的基石:SPSS只是一个统计工具,需掌握统计学理论基础•模仿是最好的学习•选一种适合自己的学习途径:网络资源+教程+上课+培训班自习参考书1.SPSS统计分析基础、应用与实战精粹.王璐、王沁.化学工业出版社.2012-3(非常适合初学者)2.SPSS统计分析基础教程(第2版).张文彤,邝春伟.高等教育出版社;第2版(2011年11月1日,20.0)3.问卷统计分析实务--SPSS操作与应用.吴明隆.重庆大学出版社.2010-5-1.(读秀有全文,14.0)4.SPSS统计分析与数据挖掘.谢龙汉,尚涛.电子工业出版社.2012-1-1.(19.0,有光盘)5.统计分析与SPSS的应用(第三版).薛薇.中国人民大学出版社.2011-1-1(教材,入门)6.SPSS在生物统计中的应用(第二版).张力。厦门大学出版社。2008.8内容情况:•一般SPSS教程12-25章,200-600页•SPSS软件自带教程:大于1000页•人大经济论坛:SPSS初中级视频课程—张文彤主讲;15讲12hSPSS高级视频课程—张文彤主讲;17讲15h•SPSS官方初中级培训班:3天LOGOSPSS图书馆电子参考资料图书馆主页数据导航中文资源非书资料管理系统安装虚拟光驱下载图书馆主页书目查询光盘下载LOGOSPSS•进行统计分析前不对数据进行整理和归纳。得到数据文件后,直接进行统计分析或绘制图表,根本没有对数据属性进行定义,也没有对数据文件进行科学必要的预处理。•乱用各类统计方法。没有从实际问题的要求出发,不注意方法的使用条件,认为只要能输出结果即可。例如,定性数据采用连续性数据的统计方法,没有对数据标准化等。•对分析结果输出的图表不知道其统计意义,更不知输出量的实际意义,因此无法对数据处理结果进行深层次的分析研究。SPSS软件使用时常犯的错误LOGOSPSS基础知识介绍1.SPSS界面与菜单介绍2.数据准备3.描述性统计分析4.简单统计推断5.相关分析6.回归分析7.图形的实现SPSSStatistics图书馆购买:IBMSPSSStatistics20.0(简称SPSS20.0)下载路径:图书馆主页-帮助与指南-常用软件LOGOSPSS1.SPSS界面与菜单介绍4个主要窗口:数据编辑窗口、结果输出窗口、语法编辑窗口、脚本编辑窗口变量视图:定义数据的格式(变量名、类型、宽度等),每一行代表对一个变量的定义,每一列则代表定义该变量时用到的某种属性数据编辑窗口:•建立新数据、编辑和显示已有数据文件;•两个视图区LOGOSPSS结果查看窗口:随执行统计分析命令打开,显示分析结果、统计报告、图表等如果在运行时产生错误,也会输出提示信息允许对输出结果进行常规编辑整理,窗口内容可以直接保存,“*.spv”LOGOSPSS菜单介绍数据准备二要利用SPSS进行数据统计分析,首要的工作就是建立SPSS数据文件;实际中收集、调查得到的数据资料往往是零乱的,不能直接进行统计分析;主要由菜单栏中的【数据】和【转换】命令来实现规范化操作中不可忽略的一步。LOGOSPSS2.1数据文件的建立四种创建数据文件的方法:●新建数据文件●直接打开已有数据文件:*.sav、*.sys,*.xls,*.sas7bdat,*.txt等●使用数据库查询:与大型数据库进行数据交换,如SQL、Oracle,也适用于Excel●从文本向导导入数据文件LOGOSPSS实例2-1:Excel数据的导入1.整理excel文档,第一行设置为变量,与spss格式相同2.打开SPSS软件,菜单栏中选择【文件】→【打开】→【数据】命令,弹出【打开数据】对话框3.选择2-1.xls文件4.点选【从第一行数据读取变量名】5.【确定】•文件2-1.xls是上证指数从2007年1月4日至2008年10月16日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至SPSS中。LOGOSPSSLOGOSPSS2.2SPSS数据文件的属性SPSS数据文件是一种有结构的数据文件,包括文件结构和数据,在软件中创建好数据后,首先应该进行数据文件的属性定义或者结构定义。变量属性:变量名、变量类型、变量名标签、变量值、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式)例:新建数据录入“变量视图”定义变量;“数据视图”在定义好的变量列填入相应数据LOGOSPSS实例2-2:左边是对人们信息获取情况的一个调研表,请定义问卷调查表的变量信息。打开新数据表:文件-新建-数据变量视图变量名数据类型描述性的变量标签描述性的值标签用户定义的缺失值LOGOSPSS◆缺失值:如果直接进行数据分析,SPSS将把缺失数据作为正常数据,造成非常大的误差数据中存在漏填数据数据中存在明显错误或明显不合理的数据(如年龄130)◆缺失数据处理步骤:1、指定缺失数据,指明哪些数据属于缺失数据(空缺数据,首先填一个特定标记数据)2、统计分析时对缺失数据进行一定处理(选择缺失数据处理方法)LOGOSPSS数据视图变量名称个案或观查值SPSS数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。SPSS数据文件中的一行数据称为一条个案或观测量。LOGOSPSS2.3数据管理和转换通常情况下,刚刚建立的数据文件并不能立即进行统计分析,这是因为收集到的数据还是原始数据,还不能直接利用分析,需要对原始数据进行进一步的加工、整理。数据变换是正式分析前的重要一步,通过数据变换,一个优秀的统计分析员可以将原始记录整理成所需的任何格式,从而为后面的精确分析打下坚实的基础。——张文彤变量级别的数据管理主要集中了一些对变量进行变换的过程,如对原始数据进行排序、转置、四则运算、对数据重新编码、求出变量的秩次等,这些功能往往在统计分析的预处理中起着非常重要的作用。文件级别的数据管理对数据进行加工整理,比如根据统计分析的要求对数据文件进行分组、合并、加权、筛选等操作观察值的名次:如3、5、-2、0、7数列各观测量的秩为:3、4、1、2、5LOGOSPSS案例2-3:文件合并问题:已知2-3-1.sav和2-3-2.sav中的数据是北京、天津、河北等省市在2005年部分行业的固定投资额(亿元)数据,请将2-3-1.sav和2-3-2.sav的数据文件纵向合并。LOGOSPSS例:我国城市和农村居民消费价格分类指数数据见右表。由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过1%(指数=101)的项目数。案例2-4:变量值计数(消费价格指数的上涨项目)变量值计数:计算一些变量在同一个观测量中满足要求的特定变量值出现的次数。Step1:转换对个案内的值计数;Step2:输入目标计数变量(x,增加率)Step3:选择计数变量Step4:设置计数规则;Step5:完成操作结果输出描述性统计分析三统计分析的目的:研究总体的数量特征。研究者一般通过样本来研究总体。首先了解数据的整体情况,随后才能考虑做深入的推断两种方式实现:第一,数值计算,计算常用的基本统计量的值,准确反映数据的基本统计特征;第二,图形绘制,即绘制常见的基本统计图形,直观展现数据的分布特点。LOGOSPSS描述性统计分析是统计分析的第一步和先决条件在进行统计分析和建模前,常需对数据做一些描述性统计,了解数据的基本统计指标定量数据:均数、标准差、标准误等计数或分类数据:频率、比率等SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中:【分析】-【描述统计】1.基本统计量•频率(F):该过程产生频数表;•描述(D):进行一般性统计描述;•探索(E):用于对数据概况不清时的探索性分析3描述性统计分析3.1频数分析使用目的:了解变量取值的状况,对把握数据分布特征非常有用,是描述性统计中最常用的方法之一。例如,了解某班学生考试的学习成绩、了解某地区居民的收入水平等都可以借助于频数分析。作用:(1)编制频数表,按要求给出某百分位点的数值►频率:各类别的记录数►有效百分比:即各记录数占有效样本数的百分比,有效样本数=总样本-缺失样本数►累计百分比:即各百分比逐级累加起来的结果。最终取值为100(2)绘制常用的条图、饼图等统计图(3)还可以进行分位数、描述集中趋势的基本统计量等计算功能案例3-1:利用频数分析产品销售信息假设某公司每周大约卖出2000万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。利用频数分析你能得到什么有助于生产及销售的的信息?近期公司该产品每周的销售数据(单位:百万):2418182624231618212021241919142221262715191720201922231623211519212022152419Step1:打开“3-1”(sav、xls)-【分析】-【描述统计】-【频率】Step2:设置“统计量”、“图表”内容Step3:结果输出描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把握数据的集中趋势、离散程度和分布形状。3.2描述分析基本描述统计量:(1)表示数据的中心位置(集中趋势):均值、中位数、众数等(2)表示数据的离散程度(离散趋势):全距、方差、标准差、极差、变异系数等(3)刻画分布形态的描述统计量(与正态分布比较):数据分布是否对称,偏度、峰度等众数:就是数据中出现次数或出现频
本文标题:SPSS统计分析基础入门(含多重线性回归分析)
链接地址:https://www.777doc.com/doc-1998174 .html