您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > SPSS-Statistics-培训-第2天
SPSSStatistics培训(二)SPSSStatistics培训(二)Asia-Analytics(FormerlySPSSChina)LUNCH茶歇时间安排讲师课程指导2午饭SPSSStatistics课程安排3DateSessionSubjectDay1[6H]统计分析简介[1H]1.1统计分析概念1.1.1IntroductiontoStatisticalAnalysis1.2统计分析过程与实例1.2.1统计分析过程1.2.2一个调查研究的实例SPSSStatistics[1H]2.1SPSSStatistics介绍2.1.1IntroductiontoSPSSStatistics2.1.2SPSSStatistics20新特性2.1.3利用SPSS进行数据分析的一般步骤午餐SPSSStatistics数据准备[4H]3.1数据录入与获取3.1.1数据格式,数据录入与引入,数据保存3.2数据管理和变换3.2.1新变量的生成3.2.2变量类型和数据结构的转换3.2.3数据合并、汇总、选择和拆分SPSSStatistics课程安排4Day2[6H]描述统计[2H]4.1数值描述4.1.1定性变量的数值描述4.1.2定量变量的数值描述4.2图形与图表4.2.1图形与图表午餐简单推断[2H]5.1简单推断与方差分析5.1.1简单推断5.1.2方差分析相关分析[1H]6.1相关分析6.1.1相关分析回归分析[1H]6.2一元线性回归分析6.2.1一元线性回归分析SPSSStatistics课程安排5Day3[6H]回归分析[2H]7.1多元线性回归分析7.1.1多元线性回归简介7.1.2SPSS实现7.1.3多重共线性7.1.4模型调整7.1.5回归诊断7.1.6总结7.2Logistic回归分析7.2.1Logistic回归分析的意义7.2.2Logistic回归的种类午餐回归分析[1H]7.2Logistic回归分析7.2.3二项Logistic回归简介7.2.4二项Logistic回归实例数据降维[3H]8.1主成分与因子分析8.1.1主成分分析8.1.2因子分析8.1.3SPSS实现SPSSStatistics课程安排6Day4[6H]细分技术[2H]9.1聚类分析9.1.1聚类分析定义9.1.2系统聚类9.1.3K-means聚类9.1.4两步聚类午餐细分技术[2H]9.2判别分析9.2.1判别分析定义9.2.2常用判别分析方法介绍9.2.3判别效果评估9.2.4SPSS实现9.2.5总结时间序列分析[2H]10.1时间序列分析10.1.1时间序列分析10.1.2时间序列预处理10.1.3时间序列建模SPSS实现10.1.4时间序列模型残差分析10.1.5因果时间序列分析—SPSS实现第五讲:简单推断与方差分析目录5.1基本原理5.1.1统计学-推断性统计5.1.2假设检验5.2均值比较5.3非参数检验-卡方检验5.4方差分析8推断性统计参数估计样本和总体样本参数和总体统计量从样本参数估计总体统计量假设检验假设检验的一般思路2.推断性统计统计学是用以:收集数据、整理分析数据和由数据得出结论的一组概念、原则和方法。描述性统计利用表格、图形或者数值(数值特征)来展示和刻画数据中的信息推断性统计利用样本获得的数据对总体的性质进行估计或者检验。总体的性质通常用概率模型刻画1.统计学分类95.1.1统计学-推断性统计例设X为6次中摸到红球的次数,则如果该说法是真实的,即p=0.5,那么X的概率分布为测到X取值在什么范围时我们不接受“袋子中一半是红球,一半是白球”的说法?2.假设检验的例子从一个例子看假设检验的思路摸球试验:有放回地在一个袋子中连续摸6次,都是红球,你能否接受“袋子中一半是红球一半是白球”的说法?为什么?如果我接受你的说法(假设),那么我看到的现象(样本)出现的可能性是多少?如果这种可能性太小,会是什么情况?1.假设检验的例子105.1.2假设检验X~B(6,p)kP(X=k)00.0156310.0937520.2343830.312540.2343850.0937560.01563H0:一半红球一半白球。(p=0.5);H1:红球白球不是各一半。(p≠0.5)。原假设:备择假设(对立假设):拒绝域(否定域):当检验统计量取某个区域中的值时,拒绝原假设(即使得小概率事件发生的统计量的取值范围),则称该取值区域为拒绝域。临界值:拒绝域的边界称为该假设检验的临界值。4.假设检验的基本思想小概率原理:概率很小的事件在一次试验中实际上不会发生,并且若小概率事件在一次事件中发生了,就被认为是不合理的。基本思想:首先假设原假设是真的成立,然后考虑在原假设成立的条件下,已经观测到的样本信息出现的概率,如果这个概率很小,这就表明一个概率很小的事件在一次试验中发生了,这与小概率原理相违背,表明原来的假设有问题,应予以否定,即拒绝这个假设。“概率很小”:一般在检验之前都事先指定,比如概率为0.05,0.01等,用a表示,称为显著性水平或检验水平。3.假设检验的基本思想115.1.2假设检验.0HWx时,拒绝当样本观测值1.确定恰当的原假设和备择假设2.选择检验统计量3.计算检验统计量观测值的发生概率4.给定显著性水平,并作出统计决策6.假设检验的步骤第一类错误:原假设H0正确,而检验结果把它否定了,叫做弃真错误。第二类错误:原假设H0不正确,而检验结果把它肯定下来了,叫做取伪错误。显著性水平α:犯第一类错误的最大概率5.假设检验的基本概念125.1.2假设检验目录5.1基本原理5.2均值比较5.2.1T检验5.2.2单样本均值检验5.2.3独立样本均值检验5.2.4配对样本均值检验5.3非参数检验-卡方检验5.4方差分析13单样本T检验:某个变量的样本均数与给定总体的已知均数相比,其差异是否有显著非配对或独立T检验:检验由两个独立样本估计的总体均数之间的差异是否显著(如男性群体和女性群体)配对T检验:检验由相关样本估计的总体均数之间的差异是否显著(如给同一组病人施加处理前后,测量值的均数)2.T检验的类型在样本中比较连续变量的平均数,以检验均值之间的差异是否大于能被机遇所解释的差异1.T检验的含义145.2.1T检验均值有差异,概率是多少?提出零假设:总体均值与检验值之间不存在显著差异(样本均值所引起的差异是抽样误差引起的)选择检验统计量假设总体分布服从正态分布,方差已知时,构造Z统计量;方差未知时,构造t统计量计算检验统计量观测值和概率P值给出显著性水平,并作出决策如果该P值太小,成为了我们所定义的小概率事件(小于等于α水准),则我们怀疑所做的假设不成立,从而拒绝H0。反之,我们就不能拒绝H0.2.单样本T检验的过程含义:检验某变量的总体均值与指定的检验值之间是否存在显著差异例如周岁儿童的平均身高是否为75厘米居民平均存(取)款金额是否为2000实例:某工厂用自动打包机打包,每包标准质量为100kg。为了保证生产的正常运行,每天开工后需要先行试机,检查打包机是否有系统偏差,以及时进行调整。某日开工后在试机中共打了9个包,测得9包的质量(kg)为:99.398.7100.5101.298.399.799.5102.1100.5现希望作出判断,明确打包机是否需要进行调整数据要求:小样本时来自的总体服从正态分布,如果大样本或者是数据收集的时候没有特殊性,可以忽略正态分布的假设1.单样本均值检验概述155.2.2单样本均值检验165.2.2单样本均值检验数据:休闲调查.sav对“住房面积”变量进行单个样本的T检验原假设为:城市居民户均住房面积=38平方米操作:分析-比较均值-单样本T检验2.SPSSStatistics选项1.实例3.界面设置设置检验值设置检验变量175.2.2单样本均值检验4.检验结果单个样本统计量:显示分析变量(住房使用面积)的记录数、均值、标准差和均值的标准误单个样本检验:显示单个样本检验的结果,其中Sig0.001,拒绝原假设,即住房使用面积的均值不为38平方米5.结果解释对我国目前保险公司从业人员的受高等教育的程度和年轻化的程度进行推断。两个零假设分别为:保险公司具有高等教育水平的员工比例的平均值不低于0.8年轻化比例的平均值与0.5无显著差异2.问题数据:参数检验(各保险公司人员构成情况(1999年).sav数据描述:26家保险公司人员构成的数据(数据来源:《中国保险统计1999》)1.数据185.2.2单样本均值检验-练习基本思路原假设:两总体均值无显著差异构造检验统计量,从两样本均值差的抽样分布出发,即服从于是两总体均值方差未知时构造t统计量:方差相等时,其中为合并方差,方差不等时,自由度2.检验过程含义:根据两独立样本的数据,对两总体均值是否有显著差异进行推断例:某证券公司调查到到散户股民买进、卖出和投资的有关数据,要检验文化程度高的股民和文化程度低的股民各项指标的均值有无不同数据要求:样本来自的总体服从正态分布两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响,两组样本的个案数可以不相等要求两样本是大样本,小样本则必须来自正态总体1.概述195.2.3独立样本均值检验122212xxtSpnSpn12221122xxtSnSn2Sp221122212112nSnSSpnn22211222222112212()()()11SnSnvSnSnnn21212,XXNuu在一些统计推断的过程,要求进行比较的两组或多组数据的方差相等,即要求方差齐性,如均值比较、方差分析方差齐性检验的方法Hartley检验、Cochran检验、Bartlett检验和Levene检验,前三者对样本数据有正态分布的要求,但是Levene检验则没有这种要求,也是最常用的一种方法4.方差齐性检验计算t统计量和相应的相伴概率P得出结论可以看出,在进行独立样本均值检验之前,需要进行方差齐性检验总的说来,要先进行检验两个样本的方差是否相等,然后在方差齐性(或非齐性)条件下进行下列检验:H0:两样本均值相同H1:两样本均值不同3.检验过程205.2.3独立样本均值检验215.2.3独立样本均值检验例:某证券公司调查到到散户股民买进、卖出和投资的有关数据(见:证券投资额与依据.sav),检验文化程度高的股民和文化程度低的股民各项指标的均值有无不同、各项指标包括:证券投资额,证券市场外收入和入市年份。分析-比较均值-独立T检验2.SPSSStatistics选项1.实例3.界面设置设置检验值设置检验变量225.2.3独立样本均值检验4.检验结果工作人员工作时的状态,是否与其对自己工作的认可程度有关。(分析步骤:1对变量t9-16重新记分保存为t9_1至t16_1——将变量值1、2、3、4分别转成4、3、2、1,可利用Recode过程实现2计算变量t9_1至t16_1的综合得分——Compute过程可实现3对综合得分排序,并指定分组对样本按综合得分排序,可利用Sort过程实现;然后,指定低分组和高分组。这里指定得分前25%的样本,记为1;指定得分后25%的样本,记为24分析低分组和高分组在回答第一题和第八题,即在变量t1-t8上是否存在显著差异)2.问题数据:工作压力调查.sav描述:某机构工作人员对自己工作看法的调查数据1.数据235.2.3独立样本均值检验-练习工作状态工作认可程度245.2.4配对样本均值检验配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据配对样本检验:即是根据配对样本对两总体均值是否有显著性差异进行推断例如:某种减肥茶是否有效数据要求:两样本数据必须两两配对,即:样本个数相同,个案顺序相同,如减肥茶效果、不同
本文标题:SPSS-Statistics-培训-第2天
链接地址:https://www.777doc.com/doc-4772800 .html