您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 数学建模-spss统计分析
SPSSSPSS统计软件SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。非专业统计人员的首选统计软件SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。SPSS的功能样本数据的描述和预处理;假设检验(包括参数检验、非参数检验及其他检验);方差分析相关分析回归分析聚类分析判别分析因子分析时间序列分析可靠性分析应用广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。SPSS的窗口类型数据编辑窗口程序编辑窗口输出窗口简式输出窗口1、数据编辑窗口:(1)启动SPSS直接进入(2)文件→新建→数据文件File/New/Data2、程序编辑窗口:文件→新建→语句文件File/New/Syntax3、输出窗口:现实统计方法运行输出的结果,对输出结果可以进行模块裁剪、编辑、存档等第1节描述统计设变量X有一组观测数据x1,,x2,…,xn,常用的描述统计量有:(1)中心趋势:平均值、中位数、众数、和(2)离中趋势:方差、标准差、最大最小值、极差(3)百分位数:四分位数、给定间距的等间距分位数(4)分布度统计量:偏态度、峰态度利用频数分析可以方便地对数据按组进行归纳整理,对变量的数据有一个整体上的认识。(1)建立数据文件:例1.sav(2)选择统计方法:Analyze→DescriptiveStatistics→Frequencies,送入变量,点击确定(3)输出结果:例1:对某大学10名学生测量他们的血压x,得到如下数据:120120120134128102130132126126第2节频数分析其他:描述统计分析Descriptive等,图表SPSS统计图SPSS统计图1单个变量的频数统计图例2:测量30株小麦的株高x得到如下数据(单位:cm):例2.sav(1)频数直方图(加上一条正态曲线,直观比较频数图与正态分布的差异程度。)(2)频数连线图:简单2两个变量的统计图对两个变量(x,y)的样本,作图观察两个变量的关系例3某研究所对200只北京鸭进行实验,得到的周龄(x)与平均日增重(y)的数据,对(x,y)作出散点图,拟合线Smoother条图散点图线图直方图饼图面积图箱式图正态Q-Q图正态P-P图质量控制图Pareto图自回归曲线图高低图交互相关图序列图频谱图误差线图统计图汇总第3节参数检验与置信区间5.00提出原假设:选择统计方法:Analyze→Means→One-simpleTtest,在底部Testvalue框输入检验值100具体判断:根据t分布计算出显著性概率(在许多书中称为P值),SPSS中为sig.对于给定的显著性水平,若sig.,则拒绝原假设,即认为打包机的工作不正常。否则,接受原假设,认为工作正常。例4某糖厂用自动包装机装糖,其装糖量服从正态分布,且每包标准重量为100kg.某天开工后,需对打包机工作进行鉴定,测得9包糖的重量(kg)为:数据例4.sav(1)这天打包机的工作是否正常?()(2)求这天打包机平均装糖重量的置信区间100:100:10HH单一样本T检验结果分析One-SampleStatistics999.9781.2122.4041装糖量NMeanStd.DeviationStd.ErrorMean样本个数9,样本均值99.978,样本标准差1.2122,样本均值标准误差0.4041One-SampleTest-.0558.957-.0222-.954.910装糖量tdfSig.(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=100显著性概率0.9570.05,接受H0;平均差95%的置信区间为(-0.954,0.910),则均值的95%置信区间为(100-0.954,100+0.910)均数间的比较-CompareMeans菜单详解1Means过程求分类变量的综合描述统计量,目的在于比较2One-SamplesTTest过程检验单个变量的均值是否与给定的常数之间存在差异。3Independent-SamplesTTest过程检验两个不相关的样本来自具有相同均值的总体,例如想知道购买某产品的顾客与不购买该产品的顾客的平均收入是否相同。4Paired-SamplesTTest过程检验两个相关的样本是否来自具有相同均值的总体。常用与被观测对象在实验前后是否有差异。5One-WayANOVA过程单因素方差分析,在下节介绍。第4节方差分析方差分析概述一个事物的变化总是某些因素影响的结果。例如,某种农作物的收获量受到种子品种、土质、施肥量以及气候等因素的影响。在众多因素中,有些因素影响大些,有些则小些。在现实生活中常常要找到有显著影响的那些因素,以便更有效地组织生产。方差分析从分析数据的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素.方差分析概述•方差分析正是要分析观测变量的变动主要是由控制因素造成的还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的.相关概念:(1)观测变量:作为观测的对象(如:亩产量、推销量等).(2)控制因素:人为可以控制的因素(如:施肥量、品种、推销策略、价格、包装方式等),在方差分析中称为控制因素.将控制变量的不同情况称为控制变量的不同水平.(3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、抽样误差等),方差分析中主要指抽样误差。核心问题从数据差异角度看:观测变量的数据差异(ST)=控制因素不同水平造成(组间差异SB)+随机因素造成(组内差异SW)当控制因素对实验结果有显著影响时,和随机因素共同作用必然使观测变量产生显著变动;反之,观测变量的变动较小,将归结为随机性造成的(这里指抽样误差造成的).方差分析概述方差分析的类型单因素方差分析:只考虑一个控制因素的影响多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)例5用四种饲料喂猪,共19头猪分为4组,每组用一种饲料。一段时间后沉重,猪体重增加数据(见下表)比较四种饲料对猪体重增加的作用有无不同。观测变量:猪体重增加量;控制因素:饲料该问题是考察饲料这一个控制因素的变化对猪体重增加是否有显著性影响。通常把饲料因素A的四个不同的变化,分别记为A1、A2、A3、A4,成为A的4个不同水平。把观测变量记为X,而第i种饲料在第j次试验下增加的体重记为xij,即因素的第i个水平的第j次观测(试验)值为xij,问因素A的变化对观测变量X的变化是否有显著性影响?…ni………………x3kx33x32x313x2k…x32x22x212x1k…x31x21观测值x11j=1Ak…A3A2水平A11、基本原理设表示在水平下观测值的真实平均值,则在下每次观测结果应该是在真实平均值的左右随机波动,这个随机波动量记为,因此,方差分析的数学模型为,;其中相互独立且,是在每个水平下重复进行试验的次数,为未知。研究因素A的影响是否显著,归结不同水平下的总体是否具有相同的均值,也即要检验统计假设:拒绝则认为不同水平有显著性差异。具体判断:根据F分布计算出显著性概率sig.若sig.显著性水平,则拒绝原假设。iiAiAiijijiijxinj,,2,1ki,,2,1ijrH210:0HiniA0,2ikinjijTixxS112)(kiiiBxxnS12)(kinjiijWixxS112)()/()1/(knSkSFWB~F(k-1,n-k)nxxkinjiji11kiinn1总均值:其中:第i种水平组均值:),,2,11kinxxinjijii(总偏差平方和:组间偏差平方和:自由度为:1kdfb组内偏差平方和:自由度为:kndfw假设检验P值判别法F值临界值F值P值临界值法:FF,拒绝原假设H0P值法:P,拒绝原假设H0P值法更灵活一维方差分析步骤1、编辑数据文件:定义两个数值型变量,一个为因素变量(也成为分组变量)fodder(饲料),要求是数值型变量,有四个不同水平1,2,3,4;一个为观测变量weight(体重),输入数据。保存为:例5.savANOVA增重20538.69836846.233157.467.000652.1601543.47721190.85818BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.2、选择统计方法:Analyze→CompareMeans→One-WayANOVA将weight送入因变量列框,将fodder送入因子(因素)框,点击“确定”3、输出结果:sig.=0.0000.05,认为不同饲料对猪体重增加的作用有显著不同。方差分析其他选项方差齐性检验:分析所研究的问题是否满足方差分析模型。TestofHomogeneityofVariancesweight.024315.995LeveneStatisticdf1df2Sig.Sig.=0.9950.05,认为满足方差分析模型。MultipleComparisonsDependentVariable:weightLSD-18.68000*4.17024.000-27.5687-9.7913-56.36000*4.17024.000-65.2487-47.4713-87.41500*4.42321.000-96.8428-77.987218.68000*4.17024.0009.791327.5687-37.68000*4.17024.000-46.5687-28.7913-68.73500*4.42321.000-78.1628-59.307256.36000*4.17024.00047.471365.248737.68000*4.17024.00028.791346.5687-31.05500*4.42321.000-40.4828-21.627287.41500*4.42321.00077.987296.842868.73500*4.42321.00059.307278.162831.05500*4.42321.00021.627240.4828(J)fodderBCDACDABDABC(I)fodderABCDMeanDifference(I-J)Std.ErrorSig.LowerBoundUpperBound95%ConfidenceIntervalThemeandifferenceissignificantatthe.05level.*.多重比较检验:两两不同水平进行比较,看是否有显著差异。检验假设为无显著差异。选择PostHot…按钮当方差齐性检验显著时,选LSD;当方差齐性检验不显著时,选Tamhane’sT2,用t检验进行配对比
本文标题:数学建模-spss统计分析
链接地址:https://www.777doc.com/doc-6747781 .html