您好,欢迎访问三七文档
描述性统计分析一、实验目的1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。2.学习描述性统计分析及其在SPSS中的实现,内容具体包括基本描述性统计量的定义及实验课程SPSS统计分析上课时间2014学年1学期17周(2014年12月29—31日)学生姓名XXX学号XXX班级XXXX所在学院XXXX上课地点XXX指导教师XXX计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。3.复习权重等前章的知识。二﹑实验内容题目一打开数据文件“data4-5.sav”,完成以下统计分析:(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;(2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩的分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。1.解决问题的原理因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。2.实验步骤针对第一问第1步打开数据菜单选择:“文件→打开→数据”,将“data4-8.sav”导入。第2步文件拆分菜单选择:“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。第3步描述分析设置:(1)选择菜单:“分析→描述统计→描述”,打开“描述性”对话框,将“成绩””加入到“变量”列表框中。打开“选项”对话框,选中如下图中的各项。点击“继续”按钮。(4)回到“描述性”对话框,点击确定。针对第二问第1步频率分析设置:(1)选择菜单:“分析→描述统计→频率”,(2)打开“频率(F)”对话框,点击“合计”。再点击“继续”按钮.(3)打开“图表”对话框,选中“条形”复选框,点击“继续”按钮。(4)回到“频率(F)”对话框,点击确定。(5)重复步骤(1)(2)把步骤(3)改成打开“图表”对话框,选中“饼图”复选框,点击“继续”按钮。再回到“频率(F)”对话框,点击确定。三、实验结果及分析描述统计量科目N全距极小值极大值均值标准差方差语文成绩1579199867.8721.738472.552有效的N(列表状态)15数学成绩1571249555.8724.348592.838有效的N(列表状态)15英语成绩1576159157.8022.697515.171有效的N(列表状态)15统计量成绩语文N有效15缺失0均值67.87中值73.00众数60a标准差21.738方差472.552极小值19极大值98百分位数2560.005073.007583.00数学N有效15缺失0均值55.87中值49.00众数37标准差24.348方差592.838极小值24极大值95百分位数2536.005049.007581.00英语N有效15缺失0均值57.80中值56.00众数56标准差22.697方差515.171极小值15极大值91百分位数2534.005056.007578.00a.存在多个众数。显示最小值成绩段科目频率百分比有效百分比累积百分比语文有效优320.020.020.0良16.76.726.7中426.726.753.3及格426.726.780.0不及格320.020.0100.0合计15100.0100.0数学有效优16.76.76.7良320.020.026.7中213.313.340.0不及格960.060.0100.0合计15100.0100.0英语有效优213.313.313.3良16.76.720.0中213.313.333.3及格213.313.346.7不及格853.353.3100.0合计15100.0100.0语文成绩的平均成绩为67.87,中位数是73、众数60、标准差21.738、方差472.552、极差98-19=79、最大值98和最小值19;各分数段人数:语文90~100为3,80~89为1,70~79为4,60~69为4,60分以下为3,数学90~100为1,80~89为3,70~79为2,60~69为0,60分以下为9,英语90~100为2,80~89为1,70~79为2,60~69为2,60分以下为9,生成条形图和饼图如截图所示题目二1.打开数据文件“data4-6.sav”,完成以下统计分析:(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;(2)考察身高、体重和胸围的正态性。针对第一问1.解决问题的原理探索性分析第1步打开数据菜单选择:“文件→打开→数据”,将“data4-9.sav”导入。第2步探索分析设置:(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“身高”字段移入“因变量列表”。(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索:选项”,选中“按列表排除个案”选项针对第二问与第一问的方法相似也可用探索性分析第1步探索分析设置:(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“体重”字段移入“因变量列表”。(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索:选项”,选中“按列表排除个案”选项第2步探索分析设置:(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“胸围”字段移入“因变量列表”。(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索:选项”,选中“按列表排除个案”选项3.结果及分析从上的茎叶图可以更加详细地分析身高数据。从上的箱图可以分析变量“身高”的四分位数。从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。题目三表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。(用交叉列联表分析,参见数据文件:data4-10.sav。)1.解决问题的原理:运用交叉表分析2.实验内容第1步打开数据菜单选择:“文件→打开→数据”,将“data4-10.sav”导入。第2步加权设置:菜单选择:“数据→加权个案”,打开“加权个案”对话框,如图设置。第3步交叉表分析设置:(1)选择菜单:“分析→描述统计→交叉表”,打开“交叉表”对话框,将“是否吸烟”及“是否换气管炎”字段分别加入“行(s)”及“列(c)”列表框中。(2)打开“统计量”对话框,选中“卡方”选项。(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。3实验结果及分析是否吸烟*是否患气管炎CrosstabulationCount是否患气管炎Total患病健康是否吸烟是43162205否13121134Total56283339Chi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PearsonChi-Square7.469a1.006ContinuityCorrectionb6.6741.010LikelihoodRatio7.9251.005Fisher'sExactTest.007.004Linear-by-LinearAssociation7.4471.006NofValidCases339a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis22.14.b.Computedonlyfora2x2table综上所示,各种检验方法显著水平都远小于0.05,所以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价结果是相关的。三、实验心得与体会通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到了重要作用。参数估计与假设检验一、实验目的4.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。2.通过样本提供的信息来对总体信息进行估计和推断,如参数估计和假设检验等,从样本的观察或试验结果的特征对总体的特征进行估计和推断。二、实验内容题目一表5.20是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70分之间是否有显著性差异。(参见数据文件:data5-16.sav。)1.解决问题的原理:单样本T检验2.实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data4-16.sav”导入。第2步单样本T检验分析设置(1)选择菜单“分析→比较均值→单样本T检验(S)”,打开“单样本T检验”对话框,将变量“成绩”移入“检验变量”列表框,并输入检验值70。表5.20某班学生数学成绩序号成绩序号成绩序号成绩163109419702991198206538112732184477138922845681498239567915772461780166725698631769267398718812760(2)“单样本T检验:选项”对话框,设置置信区间为95%(缺省为95%),故此处可不设置,及默认。3.实验结果及分析One-SampleStatisticsNMeanStd.DeviationStd.ErrorMean成绩2777.9312.1112.331One-SampleTestTestValue=70tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper成绩3.40026.0027.9263.1312.72可得到,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。题目二在某次测试中,随机抽取男女学生的成绩各10名,数据如下:男:99795989798999828085女:88545623756573508065假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。(参见数据文件:data5-17.sav。)1.解决问题的原理:独立样本T检验2.实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data5-17.sav”导入。第2步独立样本T检验设置:(1)选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“成绩”作为要进行T检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“1”和“2”。(2)打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同,即默认形式,不更改。GroupStatistics性别NMeanStd.DeviationStd.ErrorMean成绩男1084.000011.527743.64539女1062.900018.453855.83562上表中是独立样本T检验的均值检验结果。显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。题目三某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21所示。假设体重近似服从正态分布,试分析服药前后,
本文标题:SPSS实验报告
链接地址:https://www.777doc.com/doc-2860166 .html