您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 上机操作第二讲20100416
研究生《生物统计学》课程上机内容第二讲:SPSS软件介绍、频数分析与绘图、t检验(1)(如何下载服务器上的《生物统计学》课程文件:打开IE,在地址栏输入:,打开页面后点击file-登录,用户名:hydrobio,密码为空,登陆,下载文件)一、学习使用SPSS软件:1、SPSS数据编辑窗:(1)变量视图工作表(VariableView):命名、类型、宽度、小数点位数、变量名的标记等(2)数据视图工作表(DataView):数据输入、修改、查看变量内容2、数据编辑窗主菜单:FileEditViewDataTransformAnalyzeect.3、数据文件的建立(1)定义变量:Name(变量名)Type(类型)Width(宽度)Decimals(小数位数)Label(变量标签)Values(变量值标签)Missing(定义变量缺失值)Columns(列宽)Align(对齐方式)Measure(测量标尺)(2)数据输入:连续输入多个相同值:CopyPaste将Excel文件调入SPSS:复制/粘贴功能调入;直接调入(调入excel文件)将word中的数据表格调入SPSS:全部是数值的表格,选中整个表格后拷贝,粘贴入SPSS中,再定义相应变量名(3)数据文件的保存:默认保存的文件类型为.sav也可保存为.xls和.dbf的文件格式二、练习内容1、数据资料的整理(1)输入下列数据:工人编号NO加工零件数X工人编号NO加工零件数X工人编号NO加工零件数X110611992185284129422106311013119231014911488241055109151182596691169726105711117103271078107181062812891211995291111010520106301011)频数分析:[Analyze]=[DescriptiveStatistics]=[Frequencies...]:欲对X进行频数分析,在对话框左侧的变量列表中选X,单击按钮使之进入[Variable(s)]列表框[Format...]按钮弹出[Frequencies:Format]子对话框,在[Orderby]栏中有四个选项:[Ascendingvalues]为根据数值大小按升序从小到大作频数分布;[Descendingvalues]为根据数值大小按降序从大到小作频数分布;[Ascendingcounts]为根据频数多少按升序从少到多作频数分布;[Descendingcounts]为根据频数多少按降序从多到少作频数分布。[Statistics...]按钮,弹出[Frequencies:Statistics]子对话框,并单击相应项目,在作频数表分析的基础上,附带作各种统计指标的描述[Charts...]钮,弹出[Frequencies:Charts]子对话框,用户可选三种图形:直条图(Barchart)、饼图(PieCharts)和直方图(Histogram)注:SPSS在未特别指定的情形下,直方图或频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在一定数目的要求不符。在调用[Frequencies]统计过程命令之前,可先对原始数据进行预处理:起点为80,组距为10。分组的方法有两种:(1)第一种分组方法:[Transform]=[Recode]=[IntoDifferentVariable...],在弹出的[RecodeIntoDifferentVariable]对话框中选定X,单击按钮使之进入[NumericVariable-列表框,在[OutputVariable]栏的[Name]文本框中输入x1,单击[Change]按钮表示新生成的变量名为x1;单击[OldandNewValues]按钮弹出[RecodeIntoDifferentVariable:OldandNewValues]子对话框,在[OldValue]选项中单击[Range]项,输入第一个分组的数值范围:80~89,在[Newvalue]栏内输入新值:80,单击[Add]按钮,依此将各组的范围及对应的新值逐一输入,最后单击[Continue]按钮返回,再单击[OK]按钮即完成。系统在原数据库中生成一新变量为x1,这时再调用[Frequencies]统计过程将输出等距分组且组数为5的频数分布表;为标识各数值(80、90、100、110、120)所代表的含义,在数据文件的VariableView中对x1进行变量值打标签,在x1的[Value]中点击右侧的按钮,弹出[ValueLabels],在Value中输入80,在ValueLabel:中输入80~89,[Add];如此依次定义90、100、110、120的标签分别为90~99、100~109、110~119、120~129,标签完后重新绘图,比较图形标识发生的变化。(2)第二种分组方法:[Transform]=[Compute]=[ComputeVariable],在“TargetVariable”(目标变量)中输入“组段”,以标识观察值所属的组段,在“NumericExpression”(数式表达)中输入“1”作为第一组的代码。点击对话框左下角的,弹出对话框“ComputeVariable:IfCases”,点击“Includeifcasesatisfiescondition”后,在其下方的对话框中输入“x=80&x90”,Continue返回,OK返回,即可见数据工作表中出现新变量“组段”,其中X在区间[80,90)中的数值在“组段”中出现的数值为1;再次[Transform]=[Compute]=[ComputeVariable],按上述步骤对X在区间[90,100)中的数值满足“x=90&x100”式,用代码“2”表示,确定返回到数据工作表,提示,点击“确定”,在数据工作表中“组段”列中出现数字“2”;依次如此操作,分别定义代码3、4、5代表组段[100,110)[110,120)[120,130);为标识各组段代码(1、2、3、4、5)所代表的含义,在数据文件的VariableView中对“组段”进行变量值打标签,在“组段”的[Value]中点击右侧的按钮,弹出[ValueLabels],在Value中输入1,在ValueLabel:中输入80~89,[Add];如此依次定义2、3、4、5的标签分别为90~99、100~109、110~119、120~129,标签完后重新绘图。2、统计数据的描述(1)[Analyze]=[DescriptiveStatistics]=[Descriptives...],打开[Descriptives]主对话框。选定变量X使之进入[Variables(s)]列表框。(2)单击[Options...]按钮,打开[Descriptives:Options]子对话框。选择均值(Mean)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),选好后单击[Continue]按钮返回[Descriptives]主对话框,再单击[OK]按钮即可得到各种统计量的计算结果。3、常用统计图(1)条形图(简单条形图、分组条形图)、饼图/圆形图例:几种动物性食品的营养成分百分比%蛋白质脂肪糖类无机盐水分其他牛奶3.34.05.00.787.0牛肉19.29.21.062.18.5鸡蛋11.99.31.20.965.511.2咸带鱼15.53.71.810.029.040.01)数据输入:设置7个变量(品别、蛋白质、脂肪、糖类、无机盐、水分、其他)及其类型、小数位数等2)简单条形图:[Graphs]=[Bar],点击Simple(简单条形图),选中[Summariesforgroupsofcases](观察值分类描述模式),即对变量中的观察值进行分组后绘图;点击Define,弹出对话框。在“BarRepresent”栏中选中“Otherstatistic(e.g.mean)”后,将“蛋白质”选入“Varible”框中,将“品别”选入“CategoryAxis”框内,OK,即可输出“品别-蛋白质”之间的条形图。“品别-脂肪”、“品别-糖类”、“品别-无机盐”、“品别-水分”、“品别-其他”的简单条形图可照做。3)分组条形图:[Graphs]=[Bar],点击Clustered(分组条形图),选中[ValuesofIndividualcases](观察值描述模式),[Define],弹出对话框。将“蛋白质、脂肪、糖类、无机盐、水分、其他”导入“BarRepresent”栏内,选中CategoryLabels下的“Variable”,将“品别”导入“Variable”栏内,OK,即可做复式条形图;4)饼图:[Graphs]=[Pie](2)线图例:三个品种的猪,从出生到6月龄出栏平均体重(kg)的变化月龄0123456长白猪2.013.527.543.061.283.8118.5大约克1.812.024.538.053.672.3104.5大白猪1.610.021.032.045.060.585.71)[Graphs]=[Line],可做单式线图和复式线图练习:将第一讲中的频数分析数据用SPSS来计算频数及绘图4、统计假设检验:SPSS提供了计算指定变量的综合描述统计量的过程和对均值进行比较检验的过程:(1)用于计算变量的综合统计量的Means过程[Analyze]=[CompareMeans]=[Means](2)用于单独样本的t检验过程[Analyze]=[CompareMeans]=[One-SampleTTest](3)用于独立样本的t检验过程[Analyze]=[CompareMeans]=[Independent-SamplesTTest]用于检验是否两个不相关的样本来自具有相同均值的总体。(4)用于配对样本的t检验过程[Analyze]=[CompareMeans]=[Paired-SamplesTTest]用于检验两个相关的样本是否来自具有相同均值的总体。单样本t检验:练习:已知玉米单交种群单105的平均穗重μ0=300g。喷洒植物生长促进剂后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。问喷药后与喷药前的果穗重差异是否显著?SPSS操作:[Analyze]=[CompareMeans]=[One-SampleTTest],弹出对话框,将“穗重”导入“TestVariable”框中,在“TestValue”中输入300,OK成组数据t检验练习:分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均值有无显著性差别(α=0.05)。病人2.905.415.484.604.035.104.974.244.362.722.372.097.105.92健康人5.188.793.146.463.726.645.604.577.714.994.01SPSS操作:(1)定义变量:实际观察值定义为X,变量G来区分病人与健康人(病人1,健康人2)(2)[Analyze]=[CompareMeans]=[Independent-SamplesTTest],打开[IndependentsamplesTTest]主对话框。选X使之进入[TestVariable(s)]列表框,选G使之进入[GroupingVariable]框,单击[DefineGroups]按钮弹出[DefineGroups]定义框,在[Group1]中输入1,在[Group2]中输入2,单击[Co
本文标题:上机操作第二讲20100416
链接地址:https://www.777doc.com/doc-2809260 .html