您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > SAS统计分析概述(第一讲)
2020/1/1012020/1/102[学习要求]了解:SAS系统的基本组成和特点。熟悉:SAS系统的显示窗口,变量的分类和SAS运算函数。掌握:SAS系统程序结构和SAS数据的建立和整理。2020/1/103SAS软件系统简介SAS发展概述SAS(StatisticalAnalysisSystem)是一个管理数据、分析数据和编写打印各种形式报告的组合软件系统,是国际上非常流行的统计分析软件之一。1985年,美国SAS研究所推出了可以在微机上运行的SAS/PC版本,此后,又不断出新的版本,功能不断增强,越来越多的人在用它进行统计分析的同时,也把它用作数据管理软件。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,目前已到SAS9.2版本。2020/1/104视窗管理系统数据步语句基本过程统计过程绘图过程数据探索性分析矩阵计算过程时间序列分析运筹学分析质量控制DMSDATABASESTATGRAPHINSIGHTIMLETSORQC图1SAS基本组成SAS系统的基本组成2020/1/105SAS的特点1.语言编程能力强。SAS语言具有一般高级语言的一切功能,有100多个函数,有完成各种操作的算符,能读各种类型的数据,可以使用赋值语句、条件语句、数组和循环语句等对变量进行操作。SAS程序书写自由简洁。2.分析方法丰富。SAS汇集了大量的统计方法,从简单描述统计量的计算到多因素分析,从时间序列分析到质量控制等。仅SAS/STAT就包括了8类方法28个分析过程。2020/1/1063.对数据的连续处理。SAS能同时处理多个输入文件,能从几个数据集中组合变量值、观测值,建立子集,连接、合并和修改数据。SAS可存储一个合法的结果或中间结果,以便以后使用。4.可组合性。由于SAS是模块式结构,用户可按自己的要求,在SAS/BASE的基础上选择合适的模块,以组成自己需要的系统。2020/1/107SAS程序和SAS数据集安装直接启动SAS安装界面启动由程序栏启动。由文件名直接启动建立桌面快捷方式直接启动2020/1/108界面(显示管理系统):三个基本窗口EDITOR编辑窗口:编辑SAS程序。SAS8.0以上版本有以下两个编辑窗口:1.增强型编辑窗口(Enhancededitor):他只在Windows操作下才有,是SAS系统缺省提供的编辑窗口。它除了提供一般的文本输入和编辑功能外,还提供许多有用的编辑功能,它包括:对SAS程序不同的语句用不同的颜色显示并进行词法检查。程序段的展开和搜索功能,便于从宏观上了解程序的结构。程序输入时自动缩进功能。2020/1/1092.程序编辑窗口(Programeditor):只具有SAS一般编辑功能.键入命令pgm或在菜单中选ViewProgrameditor。LOG日志窗口:程序运行过程、时间、错误信息(红色显示)。OUTPUT输出窗口:当程序运行无误,且有结果输出时显示。2020/1/1010其它窗口:Explorer游览器窗口(显示当前SAS库的名字和路径)在菜单中选ViewContentsOnly,可激活在左侧固定位置上的游览器。此外,还可用以下任一种方式打开一个新的包含SAS文件库目录树的游览窗口:键入命令Explorer并按回车。在菜单中选ViewExplorer。在工具栏点击图标2020/1/1011Results结果窗口:帮助游览和管理所提交SAS程序的输出结果。在菜单中选ViewResultsKeys窗(功能键窗):显示和设置快捷方式的功能键,键入命令Keys或按F9即可激活。2020/1/1012SAS运行菜单“File”调用、储存、打印文件等。“Edit”用于编辑文件。“View”可供选择窗口。“Tools”选择SAS的功能。“Run”用于运行本机文件其中:Submit是运行程序,Recall是调回前面用过的程序。“Solutions”提供SAS更多的分析、管理功能。2020/1/1013菜单下方的工具条New(清除log窗口和output窗口的内容,建立新文件),Open(打开文件),Save(储存文件),Print(打印),View(预览),Cut(裁剪),Copy(复制),Paste(粘贴),Undo(恢复),Explorer(游览窗口),Submit(运行),Clearall(删除editor窗口内容),Help(提供帮助)“Help”可随时提供帮助咨询2020/1/1014SAS文件系统*.sas7bdatSAS数据集*.sasEDITOR视窗输出SAS程序文件*.logLOG视窗输出文件*.lstOUTPUT视窗口输出文件2020/1/1015SAS中的常用变量数值型变量变量名由1~32个字符组成,以英文字母(A~Z,包括大写和小写)或下划线(_)开头,其余可以是英文字母、数字或下划线,不能包含中文字符、%、&、#、!和空格符等字符。如AGE,X2,X1_1,_ab等都是合法的,1X,XY-1,X&,ab1,等都是不合法的。变量值过大或过小的数可用科学记数法,如:1.785E-19即为1.785×10-19,5.25E12即为5.25×1012。2020/1/1016字符型变量字符型变量名后加“$”号表示,如NAME$,SEX$等。字符型变量值可以是任何的字符,如:’ZhangHua’,‘男’,’上海’等都是一个字符变量。SAS运算符与常用函数算术运算符﹡﹡(乘方),﹡(乘),/(除),+(加),-(减)。比较运算符=或EQ(等于),^=或NE(不等于),或GT(大于),=或GE(大于等于),或LT(小于),=或LE(小于等于)。2020/1/1017逻辑运算符AND或&(逻辑与),OR或|(逻辑或),NOT或^(逻辑非)。如A25&B30;A25|B30;NOT(A3)常用函数ABS(x)—x的绝对值;SQRT(x)—x的平方根;EXP(x)—e(2.71828)的x次方;LOG(x)—x的自然对数(以e为底);LOG2(x)—x的以2为底的对数;LOG10(x)—x的普通对数(以10为底)。2020/1/1018SAS程序结构由三部分组成;SAS语句以一个关键词开始,以分号(;)结束。数据步以data语句开始,用于创建和处理数据集。Data语句的功能:(1)标志数据步的开始;(2)命名将要创建的SAS数据集。data语句格式:data数据集名;Input语句的功能:(1)读入由语句指定的数据列;(2)为相应数据域定义变量名;;(3)确定变量的读入模式。Input语句格式:input变量名[变量类型];2020/1/1019Cards语句的功能:标志数据块的开始,格式为:cards;或datalines;(单独占一行)过程步以PROC语句开始,对数据进行分析和处理时,需要调用SAS过程,SAS过程是一系列应用程序。语句格式:PROCSAS过程名[选项];常用的[选项]为:data=数据集名;如:procprint;/*调用现成的SAS过程,进行显示数据集*/提交程序步Run;/*在程序最后,指示过程步或数据步结束,可以提交程序*/2020/1/1020如:dataesr;/*建立临时数据集esr.sd2,自动放在saswork子目录下*/Inputx;/*指明要输入的变量*/Cards;/*标志数据区开始*/3986557;Procprint;Run;2020/1/10212020/1/1022Log窗输出2020/1/1023Output窗输出2020/1/1024程序运行---在编辑窗输入程序后点击图标按功能键“F8”在命令行(窗)键入“submit”在Run下拉菜单中选“submit”窗口内容保存在命令窗口键入file‘路径\文件名’点击图标在file下拉菜单中选“save”或“saveas”只有编辑窗口(editor窗)才能打开文件2020/1/1025常用的快捷键–F1Help命令,进入帮助视窗。–F4recall命令,用于程序编辑窗,将前面提交的程序调回,可多次使用。–F5切换到增强型程序编辑框。–F6切换到log视窗。–F7切换到output视窗。–F8submit命令。–F9Keys命令,进入功能键视窗。2020/1/1026SAS数据集建立---用input和cards语句直接输入datachild;/*建立临时数据集child.sas7bdat,自动放在saswork子目录下*/inputidx1$x2x3x4x5x6;/*指明要输入的变量,$为字符型变量*/cards;/*标志数据区开始,数据之间以一个或几个空格分隔*/1m3295.514.053.549.642m3592.013.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;/*标志数据区结束,分号必须单独一行*/run;2020/1/1027SAS数据集建立---数据读入dataa1;inputidx1$x2x3x4;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:OBSIDX1X2X3X411m3295.52.023m3389.012.5dataa1;inputidx1$x2x3;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:OBSIDX1X2X311m3295.522m3592.033m3389.02020/1/1028不分行符@@的使用dataesr;inputx@@;/*每读入一条记录后,数据指针保持原位不换行,继续读下一条记录*/cards;39865573108104;procmeans;run;结果:AnalysisVariable:XNMeanStdDevMinimumMaximum----------------------------------------------------------126.50000002.54057973.000000010.0000000----------------------------------------------------------2020/1/1029缺失值的输入---以.表示,缺失值不进入分析datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;procmeans;run;2020/1/1030TheMEANSProcedureVariableNMeanStdDevMinimumMaximum--------------------------------------------------------------ID7184.5714286194.96397711.0000000521.0000000X2773.857142970.477960130.0000000178.0000000X36116.250000038.241012089.0000000168.0000000X4723.785714319.482593011.000000053.5000000X5759.285714314.7361
本文标题:SAS统计分析概述(第一讲)
链接地址:https://www.777doc.com/doc-2849052 .html