您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > SAS在生物医学中的应用
华中科技大学同济医学院妇幼卫生系方为民第十三章SAS基础知识StatisticalAnalysisSystem2简介SAS(SoftwareofAnalysisSystem)是一个大型的系统分析软件包,它不仅含有功能很强的统计分析软件,而且,还含有经济,工农业,科学等领域里的一些常用的分析工具。和其它的统计软件相比,SAS的最大特点是功能齐全,技巧灵活,使用方便,应用广泛,特别是数据处理方面的强大功能,是其它统计软件所不能比的。目前,它越来越广泛地被应用到各个学科领域,被誉为国际上的一个标准高级软件。3方法掌握一个数据分析软件包的基本使用方法,主要要解决三个方面的问题:一是了解软件包的系统结构,包括其使用环境,主要功能,主要特点等;二是了解软件包所使用的系统语言和程序结构,包括学会建立软件包所认可的数据库的方法和编辑各种运算程序的方法;三是了解与软件包有关的计算机的基本操作方法和使用技能,包括启动系统,退出系统,存入文件,调出文件,运转程序,查看结果等。4主要内容了解SAS软件的主要功能、特点及组成;掌握SAS显示管理系统及各主要窗口的功能;掌握SAS的基本语言特点、程序类型和程序结构;5SAS基础知识SAS软件的历史、地位和作用SAS(SoftwareofAnalysisSystem)Statisticalanalysissystem20世纪60年代末期,美国北卡罗纳州州立大学的A.J.Barr和J.H.Goodnight两位教授1975年SAS系统社会科学、经济学、生物学、金融学与医疗卫生保健等学科领域。6SAS的内容软件包的系统结构软件所使用的专用语言和程序结构了解与软件包有关的计算机的基本操作方法和使用技能7SAS系统简介SAS系统的组成系统管理程序功能程序库SAS/BASE-SAS/STATSAS/GRAPHSAS/QCSAS/ORSAS/ETSSAS/IMLSAS/ASSISTSAS系统8SAS系统的主要功能数据管理功能统计分析功能制表和绘图功能文件管理功能9数据管理功能SAS系统可以将任何类型的数据以灵活多样的形式建立起包含大量信息的“SAS数据集”,并可以暂时或永久地储存起来;调用SAS数据集方便迅速,减少很多重复工作;编辑,合并,剪裁数据十分简单。另外,SAS系统还可以与其它系统,如,dBASE,Excel等数据集相互转换,共享功能,从而大大加强了SAS的使用功能。10统计分析功能SAS系统包括了几乎所有的统计分析方法。与其它统计软件包不同的是,这些统计分析方法既是相互独立的,又是相互联系的,前一过程的输出结果可以作为后一过程的输入信息,中间不需要中断系统的运行,从而减少了很多工作,缩短了计算时11文件管理功能SAS系统提供了很多通用的文件编辑功能,如,插入,删除,复制,移动,连接,合并等等,易于掌握,使用方便。12SAS系统的主要特点具有自己的语言环境,称为SAS语言;具有多窗口显示功能,使得分析程序,分析过程和分析结果等分别在不同的窗口里清晰地展现出来,直观方便,易于掌握;具有多用途的功能模块,使得应用非常广泛;信息存储方式简便灵活,且与其它数据库系统共享数据的功能很强;13SAS显示管理系统SAS的启动使用快捷图标使用“程序”菜单使用运行对话框14SAS显示管理系统SAS显示管理系统的主窗口三个主窗口标题区(titlebar)视窗大小控制区主菜单区(功能选项栏)命令行(COMMANDBAR)工具行(功能图标)15三个主窗口工具行(功能图标标题区(titlebar)视窗大小控制区主菜单区(功能选项栏)命令行(COMMANDBAR)16SAS显示系统的主要子窗口PGM(PROGRAMEDITOR)--程序编辑窗口LOG---运行记录窗口OUTPUT---结果输出窗口EXPLORER---探索者窗口RESULTS---结果窗口ENHANCEDEDITOR------增强的编辑窗口KEYS---键窗口SAS/ASSIST-------SAS辅助窗口SASSystemHelp窗口---SAS系统帮助窗口17程序编辑窗口PGM(PROGRAMEDITOR)它是SAS显示管理系统中的三个基本窗口之一。在此窗口上,用户可以编辑新程序,修改旧程序或调出查看各类存档文件。在此窗口中保存下来的文件的扩展名为*.sas。18ENHANCEDEDITOR------高级编辑窗口与PGM窗口类似,主要用于编写SAS程序,不同的是对写入的程序可以用不同的颜色来显示不同的部分,并对SAS语言的语法进行检查,根据程序语句的作用进行分段,以区别哪些是固定的关键词,哪些是用户任意写的内容,哪些是数据步,哪些是过程步,便于发现和修改程序中的错误,另外还可同时打开多个EDITOR窗口。19LOG---运行记录窗口此窗口显示程序执行过程中的情况,包括执行了什么语句;建立了什么数据集;所建立的数据集包含多少变量和观察值;程序的每一步运行的时间;以及程序中存在的错误等。它的主要作用是,当PGM窗口里的程序被执行后,用户可以从这里看到所有运行过程的有关信息;检查出该程序的错误所在,包括程序中错误发生的位置,错误的类型等,从而帮助用户及时准确地发现和修改程序中的错误。保存记录文件的扩展名为*.log。20OUTPUT---结果输出窗口此窗口显示程序运行后的所有结果。当PGM窗口里输入的程序完全正确时,或LOG窗口里没有错误记载时,此窗口中显示的全部结果才有效。否则,此窗口中不显示任何结果或只显示程序中正确部分的运行结果。保存的结果的文本文件扩展名为*.lst。21EXPLORER-------资源管理器窗口它竖立在主窗口的左边,主要是用户能够浏览SAS文件,创建非SAS文件的路径。用户可通过此窗口去方便查找各SAS库及其库内的内容。若内容是SAS数据集,双击所需的SAS数据集,就可将它显示在VIEWTABLE数据窗内,还可对SAS文件实施拷贝、移动、删除等文件管理事务。22SAS语言和SAS程序常量1.数值常量数值常量由数字0~9、小数点、正负号和E等符号组成。例如:12231.689E-8(1.689×10-8)数值常量的缺省值用“·”来表示。232.字符常量字符常量由1~200个字符组成。在赋值语句中,字符常量要用定界符单引号或双引号括起来。字符常量的缺省值用空格表示。3.日期、时间和日期时间常量该型常量必须用单引号括起,后续一个D(Date)、T(Time)或DT(DateTime)表示其类型。‘8JAN1999’D表示日期值‘10:45’T表示时间值‘8JAN99:9:25:14’DT表示日期时间值例:24变量一、SAS变量名命名原则变量名的第一个字符必须是字母(a-z)或下横线A1A2_N_变量名长度一般最多不超过八个字符(SAS8.0允许长的变量名)变量名中间不能有空格AB不要用大写和小写英文字母来区分不同的变量名ageAGE变量名不要与SAS系统内部定义和使用的变量名相同MEAN_N__TYPE_25命名方式顾名思义(即根据英文单词来命名)sexnameageheightweightetc.顺序变量temp1,temp2,temp3,temp4和temp5x1,x2,...X10var1,var2,...Var10datad;inputidagetemp1-temp5;temp=sum(oftemp1-temp5)/5;labelage=‘ageinyears’temp=‘Averagetemperature’;cards;(数据)run;26SAS变量的类型数值变量(intervalvariable)变量的值不含字符字符变量(norminal,categoricalvariable)变量的值含有字符日期时间变量(date,timevariable)值为日期时间27输入输出格式输入----用SAS程序将原始数据转变成SAS系统认可的SAS数据输出----将SAS系统里的SAS数据调出来,完成某指令或任务输入格式---是输入原始数据前,用户告诉系统每个变量的类型,字符长度或数据所在的位置等信息输出格式---输出数据时用户希望得到的数据形式back28数值变量常用的输入或输出格式符号是:w.d或w.w表示变量的字符长度,d表示变量中小数的位数Height4.2age2.字符变量常用的输入或输出格式符号是$w.例如SEX$1.日期变量常用的输入或输出格式符号是YYMMDDw.或DDMMYYw.或MMDDYYw.或DATEw.w表示日期变量中字符的长度yymmdd8.date8.mmddyy6.*注意SAS的时间表示29SAS的时间输出格式注意,当输出时间变量时,输出格式用yymmdd8.或date8.或不用输出格式,其输出的结果形式是完全不一样的。例如,19801202的输出结果分别是80-12-02,02DEC80和7641。对于日期变量,如果输出时不给出输出格式,那么输出结果是一个按日排列得到的常数。SAS系统规定1960年1月1日等于1,然后以此类推。例如,1959年1月1日等于-365,1979年1月1日等于常数6940。30NAMEAGESEXHEIGHTWEIGHTBUSTBIRTHDAYliuyin4B1.0615.3051.019990503liuyang5G1.0115.0451.919980706huye5G1.0215.0752.719980614chengbin6G1.0717.0453.719970408yangbin6B1.1218.0954.119971214liuhong6B1.1418.8053.519970424yanjin7G1.1619.9355.519960306zhang7G1.1518.2051.419960416SAS变量的类型和输入输出格式31DATACLASS1;INPUTNAME$AGESEX$HEIGHTWEIGHTBUSTBIRTHDAYYYMMDD12.;CARDS;Lumin3B0.9413.5950.420000802caihang3B0.9114.2050.020000912limin4G1.3916.1551.619990815liyou4B1.0215.4451.919990703liuyin4B1.0615.3051.019990503liuyang5G1.0115.0451.919980706huye5G1.0215.0752.719980614chengbin6G1.0717.0453.719970408yangbin6B1.1218.0954.119971214liuhong6B1.1418.8053.519970424yanjin7G1.1619.9355.519960306zhang7G1.1518.2051.419960416RUN;PROCPRINT;FORMATBIRTHDAYMMDDYY8.;RUN;32SAS函数SAS系统中定义了内容丰富的函数,它主要用于编辑程序,特别是在建立SAS数据集的数值计算和数据处理中,利用函数可以帮助用户直接计算出所需的函数值,从而简化运算程序,减少运算时间。所有的SAS函数均可用在数据步中。33SAS函数一般形式y=函数名(x或x的表达式)这里,y是用户设定的新变量,x是已知的变量。y=函数名(x1,x2,x3,x4,x5);y=函数名(ofx1x2x3x4x5);y=函数名(ofx1-x5)z=sum(ofx1-x5)表示的是新变量z等于x1到x5这五个变量之和。34常用函数数学函数:abs(x)x的绝对值sign(x)x的符号int(x)x的整数值round(x)x的四舍五入值sqrt(x)x的平方根exp(x)e的x次幂log(x)x的自然对数值log2(x)x的以2为底的对数值log10(x)x的以10为底的对数值35常用函数样本统计函数:mean(ofx1-xn)x1-xn的算术平均值
本文标题:SAS在生物医学中的应用
链接地址:https://www.777doc.com/doc-279560 .html