您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > SAS软件介绍(精)
SAS软件介绍一、概述SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的版本为9.0版,大小约为1G。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品。堪称统计软件界的巨无霸。在此仅举一例如下:在以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。启动SAS二、初识SAS启动后,出现如图的SAS运行界面,它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。SAS有三个最重要的子窗口:程序窗口(PROGRAMEDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。ProgramEditor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的。要运行程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。三、SAS程序的使用常识SAS程序的基本结构SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。SAS程序的程序步程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子:dataaaaa;inputx@@;cards;12345;procprint;varx;run;第1~5句构成数据步,其功能是新建一个数据集,数据集名称为aaaa,并且输入数据,第6~8句构成过程步,其功能是将数据集aaaa中变量x的数值在output窗口中输出。数据集要有名字,变量要有名字,所以SAS中对名字(数据集名、变量名、数据库名,等等)有约定:SAS名字由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超长)等不是合法的名字。四、SAS中的命名数据步均以DATA语句开始,用于创建和处理数据集。数据步中常用的语句如下表:表2数据步的常用语句语句格式功能DATA语句DATA数据集名;数据步的开始,同时命名将要创建的数据集INPUT语句INPUT变量名变量类型起止列数…;确定变量的读入格式,即确定输入的数据所对应的变量四、数据步基本结构语句格式功能CARDS或DATALINESCARDS;数据块;或DATALINES;数据块;CARDS与DATALINES功能相同,均用于标志数据块的开始下面是几个例子:Data语句:Dataabc;INPUT语句:Inputxyz;/*输入变量x,y,z*/Inputx1-x10;/*输入10个变量x1到x10*/Inputx$y@@;/*输入变量x,y,符号$指明x为字符变量,@@表示数据是连续读入*/五、SAS程序的过程步通俗地说,SAS程序的过程步就是用于实现各种统计分析功能的SAS命令,我们只需要按照其格式调用它们。过程步总是以一个proc语句开始,后面紧跟着过程步名。如procprint;procmeans;建立数据集:datat;inputx@@;*@@是行保持标记符;gr=2;*赋值语句要出现在cards语句之前;x0=gr*int(x/gr)+gr/2;*int()是取整函数;cards;7.428.6523.0221.61……24.6614.1816.52;Run;SAS程序(Editor窗口)编制频数表:procfreqdata=t;*调用freq过程;tablesx0/out=t1;*生成一维频数表,并生成包含频数表数据的数据集t1;run;SAS程序(Editor窗口)必需语句运行结果(output窗口)SAS程序(Editor窗口)计算统计指标,绘制直方图:procunivariatedata=t;*调用univariate过程;varx;*对变量x进行分析;HISTOGRAMx/MIDPOINTS=7TO29BY2;*绘制直方图;run;运行结果(graph窗口)79111315171921232527290510152025Percentx均数标准差方差变异系数中位数极差四分位数间距偏度系数峰度系数运行结果(output窗口)运行结果(output窗口)SAS程序(Editor窗口)对频数表资料分析procUNIVARIATEdata=t1;VARx0;FREQcount;*指定变量count为频数变量;run;SAS程序(Editor窗口)另一个统计描述的过程:procmeansdata=student;*调用means过程;varheight;*对变量x进行分析;Classsex;*按sex变量分组统计;run;byby语句要求数据集按by后的变量排序排序过程:procsortdata=student;*调用sort过程;bysex;*按变量sex进行排序;run;SAS程序(Editor窗口)总结新学习的SAS过程:Freq过程Univariate过程Means过程Sort过程总结新学习的SAS语句:赋值语句(用在数据步)Var语句Freq语句Class语句By语句课外作业:按性别分组,对本班同学身高,体重,上网时间,四级成绩等所有定量变量进行统计描述。
本文标题:SAS软件介绍(精)
链接地址:https://www.777doc.com/doc-4641689 .html