您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > SAS软件应用基础第二章
第二章SAS编程基础BasicProgrammingofSAS主要内容SAS程序的使用常识SAS数据集、常量、变量与观测SAS函数SAS操作符数据步流程SAS程序的使用常识SAS语句的基本结构SAS程序由语句组成语句中各项之间用空格分开语句都以分号;结束一个语句可以占多行,一行中可以写多个语句数据步和过程步数据步(Datastep):用来创建数据集过程步(Procstep):利用已创建的数据集完成特定的统计分析任务SAS程序的书写规则每个语句尽量占一行,如需要多行,则从第二行开始采用缩进格式所有数据步和过程步均以RUN;结束,内容缩进排列尽量只使用小写,或只把关键字大写,其余小写在较长程序段前后加空行或注释SAS程序的运行完整程序运行[运行]-[提交]F8提交工具按钮部分程序运行选中某程序段后提交SAS程序中的注释*;/**/SAS数据集、常量、变量与观测数据集(Dataset)SAS数据集是SAS可以管理的结构化的数据,只有SAS数据集中的数据才能被SAS过程步处理。数据集包含两部分内容:1.描述部分:(数据结构)数据名称、类型、长度、格式等。2.数据部分:(数据)包含实际数据值。SAS数据值被安排在一个矩阵式的表状结构中。观测(Observation)描述被观测对象的单一整体(如一个人、一个实验动物等)某些所研究特性的一系列数据值称为一个观测,又称观察。在SAS数据集中每一行数据是一个观测。变量(Variable)变量指定了数据的某一特性。在SAS数据集中,每一个观测是由各个变量的数据值组成。在数据集中每一列数据是一个变量。变量的命名变量名最多8个字符长,一般由字母、数字、下划线组成。第一个字符必须是字母或者下划线,不能有空格。特殊字符(如$,@,#)也不允许在SAS变量名中使用。合法变量名如:AA1abcnameagetotal…SAS系统保留的特殊变量名,以下划线开始和结尾。如:_N_和_ERROR_等。变量特性变量特性:名称、类型、长度、输入格式、输出格式和标记。两种类型:数值型字符型(后跟“$”符号)长度特性:是指存贮的字节数。缺省长度是8(为了存贮长度与缺省值不同的变量,需使用LENGTH语句)。定义变量特性的两种方法:明确地说明–input语句在首次出现时给出定义–赋值语句:变量=值表达式;例如:DATAA;C='BAD';PUTC;C='GOOD';PUTC;RUN;变量清单的简化表示如果要一次定义或指定多个同种类型变量,可以使用缩写的变量清单形式:(P13表2-1)INPUTNAME$VAR1VAR2VAR3VAR4VAR5VAR6;可以写成:INPUTNAME$VAR1-VAR6;注意:字符型变量NAME不包含在这个缩写清单中。这些变量要求类型相同,或全是数值型的或全是字符型的。缺项值当一个变量由于某种原因没有得到(可能没有观测到,或由于数据错误,或由于计算错误),称该值为缺项值(又称缺失值)。在SAS中用“.”表示。常量(Constant)SAS常量为其值是固定不变的量。SAS常量经常用于赋值、运算等语句中。如:x=10;c=“张”;y=3*x+5;常量分为以下三类:数值常量:1.5-2.791.75E-5字符常量:“Hello”“ABC”‘Zhangli’日期、时间、日期时间常量:后接D,T,DT‘1JAN2000’D‘9:25:19’T‘1JAN2000:10:30:05’DTSAS函数函数是一个功能模块,包括三个要素:函数名、参数、返回值函数的作用为:根据参数计算函数值并返回。例:y=SUM(1,2,3);函数名:SUM参数:1,2,3返回值:6(函数运算结果)参数格式:1.用逗号分割:SUM(x1,x2,x3)2.用简化形式:SUM(OFx1-x3)3.用列表形式:SUM(OFx1x2x3)SAS操作符(运算符)算术操作符***/+-比较操作符===^=逻辑操作符&(AND)|(OR)^(NOT)算术操作符***/+-作用:进行数学运算,得到数值结果。例:y=x**2+b;C=(12–4)*2;比较操作符===^=作用:比较二值的大小,如成立,结果为逻辑真值1;如不成立,结果为假值0。例:y=32;(结果y值为1)x=“ABC”“ABD”;(结果x值为0)x=“ABCDE”“ABD”;(结果为0)逻辑操作符&(AND)|(OR)^(NOT)作用:进行逻辑运算,结果仍为逻辑值真(1),假(0)SAS表达式用操作符将常量、变量、函数等连接起来进行运算,最终会产生一个值(表达式的值)。运算优先级:算术比较逻辑例:X+13LOG(Y)PART/ALL*1001-EXP(N/(N-1))AGE100STATE='NC'丨STATE='SC'数据步流程数据步由DATA语句开始,对输入数据中的每一观测,都执行数据步一遍,当执行到数据步的最后一条程序语句(一般是Cards语句)时,将变量的当前值写入数据集中。然后SAS程序再回到数据步的第一条语句继续执行,读取下一个观测。就这样不断循环读取观测,从而建立起完整的数据集。一般来说,数据中有几行数据,则数据步执行几遍,建立的数据集中则有几个观测。例:DATAFITNESS;INPUTNUMSEX$AGEWEIGHTHEIGHT;RATIO=WEIGHT/HEIGHT;CARDS;1001F19471.691002M20551.741003F18491.66;RUN;NumSexAgeWeightHeightRatio1001F19471.6927.81071002M20551.7431.60921003F18491.6629.5181
本文标题:SAS软件应用基础第二章
链接地址:https://www.777doc.com/doc-3374226 .html