您好,欢迎访问三七文档
目录•SAS系统简介和基础操作•SAS系统的工作环境;•SAS系统对数据文件的管理;•用编程读入数据建立SAS数据集;•数据加工;•数据汇总与报表制作;•制作图形展现数据•SAS宏入门•SAS系统概述和基础操作SAS系统•SAS系统是用于建立数据仓库并进行数据分析与决策支持的大型集成式模块化软件系统。•(其早期的名称为StatisticalAnalysisSystem)•被誉为数据处理和统计分析领域的国际标准软件SAS系统软件构成SAS系统是一个可由几个到二、三十个专用模块及面向行业的子系统组成的大型集成式软件包,其模块按功能大体上分为四类:•数据库部分:BaseSAS,FSP,ACCESS,..•分析核心:QC,INSIGHT,STAT,ETS,..•开发呈现工具:AF,EIS,GRAPH,..•分布处理与数据仓库:CONNECT,WA,..SAS系统介绍SAS系统是一个模块化、集成化的应用软件系统,使用SAS系统可以实现对数据的完全控制和充分利用。SAS系统主要完成以数据为中心的四大任务:•数据访问.•数据管理.•数据呈现.•数据分析.(所有的工作在一个平台内完成)信息交付SAS的核心任务(从数据到信息)数据采集管理组织利用信息知识输出SAS系统的组件•SAS系统的核心:BaseSAS模块,用于管理并呈现数据,包含有一套编程语言以及一系列过程,是其它模块的基础:•SAS数据的存储:关系型数据存储:dataset,dataview;完全支持SQL标准的数据结构和数据处理.多维数据存储:MDDB/Cube;没有结构性冗余的有效存储.数据挖掘库:DMDB;针对数据挖掘特点的数据存储.并行处理数据引擎:智能数据切分功能,优化的索引结构.SAS系统的组件•数据访问:通过SAS/ACCESS模块,可读取各种数据源,包括:Informix,UDB,Sybase,Oracle,SQLServer;cobol;对ODBC,OLEDB支持的数据源;Windows下的文件:.DBF,.Excel;文本格式的文件;html格式的文件.……SAS系统的组件•数据统计分析:SAS/STAT覆盖了当今世界上所有的实用数理统计分析方法,可以适应各种不同模型和不同特点数据的需要;SAS/ETS提供了丰富的计量经济学和时间序列分析方法;SAS/INSIGHT一个功能强大的可视化的数据探索与分析的工具;SAS/OR用于进行运筹运算;SAS/QC功能强大的质量控制软件。SAS系统的组件•SAS数据仓库----SAS/WA:SAS的数据仓库技术集成地实现了数据访问和数据管理的任务,不仅能访问存在于不同地点地任何形式地数据,而且将之进行分类、合并、归纳、整理及深层分析后得到有用的信息,这些支持决策地信息具有开放性,能被其它应用系统访问。SAS/WA:是非常优秀地可视化数据仓库管理工具,涉及数据仓库建立工程中地各个环节。•OLAP系列:SAS/MDDB,OpenOLAPServer,SAS/EISSAS系统的组件•表现工具:前端开发工具:SAS/AF图形表现工具:SAS/GRAPH,可制作出各种二维和三维图形,如柱状图,散点图,饼图等等;地理信息表现工具:SAS/GIS•Web产品:SAS/Intrnet:SAS/StoredProcessSAS/WebEIS:SAS/PortalSAS/WebReportStudio……SAS/WebAF•SAS系统的基本运行环境SAS系统的工作环境•SAS系统可以有多种方式在各种操作系统中运行,常用的有:•交互方式:直接在SAS操作环境下进行操作,SAS系统执行任务并返回结果,可不断地根据返回的结果继续操作。•批作业方式:操作者向操作系统提交启动SAS作业的要求和全部要运行的SAS程序,再由操作系统安排这一作业运行,操作者可在事后获得SAS程序运行的全部结果。SAS系统的交互工作环境•启动SAS(1)在Windows桌面系统下双击SAS图标;(2)运行SAS系统目录下(例C:\SAS8)的可执行程序sas.exe;(3)从“运行”打开或从“资料管理器”双击某个已有的SAS程序,也可启动SAS系统并调入该程序.SAS提供的基本运行环境•SAS提供了强有力的交互式用户界面:显示管理系统。•基本窗口及窗口条:–Editor窗口:用于编写、编辑和执行SAS程序语句;–Log窗口:显示当前会话程序运行的信息;–Output窗口:显示程序的输出;–Result窗口:管理输出结果;–Explorer窗口:管理SAS系统中的文件;•下拉菜单或弹出菜单:•命令框、工具拦、信息窗:基本窗口基本窗口显示管理系统运行一个简单的SAS程序:1、在Editor窗口中输入程序:procprintdata=sasuser.class;/*simple1.sas*/varnamesexage;whereagegt13;run;2、通过菜单、命令框、工具栏或功能键等都可提交程序;3、在Log中查看程序的运行信息,在Output窗口中查看运行结果。4、若需要重新找回程序,可通过功能键或菜单进行。显示管理系统其它一些窗口:•KEYS窗口:查看及改变功能键的设置;•OPTIONS窗口:查看及改变SAS的系统设置;•LIBNAME窗口:查看已存在的SAS数据库;•DIR窗口:查看某个SAS数据库的内容;•VAR窗口:查看SAS数据集的有关信息;显示管理系统每个窗口都有自己相应的菜单选项;可通过点击窗口条或在查看菜单打开不同的窗口;在工具菜单可以调用一些实用的工具以及定制系统的属性;如:可以通过选择菜单进行:表编辑、报表编辑、图形编辑以及文本编辑等等;在选项子菜单下可以查看及定制系统的一些属性;如:在参数菜单中可以把过程的输出定制为HTML文件,保存在某个目录中,默认为临时库的目录。在解决方案菜单中包含了部分SAS模块的菜单操作环境;•SAS系统对数据文件的管理SAS文件类型有多种不同的SAS文件类型,其中包括有:•SASdataset/view(SAS数据集/视图)SAS对数据的分析与呈现都是面对SAS数据集进行的,得到它们主要有三个途径:1)直接在SAS系统中输入数据;2)用SAS数据步(DataStep)将外部数据文件转换为SAS数据集;3)通过SAS/ACCESS软件访问其它的数据库管理系统。•SASCatalog是保存有多种不同类型信息的SAS文件SAS数据对象•SAS数据集通常分为两个部分:–描述部分:包含数据的属性信息;–数据部分:包含数值。•数据集的列称为变量(Variable),类似于域或字段,变量名最长为32个字符,以字母或下划线开始,可包含字母、数字和下划线;•数据集的行称为观测(Observation),相当于记录,观测数不受限制。•SAS数据视图只有描述部分,没有数据部分:–但描述部分包含了足够的信息以找到保存在其他文件中的数据;–数据视图减少了维护费用,源数据一旦改变,数据视图将随着改变,可由SQL、ACCESS和DATAStep产生。SAS数据集•描述部分包含的信息包括有:–变量的名字;–变量的属性;–数据集中的观测数;–数据集创建或修改的时间等SAS数据对象•在编程环境下查看数据对象的描述部分可用以下过程:•浏览数据集的数据部分:•发命令:VT(或FSV)数据集名•提交程序:SAS数据库•SAS数据集存储在SAS逻辑库中;•SAS逻辑库还存储有其它的SAS专用文件(由SAS创建和管理的文件);•SAS逻辑库只是一个逻辑概念,指向了某个存储目录;•SAS文件用两级命名方式命名:•libname.SAS-filename(库标记.文件名)•库标记指的是逻辑库的名字(最长8个字符,以字母或下划线开始,可包含字母、数字和下划线)。SAS数据库•SAS逻辑库分为永久库和临时库:–永久库:SASUSER、SASHELP、自定义的库;–临时库:WORK(关闭会话,内容将丢失)。–自定义的库若不指定,关闭SAS后,库标记将失效,但内容被保存下来。•每次启动,SAS都自动产生两个SAS逻辑库:–WORK(引用WORK库中的文件可省略库标记)–SASUSERSAS数据库的设定•不同的主操作系统下逻辑库以不同的方式与主操作系统下的文件组织相联系;•在Windows下每个SAS逻辑库与某个子目录相连系,即SAS逻辑库包含指定子目录内的所有SAS文件(不含更下一级子目录内容);例:SASUSER:C:\documentsandsettings\......\V8\BASEDATA:C:\basedataSAS数据库的设定•设定一个SAS逻辑库就是与操作系统的某个物理位置建立一个联系,让SAS系统可以对该位置上的SAS文件进行管理;•解除一个SAS逻辑库只是解除上述联系,并不删除该物理位置上的SAS文件。–多个SAS逻辑库可与同一个物理位置相连接–一个SAS逻辑库也可与多个物理位置相连接SAS数据库的设定•标记一个SAS逻辑库有两种方法:–通过菜单进行;–libname库标记引擎数据源选项;•engine(引擎)是一种访问架构,–SAS的逻辑库都有一个引擎,这个引擎决定了SAS可以访问和写入的SAS文件格式。–它可以是V9,V8等不同的SAS版本,也可以是Oracle,DB2等表示外部数据格式文件,还有SPSS,DMBP等为一些其它软件格式文件使用的数据。不同引擎的库连接可构成混合引擎的库,实现同时看到库内不同引擎的文件。SAS数据库的设定SAS9可以读出V8的SAS文件,可以修改和写入V8的DataSet和catalog;V8数据集转为SAS9:ProcMigration,ProcCopy,Procdatasets的copy语句;V8Catalog转为SAS9:ProcMigration。SAS数据库-用菜单设定1.按工具条上图标(新建逻辑库)可进入设定新的逻辑库的新建逻辑库窗口;2.浏览器窗口击活时,在下拉菜单中选:文件==新建==逻辑库可进入设定SAS逻辑库的窗口。3.在SAS环境处右击鼠标,在弹出的菜单中选新建...,也可进入新建逻辑库窗口。注意启动时使用选项的使用。利用SAS/CONNECT建立连接利用SAS/CONNECT建立连接•SAS/CONNECT软件提供了SAS应用的协同环境,提供了运行在不同平台上的SAS之间的通讯连接。•利用SAS/CONNECT,一个在本地运行的SAS程序可以与一个或多个远端SAS进程建立连接,在建立连接的基础上,还可以通过本地SAS访问到远端的数据,也可以递交程序给远端SAS进程来执行,并将结果返回到本地。•在登录到远端系统之前,必须制定下列内容:–通讯方法;–需要连接的远程机器的IP地址;–合适的脚本文件。利用SAS/CONNECT建立连接•范例(与UNIX主机(S85)连接):–%letser_name=190.2.200.45;–optionsremote=ser_namecomamid=tcp;–filenamerlink!SASROOT\tcpunix.scr;–signon;•当与远端建立连接后,可在本地SAS通过运行libname建立库标记,访问远端数据.•libname库标记名“文件所在路径”server=ser_name;•利用窗口菜单操作和创建SAS数据集SAS数据集的变量SAS数据集的列称为变量(Variable),变量的类型:字符型变量(CharacterVariable):可包含任何值,包括字母、数字和特殊字符,长度为1至32,767个字节;数值型变量(NumericalVariable):通常只包含数字,包括科学计数法和十六进制表示法中的数字,保存为8个字节的浮点数;SAS数据集的缺失值处理•许多数据集中都会有缺失值,SAS对此作以下处理:–对于数值型变量,这个值显示为一个点.;–对于字符型变量,这个值显示为空格。例子:datatmp;lengthvar1$8.;lengthvar2$8.;lengthvar38.;lengthvar48.;
本文标题:SAS基础教程
链接地址:https://www.777doc.com/doc-3869809 .html