您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > SAS 系统是用于严肃数据分析和决策支持的大型集成式模块化软件包
1SAS系统是用于严肃数据分析和决策支持的大型集成式模块化软件包六十年代末到八十年代初以统计分析及线性数学模型为主,在数据处理和统计分析领域被誉为国际上的标准软件系统SAS在决策支持工具---数据仓库和数据挖掘(DataWarehouse与DataMining)方面已连年被评为“年度最佳产品”、“最佳决策支持工具”。公司卓著的业绩使之被评为全美国人们最乐意为之工作的100家公司之一及最佳决策支持工具的供应商。发展1966年美国北卡周立大学A.J.Barr1972年推出SAS72供大学使用1976年成立SAS研究所(SASInstituteInc.),总部在美国北卡州凯瑞市现已是全球最大的私人软件公司和全球排名第九位的独立软件商SAS简介(StatisticalAnalysisSystem)2SAS简介(StatisticalAnalysisSystem)大型集成应用软件,具有完备的数据访问、管理、分析、呈现及应用开发功能为金融、制造、电信、政府及教育部门提供数据仓库和决策支持系统运用统计分析、时间序列、运筹决策等科学方法进行质量控制、财务管理、生产优化、风险管理、市场调查和预测等120多个国家和地区,三万一千多机构,直接用户超过三百五十万☻3系统组成:三十几个模块,功能包括:客户机/服务器计算、数据访问、数据存储及管理、应用开发、图形处理、数据分析、报告编辑、质量控制、项目管理、计算机性能评估、运筹学方法、计量经济学与预测等SAS简介(StatisticalAnalysisSystem)4SAS数据库部分:SAS/BASE提供丰富的数据管理功能,制作统计报表,进行基本的描述性统计SAS开发及呈现工具:SAS/AF、SAS/GRAPH、SAS/FSP(进行数据处理的交互式菜单系统)等,面向对象的开发工具,支持客户/服务器的应用开发SAS对分布处理模式的支持及其数据仓库的设计:SAS/ACCESS数据接口集,提供与外部数据的接口SAS简介(StatisticalAnalysisSystem)5SAS分析核心:SAS/STAT统计分析软件包,覆盖所有的实用数理统计分析方法,是国际统计分析领域的标准软件SAS/IML提供面向矩阵运算的编程语言,是用户研究新算法解决新问题的工具SAS/OR运筹学和工程管理的软件,提供运筹学方法,是强有力的决策支持工具SAS/ETS用于计量经济学和时间序列分析,是研究复杂系统和进行预测的工具SAS/QC用于质量的专用软件,为全面质量管理提供一系列工具,进行标准的过程控制以及试验设计SAS简介(StatisticalAnalysisSystem)6一、SAS程序和SAS数据集安装、启动界面(显示管理系统):三个基本窗口EDIT编辑窗:编辑SAS程序LOG记录窗:程序运行过程、时间、错误信息(红色---错误兰色---正常绿色---警告)OUTPUT结果输出窗:当程序运行无误,且有结果输出时显示其他:var窗、keys窗、lib窗(在命令窗command或命令行command===输入相应的命令激活)7使用Options下拉菜单中的Preferences订制DMS的显示,如选择“commendbar”和“commendline”在命令条/行输入num并回车,可在编辑窗口加入行号,方便编程;commendline和行号后的一列禁止写入,命令或程序需从其后第二列开始写SAS文件系统*.sd2SAS数据集(6.12版)(必须以字母开头,长度不超过8位);8.0以上版为*.sas7bdat;*.sasSAS程序文件*.loglog窗口输出*.lstSAS结果文件一、SAS程序和SAS数据集89由三部分组成;SAS语句以一个关键词开始,以分号(;)结束;Dataesr;数据步:输入并建立数据Inputx;Cards;39865573108104;Procprint;过程步:调用现成的SAS过程,进行统计分析Run;在程序最后,指示过程步或数据步结束,可以提交SAS程序结构:10Log窗输出11Output窗输出12程序运行---在编辑窗输入程序后点击图标按功能键“F8”在命令行(窗)键入“submit”在local下拉菜单中选“submit”窗口内容保存----激活窗口后在命令行(窗)键入file“路径\文件名”点击图标在file下拉菜单中选“save”或“saveas”只有编辑窗口(edit窗)才能打开文件一、SAS程序和SAS数据集13常用的快捷键F4recall命令,用于edit窗,将前面提交的程序调回,可多次使用F5切换到edit窗F6切换到log窗F7切换到output窗F8submit命令Ctrl-E清除当前窗口的内容。edit窗被清除的内容不能用F4调回一、SAS程序和SAS数据集14SAS数据集建立---用input和cards语句直接输入datachild;/*建立临时数据集child.sd2,自动放在saswork子目录下*/inputidx1$x2x3x4x5x6;/*指明要输入的变量,$为字符型变量*/cards;/*标志数据区开始,数据之间以一个或几个空格分隔*/1m3295.514.053.549.642m3592.013.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;/*标志数据区结束,分号必须单独一行*/run;15SAS中的常用变量类型数值型:不需特殊定义字符型:定义方式变量名$日期型:多种形式如:变量名mmddyy6.实际记录为距1960/01/01的天数其它数据库中的逻辑型、备注型变量在SAS中均为字符型变量。日期型变量转进SAS后一般也变为字符型变量。SAS数据集建立---用input和cards语句直接输入16dataa1;inputidx1$x2x3x4;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:OBSIDX1X2X3X411m3295.52.023m3389.012.5dataa1;inputidx1$x2x3;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:OBSIDX1X2X311m3295.522m3592.033m3389.0SAS数据集建立17不分行符@@的使用dataesr;inputx@@;/*每读入一天记录后,数据指针保持原位不换行,继续读下一条记录*/cards;39865573108104;procmeans;run;结果:AnalysisVariable:XNMeanStdDevMinimumMaximum----------------------------------------------------------126.50000002.54057973.000000010.0000000----------------------------------------------------------SAS数据集建立18缺失值的输入---以.表示,缺失值不进入分析datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;procmeans;run;SAS数据集建立19结果VariableNMeanStdDevMinimumMaximum--------------------------------------------------------------ID7184.5714286194.96397711.0000000521.0000000X2773.857142970.477960130.0000000178.0000000X36116.250000038.241012089.0000000168.0000000X4723.785714319.482593011.000000053.5000000X5759.285714314.736171947.000000082.0000000X6756.427142926.254044635.3900000100.1400000--------------------------------------------------------------SAS数据集建立20如已存在一纯文本文件c:\child.txt,内容如下:1m3295.514.053.549.642m3592.013.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42可用infile直接读入:Datachild;Infile‘c:\child.txt’;Inputidx1$x2x3x4x5x6;Run;SAS数据集建立---Infile和input语句21利用file下拉菜单中的import功能,可转入:文本型数据:空格分隔、逗号分隔、制表键分隔DbaseII和III数据库(*.dbf)Excel数据库(7.0版及以下,*.xls)。SAS8以上可转入Excel97及2000的数据库EpiInfo的数据可在EpiInfo中用export模块转成*.sas文件(SAS的程序文件),在edit窗打开后,加上run;语句后提交运行即可。有的数据可通过粘贴的方法贴到edit窗后,加入input和cards等语句,生成sas数据集。SAS数据集建立---从其他数据集转入22SAS数据集名称的表示方式:两级文件名库关联名.数据集名如work.esr,dw.esr(.sd2省略)库关联名代表硬盘上某一(子)目录,esr即放在该目录下定义库关联名:用libname命令格式:libname库关联名“盘符:\路径”;如:libnamedw‘c:\teach’;dw为库关联名,代表路径c:\teach;库关联名可任意取,一旦定义,只要不退出SAS,始终有效()。但路径必须实际存在SAS数据集建立---永久数据集和临时数据集23临时数据集:每次启动SAS时,会自动开辟一个临时存储区,用于存储data步或其它过程生成的SAS数据集。它库关联名为WORK,代表\sas\saswork子目录。一旦退出sas,临时存储区自动删除,存放在其中的数据集也会被自动删除。即\的sas\saswork子目录下的数据集被删除,称为临时数据集临时数据集的库关联名默认为work,均省略不写。如dataesr;(实际为work.esr)SAS数据集建立---永久数据集和临时数据集24永久数据集:通过两级文件名的形式,将生成的数据集存放到saswork以外的任意路径中(库关联名所指向的路径),即可以生成永久数据集,退出时不会被删除。如:libnamedw‘c:\teach’;datadw.esr;/*在c:\teach生成esr.sd2数据集*/inputx1x2x3;(略)退出SAS后再进入:libnameaa‘c:\teach’;库关联名一旦定义,它所代表的目录下所有SAS数据集均可使用,不必再定义。SAS数据集建立--
本文标题:SAS 系统是用于严肃数据分析和决策支持的大型集成式模块化软件包
链接地址:https://www.777doc.com/doc-5353077 .html