您好,欢迎访问三七文档
统计软件(SAS)天津财经大学统计学系统计软件课程租统计科学与科学统计Lies,damnedlies,andstatistics.一句著名的西方谚语。主要描述数字的说服能力,特别是用来讽刺一些使用统计数字支持、但毫无说服力的分析报告,以及人们倾向于贬低那些不支持其立场的统计结论。——摘自维基百科统计科学与科学统计其名言部分来自19世纪英国首相本杰明·迪斯雷利,此后经美国著名文豪马克·吐温之笔,被广泛传诵,原句载马克·吐温的《我的自传》:“(统计)数字经常欺骗我,特别是我自己整理它们时候。在此类情况下本杰明·迪斯雷利的评述经常正确有效:“世界上有三种谎言:谎言,该死的谎言,统计数字。”(Therearethreekindsoflies:lies,damnedlies,andstatistics.)”。但其原句并没有发现在本杰明·迪斯雷利的演说稿或者其他作品中。——摘自维基百科第一章导言一、统计的科学性(一)统计推断的基本内容:1.点估计待估参数β的点估计量为β2.区间估计以点估计值为中心确定误差范围β±△3.确定信度确定误差范围的置信概率(二)统计为什么存在谬误:1.真实的谎言使用违反数据特性的统计方法。2.对谎言求真没有取得真实数据3.用谎言制造谎言制造数据二、统计软件可以做什么统计计算数据管理数据挖掘统计调查三、如何用统计软件进行计算1.根据菜单提示进行选择工作2.人机互动式工作3.编程进行程序式工作输入处理输出四、为什么要使用统计软件统计软件的使用过程,不是简单的输入数据,取得结果。而是在统计学理论指导下,实现统计思想的系统过程,。例1-1:散户投资者股票收益的均值检验。例1-2:散户投资者与大户投资者股票收益的均值检验SAS系统22:24Monday,July22,20101VariableMethodVariancesDFtValuePr|t|xPooledEqual181.740.0996xSatterthwaiteUnequal171.740.1005EqualityofVariancesVariableMethodNumDFDenDFFValuePrFxFoldedF991.620.4838五、常用的统计软件1.常用的统计软件SASSPSSBMDPStataEPINFOMinitabStatisticaS-PLUSR六、SAS软件简况发展历史:1966年开始研制1976年由美国SAS公司实现商业化1985年推出PC版本2006推出版本为V9客观评价国际公认的最优秀统计软件最昂贵的统计软件应用领域:统计、金融、商业、经济、社会、医学、生物、教育等。SASV9主要产品SAS/BASE(基础)——初步的统计分析SAS/STAT(统计)——广泛的统计分析SAS/QC(质量控制)——质量管理方面的专门分析计算SAS/OR(规划)——运筹决策方面的专门分析计算SAS/ETS(预测)——计量经济的时间序列方面的专门分析计算SAS/IML(矩阵运算)——提供了交互矩阵语言SAS/GRAPH(图形)——提供了许多产生图形过程并支持众多图形设备SAS/ACCESS(外部数据库接口)——提供了与大多数流行数据库管理系统的方便接口并自身也能进行数据管理SAS/ASSIST(面向任务的通用菜单驱动界面)——方便用户以菜单方式进行操作SAS/AF(面向对象编程的应用开发工具)第一章SAS入门一、SAS安装和启动二、SAS的工作窗口PROGRAMEDIT:程序窗口LOG:监视窗口OUTPUT:输出窗口GRAPH:图形窗口EXPLORER:环境窗口1.程序窗口这是一个全屏幕程序编辑窗口,用户在这个窗口输入要运行的程序,使用SAS系统提供的编辑工具对程序进行修改、运行、调试。当执行运行(提交)程序命令时,该窗口的程序被执行。2.监视窗口该窗口记录了SAS程序运行过程的主要信息。如程序语句的语法错误,运行中的逻辑错误和警告信息,使用和建立的数据集、库文件,程序运行时间等。这些信息为程序调试提供了帮助。3.输出窗口该窗口用于显示程序的统计分析结果,还可以在该窗口对计算结果进行输入、输出、编辑、修改,以及文件格式转换等操作。该窗口由被执行的SAS程序自动调出。4.图形窗口该窗口用于显示程序的图形分析结果,还可以在该窗口对计算结果进行输入、输出、编辑、修改等操作。该窗口由被执行的SAS程序自动调出。5.环境窗口该窗口用于显示程序所在系统的文件目录结构。此外,该窗口还记录了每次程序的运行结果。例:熟悉SAS窗口参考程序example三、SAS程序的结构与语法1.程序结构:SAS程序采用模块化结构,模块间相互独立,每个模块完成一个任务。模块分两种类型,数据模块和程序模块。数据模块以英文单词Data为起始,程序模块以Proc(Pprocedure的缩写)为起始。模块通常用语句“run;”作为结束。一个程序中可包含多个数据模块和程序模块。程序实例Dataa;inputx@@;cards;6.111.041.302.603.515.205.411.823.642.213.383.77Run;Procunivariatedata=anormalplot;varx;Run;2.程序语法标识符或数据之间用空格分隔,例如:inputs$;使用分号分隔语句;使用“Run”分隔模块;自定义名称最多包含8个符号,首字符为英文字母,名称不能有保留符号,如:空格-.,;…$等;缺失数据“.”表示;文本变量名首次出现时使用“$”作为后缀;程序可以包含注释语句,以“/*”开始,以“*/”结束,或以“*”作为行始符表示该行为注释语句;除数据外,SAS程序不区分英文字母大小写。例:找出程序中的语法错误Dataainputx-1,x-2,y’@@;CarDs;6.111.041.302.603.515.205.411.823.642.213.383.77;Procunivariatedata=anormalplot;varx;;四、SAS运算符号算术运算符号名称符号例子加号+A=X+Y+Z减号-B=X-Y-Z乘号*C=X*Y*Z除号/D=X/Y乘方**E=X**2关系运算符号名称符号例子等于=A=X+Y+Z不等于^=B^=X-Y-Z大于CX*Y*Z小于DX/Y大于等于=E=X+Y+Z小于等于=F=X+Y+Z属于INGIN(XYZ)逻辑运算符号名称符号例子与&(AND)AB&BC或ABANDBC或|(OR)B=1|B=2或B=1ORB=2非^(NOT)^C=0或NOTC=0五、SAS程序调试(注:参考程序example)第二章SAS数据文件操作一、数据文件基本知识1.文件的逻辑结构与物理结构OBSFPUGNPFZHU1996236146.97451997241152.42561998245266.40651999248773.96862000251794.29992.名词解释文件:数据的集合;记录的集合;记录:关于一个实体的信息集合。一次统计观测可能对应一个记录,也可能对应多个。对应多记录时应使用关系连接记录。字段:各记录相同数据项的集合。一个字段通常对应一个变量,或统计观测的一个指标。索引:用于记录分类的标识字段或字段组合。关键字:用于唯一标识记录的字段或字段组合。二、数据文件的基本操作建立:在内存或外存中存储数据文件输出:显示数据文件的逻辑结构投影:从文件中选择出所需要的字段(变量)。筛选:从文件中选择出所需要的记录。投影和筛选可以组合使用。垂直连接:两个或多个文件按字段对应关系纵向连接,目的是增加样本量。水平连接:两个或多个文件按记录对应关系横向连接,目的是增加变量。1.建立文件基本工作要点:说明文件名说明变量包括变量名称、类型、排列顺序、格式等信息说明。说明数据位置并为变量赋值(1)建立临时文件dataexample;数据文件名inputs$xyz;输入语句cards;A123数据区B456C789run;临时文件特点:建立简单、存储在内存、不共享。(2)建立永久文件libnamep“c:\mydir”;定义库(路径)datap.example;inputs$xyz;cards;A123B456C789run;注:c:\mydir为已经建立的磁盘文件目录。文件特点:存储在外存、共享。(3)数据导入读取异质数据文件。PROCIMPORTOUT=WORK.aaDATAFILE=D:\sasv9\data\Book1.xlsDBMS=EXCEL2000REPLACE;SHEET=Sheet1$;GETNAMES=YES;RUN;读取文本格式数据文件语句:infile“c:\mydir\a.txt”firstobs=ndlm=“c”;dataexample;infile“c:\mydir\a.txt”firstobs=2;inputs$xyz;run;格式化输入——紧凑格式dataexample;inputs$xyz@@;cards;A123B456C789run;格式化输入——固定列格式dataexample;infile“c:\mydir\a.txt”;inputs$1-5x8y10-12z13-15;run;2.输出文件Procprintdata=example;Varxyzs$;Run;输出结果:123A456B789C3.投影学号姓名班级电话家庭年收入(万元)20070001李明统计0701130222620070002张华统计0701130223720070003林红精算0701130224520070004王成精算07011302256学号家庭年收入(万元)200700016200700027200700035200700046SAS的投影命令Dataexample(keep=snm);infile“c:\sasv9\data\a.txt”;inputsn$n$c$t$m;*dropn$c$t$;Run;4.筛选学号姓名班级电话家庭年收入(万元)20070001李明统计0701130222620070002张华统计0701130223720070003林红精算0701130224520070004王成精算07011302256学号姓名班级电话家庭年收入(万元)20070001李明统计0701130222620070002张华统计07011302237SAS的筛选操作Dataexample;infilec:\sasv9\data\a.txt”;inputsn$n$c$t$m;ifc^=”统计0701”thendelete;Run;5.垂直连接学号班级家庭年收入(万元)20070001统计0701620070002统计0701720070003精算0701520070004精算07016学号班级家庭年收入(万元)20070005精算0702220070006精算070230学号班级家庭年收入(万元)20070001统计0701620070002统计0701720070003精算0701520070004精算0701620070005精算0702220070006精算070230SAS的垂直连接操作Libnamepd:\mysasDataexample;setp.f1p.f2;Run;注:f1和f2已存在6.水平连接例:文件f1记录了学生基本情况,文件f2来自对学生支出情况的调查,请对学生消费情况进行统计分析。学号姓名家庭年收入成绩名次20070001李明61920070002张华7620070003林红53120070004王成623学号项目月支出/元20070001饭费30020070001通讯3020070001交通2020070001网络5020070001旅游30连接结果学号姓名项目月支出/元家庭年收入成绩名次20070001李明饭费30061920070001李明通讯3061920070001李明交通2061920070001李明网络5061920070
本文标题:SAS教程(金融)
链接地址:https://www.777doc.com/doc-222150 .html