您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > SAS基础与金融计算5
1SAS基础与金融计算游家兴厦门大学经济学院计统系2上节课上机操作(1)对上节课生成的最终数据集total进行如下操作:(1)剔除金融业上市公司;(2)剔除每股收益为负的上市公司;(3)由于数据集中年涨跌幅采用百分比表示,建立一个新的变量,采用小数表示。(4)建立一个新的变量,表示除第一大股东外其它股东所持有的股份比例。3(1)剔除金融业上市公司第一步:运用substr语句Datatest;settotal;code=substr(code,1,6);Run;4第二步:Datatemp1;settest;ifcode='000562'orcode='000001'orcode='000563'orcode='600015'orcode='600016'orcode='600030'orcode='600036'orcode='600816'orcode='600000'orcode='601998'orcode='601328'orcode='601166'orcode='601318'orcode='601398'orcode='601628'thendelete;Run;5(2)剔除每股收益为负的上市公司Datatemp2;settemp1;ifeps0thendelete;Run;Datatemp2;settemp1;ifeps=0;Run;6(3)建立新变量:用小数表示的涨跌幅Datatemp3;settemp2;re2=re/100;Run;7(4)建立新的变量表示其它股东持股比例Datatemp4;settemp3;ratio2=1-ratio/100;Run;8本节课上机作业(2)公共信箱下载数据集test1和test2,运用SAS将test1和test2纵向拼成新的数据test。根据股票收益率大小将test分成四个组,并形成四个子数据集:tmp1,tmp2,tmp3,tmp4。在数据集test中,第一大股东持股比例在50%以上且每股收益超过1元的公司有多少家?9描述统计分析常见的数据统计描述量及意义(1)表示分布平均水平和位置的特征量:均值:数据的平均值—Mean众数:观测值中出现最频繁的数值—Mode中位数:观测值排序中处于中间位置的值—Median百分位数:中位数的推广—P1、P33、P9910(2)表示分布离散程度的特征量211()1niisxxn标准差Std方差2211()1niisxxnVar变异系数100sCvxCV标准误sStdeernSTDEER11(3)表示形状的特征量:偏度和峰度313()(1)(2)ixxngnns偏度(Skewness):偏度主要用于判断分布形状是否对称:若g1=0,则对称;若g10,则分布右偏(正偏);若g10,则分布左偏(负偏)。12峰度(Kurtosis):4224()(1)3(1)(1)(2)(3)(2)(3)ixxnnngnnnsnn峰度是以正态分布为比较标准。对于正态分布,g2=0;若g20,表示变量分布比正态分布更集中,分布呈尖峰状态,平均数的代表性较好;若g20,表示变量分布比正态分布更分散,分布呈平坦峰,平均数的代表性较差。13SAS中可以对数据进行描述统计分析的过程步有很多,其中两个最常用的过程步是:(1)MEANS过程(均值过程)(2)UNIVARIATE过程(单变量过程)14MEANS过程用来对数据集中的数值变量计算简单描述统计量。该过程由下列语句控制:PROCMEANS[options][statistics-keywords];VARvariables;BYvariables;CLASSvariables;OUTPUT[OUT=SAS-data-set][output-statistics];Run;1.MEANS过程15(1)PROCMEANS语句PROCMEANS[options][statistic-keywords][options]:DATA=SASdataset,即用以说明过程分析处理的数据集的名字,若省略,则用最近操作的SAS数据集;[statistic-keywords]:在MEANS过程中指出你需要计算哪些统计量。16N,MEAN,STD,MIN,MAX,SUM,Variance,CV,STDERR,T,PRT,Range,SKEWNESS,KURTOSIS,CLM,LCLM,UCLM,Maxdec…T:检验总体平均值是否为0的T统计量的值PRT:大于T的概率Maxdec=n:指定打印统计量的小数位的位数如省略不写,SAS将固定输入默认的最常见的几个统计量。该过程可计算如下统计量:17VARvariables规定要计算描述性统计量的数值变量及顺序。若省略该句,则对除BY、CLASS语句中列出的变量之外所有数值变量计算描述性统计量。(2)VAR语句18(3)BY语句BYvariables;使用BY语句可以用BY变量定义的观测组分别计算其相应的描述统计量。当使用BY语句时,要求输入数据集已按BY变量排序。(4)CLASS语句CLASSvariables;该语句和BY语句一样,可用CLASS变量定义的观测组分别计算其相应的描述统计量。不同点在于排序要求,CLASS语句不要求数据集事先已按CLASS变量排序。19(5)Freq语句Freqvariable;该语句指定一个数值型的变量,它的值表示输入数据集中相应观测出现的频数。该变量的值应为正整数。若变量值1或缺失,相应的观测不参加计算统计量。若这个值不是正整数,则取整数部分。20(5)Weight语句Weightvariable;该语句规定一个数值型的变量,它的值表示相应观测的权数。该变量的值应大于0。若变量值0或缺失,假定该值为0。21OUTPUT[OUT=SAS-data-set][output-statistics];该语句要求MEANS过程把计算的描述统计量输出到新的SAS数据集中,并用任选项规定新数据集的名及所包含的变量名。这里:OUT=SAS-data-set:给出由MEANS过程产生的输出数据集的名字,若想创建一个永久数据集,则必须规定一个两级名字,缺省时,机器默认的数据集名为data1等。Output-statistics:规定在新数据集中所要求的统计量,并规定存放这些统计量的变量名。(6)OUTPUT语句22Datastudent;inputclasssex$ageweightheight;cards;1f15461561f14411491m13481551m14381502m16551652f17501602f16601652m17651753f18651653f17581603m18701803m1768176;Run;例23Procmeansdata=student;varageweightheight;Run;Procmeansdata=studentmaxdec=2;varageweightheight;bysex;Run;观察以下几组程序24procmeansdata=studentmaxdec=2;varageweightheight;classsex;run;procmeansdata=studentmaxdec=2;varageweightheight;outputout=stan=nummean=a1a2a3std=b1b2b3max=c1c2c3;run;25libnamea'd:\sasdata';procmeansdata=studentmaxdec=2;varageweightheight;outputout=a.stan=nummean=a1a2a3std=b1b2b3max=c1c2c3;run;26本次课上机作业公共信箱下载数据集finance,进行如下操作:(1)计算市场平均股票收益率及其相应的标准差,并将结果生成一个新的数据集;(2)以公司规模为权重计算市场平均收益率;(3)将规模分为5组,分别计算各组的平均股票收益率。
本文标题:SAS基础与金融计算5
链接地址:https://www.777doc.com/doc-222144 .html