您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > SAS基础与金融计算7
1SAS基础与金融计算游家兴厦门大学经济学院计统系2本节讲授内容SAS图表过程Procchart过程Procgchart过程3统计图对统计资料图形化处理就形成统计图,运用统计图形能直观地描述统计分布的特征和变量之间的关系。统计图有多种表现形式:1、直方图2、饼图3、折线图4、曲线图4回顾Procunivariatedata=studentplot;varheight;Run;获得三个图:1、茎叶图2、箱线图3、正态概率图5统计分组的相关概念根据统计研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组,称为统计分组。分组的性质来看:兼有分和合双重含义。6统计分组的步骤1.确定数据的全距(R):R=xmax-xmin(即最大变量值与最小变量值之差)2.确定组限、组距和组数(1)组限分为上限和下限,上限是各组的最大变量值,下限是各组的最小变量值。(2)各组上限与下限之差称为该组的组距。(3)组数是指某个变量数列划分为多少个组。说明:组数的多少与组距的大小成反比关系,组距越大,则可分的组就越少。7分组,应注意如下两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别——体现量变到质变的转化。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限——主要解决分多少组的问题。8组数的确定:与组距大小成反比以下是美国学者斯特杰斯经验公式:n=1+3.322lgN(n:组数;N:总体单位数)d=R/n=(Xmax-Xmin)/n(n为组数,d为组距,R为全距)9根据上述公式,可以得出如下的组数参考标准:分组组数参考表N15-2425-4445-8990-179180-359n56789上述数据仅供参考,不能生搬硬套,实际分组时要依所研究资料的性质而定。10SAS制图过程SAS统计制图过程均可以实现对样本分布特征的图形表示,一般情况下可以使用的有chart过程、plot过程、gchart过程和gplot过程。前两个和后两个只有一个字母“g”(代表graph)的差别,其实它们之间(只差一个字母g的过程之间)的统计描述功能是相同的,区别仅在于绘制出的图形的复杂和美观程度。11此外,还有一些较为复杂的制图命令,如运用G3D过程绘制曲面图,运用GCONTOUR过程绘制曲面对应的等高线图。例如,我们想绘制一个二维正态分布曲面的图形,假设(X,Y)服从联合正态分布,其均值都是0,方差分别为1和a,相关系数为r。12chart(或plot)与gchart(或gplot)chart过程和plot过程绘制的图形类似于我们用文本字符堆积起来的图形,只能概括地反映出资料分布的大体形状,实际上这两个过程绘制的图形并不能称之为图形,因为它没有涉及一般意义上图形的任何一种元素(如颜色、分辨率等)。而gchart过程和gplot过程给出的是真正意义上的图形,可以用很多的语句和选项来控制图形的各方面的性质和特征。13Chart(或gchart)与plot(或gplot)chart和gchart过程可以绘制出的图形主要有条形图(包括横条和竖条)、圆图、环形图和星形图等;plot和gplot过程通常用一个记录中的两个变量值表示点的坐标来绘制图形,如散点图和线图等。14gchart过程的一般格式Procgchart选项列表;图形关键词变量名称/选项列表;Run;此过程格式简单,复杂的地方在于图形关键字(每个图形关键字对应一种图形类型)所引导的语句,它是控制图形类型及图形要素的地方,涉及到众多的关键字和选项。15gchart过程可以使用的图形关键字及其所绘制的图形类型见下表:图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie圆图hbar水平的条形图pie3d三维圆图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图16图形关键字后的变量名用以指定进行图形描述时的分组变量,可以是数值型的(此时以各组的组中值为分组的标志),也可以是字符型的。选项列表中比较重要的有:(1)type=统计量关键字,表示图形对变量(sumvar所指定的变量)的哪一种统计量进行描述,比如频数(freq)、均数(mean)、总计(sum)、频数百分比(percentage)等;17(2)subgroup=变量名(分组变量),指定要进行分组(各组内再分组)的变量;(3)sumvar=变量名(数值变量),指定要进行统计计算的变量,也就是“type=统计量关键字”选项中统计量的计算所依据的变量。18下表为长沙市某大学160名正常成年女子2006年体检资料中的血清甘油三酯的测量结果(mmol/L)0.910.881.410.961.481.460.911.101.261.691.141.240.980.680.831.771.231.041.080.621.101.330.730.521.011.711.370.511.011.111.090.961.371.200.611.170.711.160.800.731.660.961.370.951.300.761.390.941.251.601.541.341.561.540.851.540.960.821.501.141.701.301.591.071.171.321.441.120.700.681.520.761.601.271.431.271.090.750.640.971.201.341.191.080.661.421.460.591.221.321.671.201.331.311.020.830.901.090.961.100.851.061.670.780.911.181.201.110.891.081.270.851.241.580.711.461.520.911.471.011.201.301.051.441.151.121.150.651.041.241.301.111.650.870.820.761.300.631.140.831.241.481.150.991.491.021.170.990.611.330.790.951.051.651.201.240.841.400.721.06试以直方图来表示上述资料的分布特征。19例1:单变量数据第一步:建立数据集;datatest;inputx@@;cards;0.910.881.410.961.481.460.911.101.261.691.141.240.980.680.831.77……………1.491.021.170.990.611.330.790.951.051.651.201.240.841.400.721.06;Run;双尾符,它表示为了执行下一个input语句,保持指针在这个输入的记录行上。比较有加双尾符和没加双尾符的区别。20第二步,进行初步的统计分析,确定分组的个数。Procunivariatedata=test;varx;Run;21所有160个观测值中,最大的为1.77,最小的为0.51,如果以0.1为组距,将所有观测值归入13个组。如果根据前面的斯特杰斯经验公式,则应将所有观测值归入8组。TheMEANSProcedureAnalysisVariable:xNMeanStdDevMinimumMaximum1601.13120.29450.51001.770022第三步,画图。procgchartdata=test;vbarx/type=freqlevels=13inside=freqspace=0width=6;run;Vbar语句表示我们要做的是竖立的条形图,其后跟的是作图所要依据的分类变量,这里我们以变量x来做直方图。斜杠后的内容是对所做条形图进行控制的选项,本段程序所涉及的各选项的含义和功能见下表。23各选项的含义和功能选项含义和功能type条图的类型,即用竖条的高度表示哪种统计量,可以是频数、百分比、均数、合计等levels分组的数目,如果变量为字符型则该选项无效。sumvar规定一个变量用来汇总概括数据特征的均值(mean)、总和(sum)或频数(freq)。inside将相应的统计量显示在竖条的内部,可显示频数、百分比、均数、合计等space指定竖条之间的距离,以字符宽度为单位(本例设为零,因为我们做的是直方图)width指定竖条的宽度,以字符宽度为单位24Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=freqspace=0width=6;Run;25Procgchartdata=test;vbarx/type=freqlevels=8sumvar=xinside=freqspace=0width=6;Run;26Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=0width=6;Run;27Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=5width=6;Run;28Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=0width=9;Run;29比较Procgchart与Procchart;比较vbar和hbar;Vbar用来列出用户想要画的垂直条形图的那些变量,每个图表变量对应一张垂直条形图;Hbar对列出的每个图变量生成水平的条形图。比较直方图与饼图。30Procgchartdata=test;hbarx/type=freqlevels=13;Run;31Procgchartdata=test;piex/type=freqlevels=13;Run;32Procgchartdata=test;piex/type=meansumvar=xlevels=13;Run;33Procgchartdata=test;piex/type=meansumvar=xlevels=5;Run;34专业性别人数题量财政男415财政男118财政女415财政男217财政男216财政女415财政女415财政女420财政女118税务女131网经男416财政女418财政男415财政男326税务女415税务女118税务女115财政男116财政男115网经女215税务男315网经男417税务女416税务男215税务女415财政男415网经男420财政女117财政女416财政女417财政女122网经男421财政男317财政男315财政女415财政女315财政男215税务男423税务女415税务女317税务女130网经女121税务男215财政女315税务女215财政女415网经女117例2:分组数据下表是财政系问卷设计资料汇总35第一步,建立数据集;Datascore;inputsubject$sex$num1num2;Cards;………;Run;Datascore;setscore;labelsubject='专业'sex='性别'num1='人数'num2='题量';Run;36Group语句Procgchart;vbarsubject/group=sexsumvar=num2type=mean;run;Num2表示题量。上述语句意思是:先按性别分两组,接着在每组中按专业进一步分三组,最后再将每组设计的题量的平均数列示出来。37Procgchart;vbarsubject/group=sextype=freq;run;Num2表示题量。上述语句意思是:先按性别分组,接着在每组中按专业进一步分组,最后再将每组包含的单位数列示出来。38Procgchart;vbarsex/group=subjectsumvar=num
本文标题:SAS基础与金融计算7
链接地址:https://www.777doc.com/doc-222147 .html