您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > SAS学习系列08.-日期时间数据及数据格式
08.日期时间数据及数据格式(一)SAS日期和时间数据SAS将所有的日期转化成一个以1960年1月1日为起点的数值(日期数值)。比如:January1,19600January1,1959-365January1,1961366January1,202021915SAS处理日期数据包括:读取日期格式的数据,使用日期函数处理日期,按指定格式输出日期。一、读取日期格式的数据1.即按格式读入数据(formattedinput),见系列03。比如,inputBirthDateMMDDYY10.;2.设定默认的百年07/04/76这样的数据可能是1976,也可能是2076、1776。因此需要YEARCUTOFF=来指定一个一百年的第一年,默认的是1920年。例如,下面的语句就是告诉SAS将一个两位年份的日期解释为1960年到2049年之间:OPTIONSYEARCUTOFF=1950;3.SAS日期的存取日期一旦被以SAS以日期格式读取之后,就将此数据像其他数值数据一样用在表达式中(日期数值)。例如,像为图书馆的书设定21天的还书日期,只需要在借书日期上加上21:DueDate=CheckDate+21;通过引号和字母D,可以将一个日期当作常数来使用,下面的代码创建了一个EarthDay05的日期变量,其值等于April22,2005EarthDay05='22APR2005'D;二、使用日期函数处理日期SAS提供的日期函数使得处理日期的操作大大简便。例如,today()返回今天的日期;计算一本书应归还的剩余期限,就可以用:DaysOverDue=DateDue-today();用出生日期Birthdate计算年龄,可以用:CurrentAge=INT(YRDIF(BirthDate,TODAY(),'AGE'));三、按按指定格式输出日期按指定格式输出日期时,还需要将日期数值转换成日期。例如,下面的FORMAT语句告诉SAS用WORDATE18.格式打印日期变量BirthDate。formatBirthDateWORDATE18.;例1图书馆有借书卡数据,Dates.dat,包含持卡人姓名、出生日期、卡办理日期,到期日:读取数据,计算剩余期限(DaysOverDue);计算持卡人年龄(CurrentAge);接着用IF语句来判断一个卡是否为新卡,在2012年1月1日之后办理的,为新卡。代码:datalibrarycards;infile'c:\MyRawData\Library.dat'TRUNCOVER;inputName$11.+1BirthDateMMDDYY10.+1IssueDateANYDTDTE10.DueDateDATE11.;DaysOverDue=DueDate-TODAY();CurrentAge=INT(YRDIF(BirthDate,TODAY(),'AGE'));ifIssueDate'01JAN2012'DthenNewCard='yes';run;procprintdata=librarycards;formatIssuedateMMDDYY8.DueDateWEEKDATE17.;title'SASDateswithoutandwithFormats';run;运行结果:程序说明:(1)BirthDate变量没有指定输出格式,默认输出日期数值;(2)“ANYDTDTE10.”以各种格式(非单一格式)读入日期;(3)歧义日期值,例如01-02-03,可以用DATESTYLE=MDY来设置(默认是MDY)。四、时间数据1.SAS的时间数值(time),表示从当天零点开始到当前时间的秒数,大小介于0和86400之间。hms(h,m,s)——由小时h、分钟m、秒s生成SAS时间值;t1=‘8:45’T;——时间常数值赋值;hour(time);——返回时间数值的小时数;minute,second类似;2.SAS还有日期时间数值(datetime),表示从1960年1月1日零点到当前时刻的秒数。datetime对应的几种格式:30May2000:10:03:17.2DATETIME20.30May0010:03:17.2DATETIME18.30May2000/10:03DATETIME15.conn='01Feb2011:8:45'DT;——日期时间常数值赋值;dhms(d,h,m,s)——由SAS日期值d、小时h、分钟m、秒s生成SAS日期时间值;datepart(dt)——返回SAS日期时间值dt的日期部分;intnx(interval,from,n)——返回从from开始经过n个interval间隔后的SAS日期,其中interval可以取'YEAR'、'QTR'、'MONTH'、'WEEK'、'DAY'等;例如,intnx('MONTH','16Dec1997'd,3);结果为1998年3月1日。注意:它总是返回一个周期的开始值。intck(interval,from,to)——返回从日期from到日期to中间经过的interval间隔的个数,其中interval取'MONTH'等。例如,intck('YEAR','31Dec1996'd,'1Jan1998'd);返回两个日期的年间隔数,结果得2,尽管这两个日期之间实际只隔1年。(二)SAS日期时间格式、函数及示例日期时间格式:格式说明默认宽度ANYDTDTEw以各种格式读入(非单一格式)9DATEw.ddmmmyy或ddmmmyyyy7DDMMYYw.ddmmyy或ddmmyyyy6MMDDYYw.mmddyy或mmddyyyy例:01/01/1961(10.)6JULIANwJulian日期,yydddoryyyyddd5EURDFDDw.dd.mm.yy例:01.01.61(8.01.01.1961(10.)8WEEKDATEw.day-of-week,month-namedd,yyoryyyy例:Sunday(9.)Sunday,January1,1961(29.)29WORDDATEw.month-namedd,yyyy例:Jan1,1961(12.)January1,1961(18.)18TIMEw.dhh:mm:ss(8.)或hh:mm:ss.ss(11.2)8DATETIMEw.dddmmmyy:hh:mm:ss例:01JAN60:03:23(13.)01JAN60:03:23:02.0(18.1)16日期时间函数:datejul(day)将日期数值day转化为Julian日期值today()返回今天的日期数值mdy(mm,dd,yy)将月mm、日dd、年yy转化为日期数值day(date)返回日期数值的日month(date)返回日期数值的月(1-12)year(date)返回日期数值的年qtr(date)返回日期数值的季(1-4)weekday(date)返回日期数值是周几(1=星期日)yrdif(date1,date2,‘AGE’)计算两个日期的“年龄差”例:a=mdy(4,13,2000);b=mdy(8,13,2012);yrdif(a,b,'AGE');返回12.3342注:Julian日期:5位或7位,前2或4位是年,后3位为该年的第多少天,例如1960年2月1日是60032或1960032.(三)字符和数值格式1.字符格式:格式说明默认宽度$UPCASEw.转化为大写字母8$w.同$CHARw.标准格式字符(不忽略开头空格)12.数值格式:格式说明默认宽度w.d控制位宽,共占w位,其中d位小数无BESTw.SAS自动选择最佳数值格式(默认)12COMMAw.d逗号数值格式例:1,200,001(9.)1,200,001.00(12.2)6Ew.科学计数法例:1.2E+6(E7.)12PERCENTw.d百分数例:5.00%(PERCENT9.2)6DOLLARw.d美元金额:$开头+逗号数值格式例:$1,200,001.00(DOLLAR13.2)6EUROXw.d欧元金额:例:€1.200.001,00(EUROX13.2)6(四)自定义格式数据集中为了处理方便有时候用数字代表实际的变量值,比如1代表男性,2代表女性。这种代码在输出的时候不好解读,可以用procformat自定义格式,然后打印出想要的值。基本形式为:procformat;value格式名变量值1='输出形式1'变量值2='输出形式2'……变量值n='输出形式n';注:(1)若变量值是字符值,格式名前要加上$;(2)格式名长度不能超过32个字节(包括$),不能以数字结尾,除了下划线不能包含其他任何特殊符号。且名字不能与已有的格式名冲突;(3)输出形式必须放在单引号里,中间要想输出单引号,需要用两个单引号。例如,'employee’’sjobtitle'——employee’sjobtitle示例:'A'='Asia'1,3,5,7,9='Odd'500000-HIGH='NotAffordable'13-20='Teenager'0-HIGH='PositiveNonZero'OTHER='BadData'例2关于汽车公司客户的调查信息数据(C:\MyRawData\Cars0.dat)。包括客户年龄、性别(1为男性,2为女性)、每年收入、偏爱的汽车颜色:读取数据,并使用procformat自定义格式过程,为颜色、性别和汽车创建输出格式。代码:datacarsurvey;infile'c:\MyRawData\Cars0.dat';inputAgeSexIncomeColor$;procformat;valuegender1='Male'2='Female';valueagegroup13-20='Teen'20-65='Adult'65-HIGH='Senior';value$col'W'='MoonWhite''B'='SkyBlue''Y'='SunburstYellow''G'='RainCloudGray';*Printdatausinguser-definedandstandard(DOLLAR8.)formats;procprintdata=carsurvey;formatSexgender.Ageagegroup.Color$col.IncomeDOLLAR8.;title'SurveyResultsPrintedwithUser-DefinedFormats';run;运行结果:程序说明:(1)定义格式时,格式名后面没有句点,而在设定输出格式时,格式名后面带句点(表示位宽无小数位);(2)该代码是定义临时格式(默认存到临时逻辑库work),也可以另指定路径定义永久格式。
本文标题:SAS学习系列08.-日期时间数据及数据格式
链接地址:https://www.777doc.com/doc-4081963 .html