您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > SAS数据分析实验报告
数理与土木工程学院实验报告课程名称:《统计软件SPSS、SAS及实践》实验名称SAS数据分析实验报告系别数据科学系UN2758UN2758学号·班级·实验地点HE103实验日期·实验时数4指导教师袁鹏同组其他成员无成绩一、实验目的及要求1.了解SAS系统的基本知识及操作方法。2.学会运用SAS系统进行数据的处理与分析。3.熟练掌握SAS数据集的建立及SAS语句。二、实验环境及相关情况(包含使用软件、实验设备等)SAS、Word、Excel软件三、实验内容1、已知以下的数据和对应的变量分为:1)Account_ID;2)Revenue;3)Segment;4)N_var1;5)C_var1;6)Date;7)Location;8)Code;9)Amount;10001,5,G1,.,,2014-10-23,CHINA,APP_001,10010002,6,G1,.,,2014-10-23,CHINA,APP_002,11010003,.,G1,.,,2014-10-23,CHINA,APP_003,5010004,10,G2,.,,2014-10-23,CHINA,APP_004,9010005,15,G2,.,,2014-10-23,CHINA,CAN_005,1210006,13,G2,.,,2014-10-23,CHINA,MAN_006,1000010007,.,G2,.,,2014-10-23,CHINA,APP_007,1010008,20,G3,.,,2014-10-23,CHINA,APP_008,10010009,25,G3,.,,2014-10-23,CHINA,APP_009,20010010,.,G3,.,,2014-10-23,,REJ_010,10000010010,.,G3,.,,2014-10-23,,REJ_010,10000010010,.,G4,.,,2014-10-23,,REJ_010,10000010010,.,G5,.,,2014-10-23,,REJ_010,10000010003,7,G1,.,,2014-10-24,CHINA,MAN_003,5000010004,9,G2,.,,2014-10-24,CHINA,APP_004,9010006,6,G2,.,,2014-10-24,CHINA,MAN_006,100010007,.,G2,.,,2014-10-24,CHINA,APP_007,1010008,8,G3,.,,2014-10-24,CHINA,APP_008,10010009,9,G3,.,,2014-10-24,CHINA,APP_009,20010010,.,G3,.,,2014-10-24,CHINA,APP_010,10010010,10,G4,.,,2014-10-24,CHINA,APP_011,10110010,20,G5,.,,2014-10-24,CHINA,APP_012,102要求:①读取数据,并创建一个SAS数据集,命名为transaction;②基于数据集transaction,将变量“Revenue”中的缺失数据用其均值代替;③基于②,将取值全部缺失的变量删除。2、下面的每一行数据代表纸箱子的length,width,和height,单位是厘米。计算每一个箱子的体积、需要的纸板的面积(假定顶部和底部的纸板对折到中间,即:顶部和底部的厚度是两层纸板)。假定纸板的价格为$0.20/平方米。321812161524481232153045203036a)建立一个数据集合读入数据,变量为length,width和height;b)使用set语句,利用a)的数据集建立一个新数据集,它包括a)的所有数据,并建立三个新变量:每个箱子的体积(volume),制造费用(cost),以及每立方米体积的造价y(公式为:y=cost/volume)。c)使用b)建立的数据集建立一个新数据集,只包括其中的volume和cost变量。3、使用二手车数据(usedcar.sas7bdat,见data文件夹),a)对车的标志(brand)的频数画竖直条形图.b)画里程数(miles)和价格(price)的散点图,价格在竖轴上。c)自学means过程(见SAS过程文件夹),计算变量里程数(miles)和价格(price)的描述统计量。4、某地区单身人士的收入(y)和住房面积(x)的数据(data4.xls,见data文件夹)试分析:该地区单身人士的收入与住房面积之间是否相关?如果线性相关,确定一元线性回归方程,并做显著性检验。5、收集了我国居民消费价格指数(CPI)从2010年1月到2016年4月的数据(cpi.sas7bdat,见data文件夹),其中,CPI代表居民消费价格指数。试分析:①使用intnx命令在数据集中加入month变量,输出格式为monyy7.。②使用gplot过程作CPI对month的时序图;③用ARIMA过程建模,并预测我国2016年5月和6月的CPI。四、实验结果(附在后面页)五、实验总结(包括心得体会、问题回答及实验改进意见)SAS(StatisticalAnalysisSystem)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统。SAS软件在我们生活中起到了很多的作用:1.可以进行数据管理。2.可以数据输入、建库、保存。3.进行统计分析。4.t检验。5.方差分析。6.卡方检验。7.相关、回归。8.秩和检验。在学习过程中,一开始学习比较困难和吃力,很多知识都是刚刚接触,比较陌生,但随着老师讲解的深入和基础知识的逐步掌握,开始对SAS的使用开始比较灵活。希望在以后继续学习和运用,讲课堂中学到的知识可以很好的运用到实践当中去。六、教师评语1、完成所有规定的实验内容,实验步骤正确,结果正确;2、完成绝大部分规定的实验内容,实验步骤正确,结果正确;3、完成大部分规定的实验内容,实验步骤正确,结果正确;4、基本完成规定的实验内容,实验步骤基本正确,所完成的结果基本正确;5、未能很好地完成规定的实验内容或实验步骤不正确或结果不正确。6、其它:评定等级:优秀良好中等及格不及格教师:年月日实验结果(包括程序代码、程序结果分析)第一题:①读取数据,并创建一个SAS数据集,命名为transaction;datatransaction;infilecardsdlm=,;inputAccount_IDRevenueSegmentN_var1C_var1DateLocationCodeAmount;cards;10001,5,G1,.,,2014-10-23,CHINA,APP_001,10010002,6,G1,.,,2014-10-23,CHINA,APP_002,11010003,.,G1,.,,2014-10-23,CHINA,APP_003,5010004,10,G2,.,,2014-10-23,CHINA,APP_004,9010005,15,G2,.,,2014-10-23,CHINA,CAN_005,1210006,13,G2,.,,2014-10-23,CHINA,MAN_006,1000010007,.,G2,.,,2014-10-23,CHINA,APP_007,1010008,20,G3,.,,2014-10-23,CHINA,APP_008,10010009,25,G3,.,,2014-10-23,CHINA,APP_009,20010010,.,G3,.,,2014-10-23,,REJ_010,10000010010,.,G3,.,,2014-10-23,,REJ_010,10000010010,.,G4,.,,2014-10-23,,REJ_010,10000010010,.,G5,.,,2014-10-23,,REJ_010,10000010003,7,G1,.,,2014-10-24,CHINA,MAN_003,5000010004,9,G2,.,,2014-10-24,CHINA,APP_004,9010006,6,G2,.,,2014-10-24,CHINA,MAN_006,100010007,.,G2,.,,2014-10-24,CHINA,APP_007,1010008,8,G3,.,,2014-10-24,CHINA,APP_008,10010009,9,G3,.,,2014-10-24,CHINA,APP_009,20010010,.,G3,.,,2014-10-24,CHINA,APP_010,10010010,10,G4,.,,2014-10-24,CHINA,APP_011,10110010,20,G5,.,,2014-10-24,CHINA,APP_012,102;run;proctransposedata=transactionout=a;var_all_;run;Obs_NAME_COL1COL2COL3COL4COL5COL6COL7COL81Account_ID10001100021000310004100051000610007100082Revenue56.101513.203Segment........4N_var1........5C_var1........6Date2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-7LocationCHINACHINACHINACHINACHINACHINACHINACHINA8CodeAPP_001APP_002APP_003APP_004CAN_005MAN_006APP_007APP_0089Amount1001105090121000010100ObsCOL9COL10COL11COL12COL13COL14COL15COL16COL171100091001010010100101001010003100041000610007225....796.3.........4.........5.........ObsCOL9COL10COL11COL12COL13COL14COL15COL16COL1762014-10-2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-2014-10-7CHINACHINACHINACHINACHINA8APP_009REJ_010REJ_010REJ_010REJ_010MAN_003APP_004MAN_006APP_00792001000001000001000001000005000090100010ObsCOL18COL19COL20COL21COL2211000810009100101001010010289.10203.....4.....5.....62014-10-2014-10-2014-10-2014-10-2014-10-7CHINACHINACHINACHINACHINA8APP_008APP_009APP_010APP_011APP_0129100200100101102②基于数据集transaction,将变量“Revenue”中的缺失数据用其均值代替;dataa;seta;arrays(*)aa1-aa2;n=n(ofs(*));mean=mean(ofs(*));sum=sum(ofs(*));doi=1todim(s);ifs(i)=.thens(i)=mean;end;run;procprint;run;Obs_NAME_COL1COL2COL3COL4COL5COL6COL7COL8COL91Account_ID1000110002100031000410005100061000710008100092Revenue5611.64285714310151311.642
本文标题:SAS数据分析实验报告
链接地址:https://www.777doc.com/doc-6007943 .html