您好,欢迎访问三七文档
很全的sas基础知识SAS里面的PROC一览TheACECLUSProcedure:聚类的协方差矩阵近似估计(approximatecovarianceestimationforclustering)TheANOVAProcedure:方差分析TheBOXPLOTProcedure:箱形图TheCALISProcedure:结构方程模型TheCANCORRProcedure:典型相关分析TheCANDISCProcedure:主成分分析和典型相关分析TheCATMODProcedure:类别分析TheCLUSTERProcedure:聚类分析,包括11种(averagelinkage,thecentroidmethod,completelinkage,densitylinkage(includingWong’shybridandth-nearest-neighbormethods),maximumlikelihoodformixturesofsphericalmultivariatenormaldistributionswithequalvariancesbutpossiblyunequalmixingproportions,theflexible-betamethod,McQuitty’ssimilarityanalysis,themedianmethod,singlelinkage,two-stagedensitylinkage,andWard’sminimum-variancemethod,机器翻译为:平均联动,重心法,完全连锁,密度连接(包括Wong混合模型,最近邻的方法),最大的可能性,McQuitty的相似性分析,中位数法,单联动,两阶段密度联动,Ward最小方差法)。TheCORRESPProcedure:简单的对应分析和多元对应分析(MCA)TheDISCRIMProcedure:生成分类器的判别标准TheDISTANCEProcedure:距离,不相似或相似性分析TheFACTORProcedure:因子分析和因子旋转TheFASTCLUSProcedure:快速聚类分析(给定计算出来的距离)TheFREQProcedure:频率统计TheGAMProcedure:广义可加模型TheGENMODProcedure:广义线性模型,泊松回归、贝叶斯回归等TheGLIMMIXProcedure:generalizedlinearmixedmodels(GLMM),广义线性混合模型TheGLMProcedure:最小二乘法模型,包括回归、方差、协方差、多元方差分析、偏相关。TheGLMMODProcedure:广义线性模型设计TheGLMPOWERProcedure:预测力和样本大小的线性模型分析TheGLMSELECTProcedure:变量选择,包括Lasso和LAR等。TheHPMIXEDProcedure:线性混合模型,包括固定效应、随机效应等。TheINBREEDProcedure:协方差或近亲繁殖系数。TheKDEProcedure:单变量和二元核密度估计TheKRIGE2DProcedure:二维克里格法,包括各向异性和嵌套的半方差图模型TheLATTICEProcedure:简单的栅格设计实验的方差分析和协方差分析TheLIFEREGProcedure:生存分析中的参数模型,包括各种截尾数据TheLIFETESTProcedure:生存分析的相关检验TheLOESSProcedure:非参数模型、多维数据、支持多因变量、直接和插值的kd树、统计推断、自动平滑参数的选择、执行迭代时有异常值的数据。TheLOGISTICProcedure:logit回归TheMCMCProcedure:MarkovchainMonteCarlo(MCMC)simulation-马尔可夫链蒙特卡洛模拟TheMDSProcedure:Multidimensionalscaling(MDS)-多维标度模型TheMIProcedure:缺失值处理TheMIANALYZEProcedure:缺失值分析TheMIXEDProcedure:混合线性模型,面板数据的常用模型TheMODECLUSProcedure:各种参数、非参数的聚类模型TheMULTTESTProcedure:多重检验的p值调整TheNESTEDProcedure:嵌套的随机效应模型(nestedrandomeffectsmodel)TheNLINProcedure:非线性回归模型TheNLMIXEDProcedure:非线性混合模型(固定效应和随机效应都是非线性的)TheNPAR1WAYProcedure:位置和规模差异的非参数检验TheORTHOREGProcedure:更精准的广义线性模型(Gentleman-Givens变换来求解QR分解)ThePHREGProcedure:Coxproportionalhazardsmodel-Cox比例风险模型ThePLANProcedure:因子实验设计ThePLSProcedure:partialleastsquares(PLS)-偏最小二乘法ThePOWERProcedure:模型能力和样本量分析ThePowerandSampleSizeApplication:桌面版的能力和样本量分析程序ThePRINCOMPProcedure:主成份分析ThePRINQUALProcedure:定质,定量,或混合数据的主成分分析(PCA)ThePROBITProcedure:probit回归TheQUANTREGProcedure:分位数回归TheREGProcedure:最小二乘回归TheROBUSTREGProcedure:稳健回归(剔除离群点影响)TheRSREGProcedure:二次响应回归模型TheSCOREProcedure:打分TheSEQDESIGNProcedure:临床试验的中期设计TheSEQTESTProcedure:临床试验的中期分析TheSIM2DProcedure:高斯随机场的空间模拟(anisotropicandnestedsemivariogrammodels)TheSIMNORMALProcedure:生成高斯分布的模拟数据TheSTDIZEProcedure:标准化数据TheSTEPDISCProcedure:逐步回归(变量选择)TheSURVEYFREQProcedure:单向或者多向频率和交叉表的抽样调查数据分析TheSURVEYLOGISTICProcedure:抽样调查的logit回归TheSURVEYMEANSProcedure:抽样调查数据的概要统计TheSURVEYREGProcedure:抽样调查数据的回归分析TheSURVEYSELECTProcedure:选择基于概率的随机样本TheTCALISProcedure:结构方程模型(目测是CALIS的加强版)TheTPSPLINEProcedure:补偿最小二乘法来拟合非参数回归模型TheTRANSREGProcedure:transformationregression(一系列基于最小二乘法的变换)TheTREEProcedure:树状图TheTTESTProcedure:各种情况下的t检验TheVARCLUSProcedure:不相交或分层聚类TheVARCOMPProcedure:含有随机效应的广义线性模型TheVARIOGRAMProcedure:二维空间数据的连续性分析5.1SAS表达式简介1.SAS常数表达式(1)数值常数如:1.23、-5、0.5E-10。(2)字符常数如:name1='TOME'、name2='MARY'、name3='JOHN'。(3)日期(d)、时间(t)、日时(dt)常数如:d1='01JAN80'd、t1='9:25:19't、dt1='18JAN80:9:27:05'dt。(4)16进制常数(略)2.SAS运算符(1)前缀算符与后缀算符前缀算符,即正号或负号;如:+Y;-25;-COS(30);+(X*Y);后缀算符,即两个运算对象之间的运算符号,如:1+9;4-2;68。(2)只含一个运算符的简单表达式(Ⅰ组)和含有多于一个运算符的复合表达式(Ⅱ组)Ⅰ组,如:A+B;C-D;E*F;G/H;Ⅱ组,如:1-EXP(N/(N-1));100-LOG(N*(N+1));(3)操作运算的顺序求一个复合表达式的值时,其操作运算的顺序和优先级遵从如下的规则(见表5.1):表5.1SAS的运算符及其在运算顺序上的优先级━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━优先级组别运算符号等价表示运算符号含义之说明━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━第0组()括号第1组**+-乘方,正数,负数^NOTMINMAX逻辑非,最小,最大第2组*/乘,除第3组+-加,减第4组‖或||字串连接第5组=LTLE小于,小于等于=^=EQNE等于,不等于=GEGT大于等于,大于IN等于一列元数中的某一个第6组&AND逻辑与第7组|或|OR逻辑或━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━各组的计算顺序分别为:第0组由内向外;其他各组均自左至右。第4组和第7组都给出了两种运算符号,这是因为不同的系统可能只认识其中的某一种5.2SAS函数简介SAS软件中共有13类147个SAS函数,现将其中最常用者的用法作一扼要介绍。1.算术函数(1)求一个数的绝对值的函数ABS和求一个正数的算术平根的函数SQRT如求-250的绝对值的语句为x=ABS(-250)、求625的算术平根的语句为y=SQRT(625)。(2)求若干个数的最大值的函数MAX和最小值的函数MINDATA;a1=2;a2=-9;a3=15;a4=-23;x=MAX(ofa1-a4);y=MIN(ofa1-a4);FILEPRINT;PUTxy;RUN;程序运行结果为∶x=15、y=-23。2.截取函数(1)取一个数的整数部分的函数INT、按规定舍入精度取一个数的近似值的函数ROUND;(2)取≥自变量的最小整数的函数CEIL、取≤自变量的最大整数的函数FLOORDATA;运行结果a=INT(223.456);b=ROUND(223.456,100);a=223b=200c=ROUND(223.456,10);d=ROUND(223.456,1);c=220d=223e=ROUND(223.456,0.1);f=ROUND(223.456,0.01);e=223.5f=223.46g=CEIL(2.4);h=CEIL(-2.4);i=FLOOR(2.4);j=FLOOR(-2.4);g=3h=-2FILEPRINT;PUTabcdefghij;RUN;i=2j=-33.数学函数(1)以e为底的指数EXP、自然对数LOG(以e为底)、以2为底的对数LOG2和常用对数函数LOG10(以10为底)DATA;a=2;b=2.718281828;c=10;w=EXP(a);x=LOG(b);y=LOG2(a);z=LOG10(c);FILEPRINT;PUTwxyz;RUN;程序运行结果为∶w≈7.389056、x≈1、y=1、z=1。(2)正弦SIN、余弦COS、正切TAN以及它们的反函数ARSIN、ARCOS、ATANu=SIN(a);v=COS(a);w=TAN(a);这里a的单位是弧度,u,vw是实数;x=ARSIN(b);y=ARCOS(b);z=ATAN(b);这里b是实数,x,y,z是弧度。4.概率函数(1)泊松函数POISSON和二项概率函数PROBBNML求概率P=∑nj=0e-λ(λj/j!),函数的格式是:POISSON(λ,n),当λ=1、n=2时,程序为:DATA;P=POISSON(1,2);FILEPRINT;PUTP
本文标题:sas基础知识
链接地址:https://www.777doc.com/doc-2857157 .html