您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 如何使用R软件[1]
语言入门一R软件简介二数字、字符与向量三对象和它的模式与属性四因子五多维数组和矩阵六列表与数据框七编写函数八R绘图一R软件简介R语言的由来R语言是从S语言演变而来的。S语言是二十世纪70年代诞生于贝尔实验室,由RickBecker,JohnChambers,AllanWilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,取得了巨大成功。1995年由新西兰Auckland大学统计系的RobertGentleman和RossIhaka,编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R软件简介R是开源软件,代码全部公开,对所有人免费。R可在多种操作系统下运行,如Windows、Linux和UNIX等。R需要输入命令,可以编写函数和脚本进行批处理运算,语法简单灵活。目前在R网站上约有两千多个程序包,涵盖了基础统计学、社会学、经济学、生态学、地理学、医学统计学、生物信息学等诸多方面。下载和安装RTheComprehensiveRArchiveNetwork简称CRAN,提供下载安装程序和相应软件包。R主页软件首页登陆界面(Windows版)菜单栏快捷按钮控制台命令行RGui的菜单介绍R程序包为什么要安装程序包?特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,往往要用到ape程序包,群落生态学vegan包等等。程序包是什么?R程序包是多个函数的集合,具有详细的说明和示例。Window下的R程序包是已经编译好的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。常用R程序包base-R基础功能包stats-R统计学包nlme-线性及非线性混合效应模型Graphics-绘图lattice-栅格图ape-系统发育与进化分析apTreeshape-进化树分析seqinr-DNA序列分析ade4-利用欧几里得方法进行生态学数据分析常用R程序包cluster-聚类分析ecodist-生态学数据相异性分析mefa-生态学和生物地理学多元数据处理mgcv-广义加性模型相关mvpart-多变量分解nlme-线性及非线性混合效应模型ouch-系统发育比较BiodiversityR-基于Rcmdr的生物多样性数据分析vegan-植物与植物群落的排序,生物多样性计算常用R程序包maptools-空间对象的读取和处理sp-空间数据处理spatstat-空间点格局分析,模型拟合与检验splancs-空间与时空点格局分析picante-群落系统发育多样性分析程序包使用在菜单栏程序包选择加载程序包…或者在控制台中输入如下命令:library()####()内为程序包名称调用程序包内的函数与R内置的函数调用方法一样查看帮助文件如何知道stats程序包内部都有哪些函数?最常用的方法:1菜单帮助Html帮助2控制台中输入library(help=stats)查看帮助文件1help(t.test)2?t.test3help.search(t.test)4apropos(t.test)5RGuiHelpR函数帮助(文本)…二数字、字符与向量赋值与注释在控制台中键入如下命令2+2a-2-也可用=,-代替b-2c-a+bc#注释赋值符号向量的运算数学运算运算后给出数值结果+,-,*,/,^比较运算运算后给出判别结果(TRUEFALSE),,=,=,==,!=逻辑运算与、或、非!,&,&&,|,||向量的运算R的函数每一个函数执行特定的功能,后面紧跟括号,例如:求和sum()绘图plot()排序sort()除了基本的运算之外,R的函数又分为高级和低级函数,高级函数内部嵌套了复杂的低级函数,例如plot()是高级绘图函数,函数本身会根据数据的类型,经过程序内部的函数判别之后,绘制相应类型的图形,并有大量的参数可选择。部分函数计算log(x)log10(x)exp(x)sin(x)cos(x)tan(x)asin(x)acos(x)min(x)max(x)range(x)length(x)统计检验mean(x)sd(x)var(x)median(x)quantile(x,p)cor(x,y)t.test()lm(y~x)部分函数统计检验lm(y~f+x)lm(y~x1+x2+x3)binom.testfisher.testchisq.testglm(y~x1+x2+x3,binomial)...缺失数据三对象和它的模式与属性对象的类型数值型Numeric如100,0,-4.335字符型Character如“China”逻辑型Logical如TRUE,FALSE因子型Factor表示不同类别复数型Complex如:2+3i四种类型的向量字符型character-c(China,Korea,Japan,UK,USA,France,India,Russia)数值型numeric-c(1,3,6,7,3,8,6,4)逻辑型logical-c(T,F,T,F,T,F,F,T)复数型略对象的类型的判断对象类型判断mode()class()is.numeric()#返回值为TRUE或FALSEis.logical()is.charactor()is.data.frame()对象的类型的判断对象类型转换as.numeric()#转换为数值型as.logical()as.charactor()as.matrix()as.dataframe()为对象起名R是区分大小写的,A与a是不同的。对象名不能用数字开头,但是数字可以放在中间或结尾。推荐用”.”作为间隔,例如anova.result1。举例:一个向量a,包含了四个元素,a-c(10,15,21,18)该向量为数值型,长度为4。保留名称(命名对象时不要与保留名称冲突):NA,NaN,pi,LETTERS,letters,month.abb,month.name对象的类别向量(vector)一系列元素的组合。因子(factor)因子是一个分类变量,如“a”,”a”,”a”,”a”,”b”,”b”,”b”,”c”,”c”数组(array)数组是k维的数据表。矩阵(matrix)矩阵是数组的一个特例,维数k=2。数据框(dataframe)是由一个或几个向量和(或)因子构成,它们必须是等长的,但可以是不同的数据类型。列表(list)列表可以包含任何类型的对象。四因子sex=c(M,F,M,M,F)sexf=factor(sex);sexf[1]MFMMFLevels:FM五多维数组和矩阵多维数组和矩阵dim()和matrix()x-1:12dim(x)-c(3,4)[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912matrix.x-matrix(1:12,nrow=3,byrow=T)为行或列添加名称:row.names()col.names()数组下标数组的运算+,-,*,/,^运算后给出数值结果数组的运算矩阵的运算矩阵的运算六列表与数据框列表与数据框物种数科数属数海拔坡度类型样方140152260025山顶样方251122635030山坡样方346112039045山坡样方438122426020低地样方549102522033低地行名Rownames字符串列名Columnnames每列可看做带名称的向量表1数据表、数据框与向量字符串、因素每行作为一个观测列表的创建列表可以是不同类型甚至不同长度的向量(数值型,逻辑型,字符型等等)、数据框甚至是列表的组合。list()例如list(character,numeric,logical,matrix)数据框的创建data.frame()#生成数据框d-data.frame(character,numeric,logical)cbind()#按列组合成数据框c.data-cbind(character,numeric,logical)rbind()#按行组合成数据框列表的创建list(1,matrix(2:9,nrow=2),估计,FALSE)-x;x[[1]][1]1[[2]][,1][,2][,3][,4][1,]2468[2,]3579[[3]][1]估计[[4]][1]FALSE列表的创建data.frame(x)X1X1.1X2X3X4X.估计.X.FALSE.112468估计FALSE213579估计FALSEm-cbind(1,1:3);m[,1][,2][1,]11[2,]12[3,]13引用数据框中的元素d-data.frame(a1,a2)$引用d$a1[,]方括号引用d[,1];d[5,]a1-c(5260,5470,5640,6180,6390)a2-c(3910,4220,3885,5160,5645)外部数据读取最为常用的数据读取方式是用read.table()函数或read.csv()函数读取外部txt或csv格式的文件。txt文件,制表符间隔csv文件,逗号间隔一些R程序包(如foreign)也提供了直接读取Excel,SAS,dbf,Matlab,spss,systat,Minitab文件的函数。read.table()的使用例:test.data-read.table(D:/R/test2.txt,header=T)header=T表示将数据的第一行作为标题。read.table(file=file.choose(),header=T)可以弹出对话框,选择文件。实例:从数据输入到t检验编号123456身高m1.751.801.651.901.741.91体重kg607257909572表2六名患者的身高和体重现有6名患者的身高和体重,检验体重除以身高的平方是否等于22.5。第一种方式:从控制台输入数据数据量较少时可以从控制台直接输入:height-c(1.75,1.80,1.65,1.90,1.74,1.91)weight-c(60,72,57,90,95,72)sq.height-height^2ratio-weight/sq.heightt.test(ratio,mu=22.5)第二种方式从外部读取数据数据量较大时用read.table函数从外部txt文件读取第1步将Excel中的数据另存为.txt格式(制表符间隔)或.csv格式。第2步用read.table()或read.csv()函数将数据读入R工作空间,并赋值给一个对象。在Excel中将数据存为txt文件实例:t检验(续)一般从txt文档读取数据。每一行作为一个观测值。每一行的变量用制表符,空格或逗号间隔开。read.table(”位置”,header=T)read.csv(”位置”,header=T)#从外部读取数据data1-read.table(d:/t.test.data.txt,header=T)bmi-data1$weight/data1$height^2t.test(bmi,mu=22.5)#t检验七编写函数编程基础R可以灵活的编写程序,用户自己编写的程序可以直接调用。R语言编程时无需声明变量的类型,这与C,C++等语言不同。基本格式function.name-function(x,y){表达式}函数内部也可用#添加注释程序流程控制ifif表达式的写法if(条件)表达式if(条件)表达式1else表达式2举例:if(p=0.05)print(“p=0.05!)elseprint(“p0.05!)循环for,whilefor(变量in向量)表达式for(iin1:10)print(i)while(条件)表达式i-1while(i10){print(i)i-i+1}函数举例定义函数:rcal-function(x,y){z-x^2+y^2;res
本文标题:如何使用R软件[1]
链接地址:https://www.777doc.com/doc-4562687 .html