您好,欢迎访问三七文档
1一、常用的离散型概率分布、名称及自变量:分布R名称自变量•binomialB(n,p)binom(size,prob)•PoissonP(λ)pois(lambda)•GeometricGeo(p)geom(prob)•hypergeometrichyper(N,m,n)H(N,m,n)•negativebinomialnbinom(size,prob)NB(r,p)•multinomialmultinom(size,prob)第一节R与概率分布2•uniformU(a,b)unif(min,max)•Gaussian(normal)N(µ,2)norm(mean,sd)•ExponentialE(λ)exp(rate)•gammaГ(λ,β)gamma(shape,scale)•BetaBe((a,b)beta(shape1,shape2,ncp)•‘Student’t(n)t(df,ncp)•Fisher–SnedecorF(n1,n2)f(df1,df2,ncp)•Pearsonχ2(n)chisq(df,ncp)•Weibullrweibull(shape,scale)•Cauchycauchy(location,scale)•InversegammaInvgamma(shape,scale)•Logisticlogis(location,scale)•Log-normallnorm(meanlog,sdlog)分布R名称附加参数3二、R中概率分布的四种状态上述各类表示分布的函数前分别加•d——概率函数(分布列或概率密度)•p——分布函数•q——分位数•r——取随机数•pfunc(x,...)•qfunc(p,...)0p1)•rfunc(n,p1,p2,...)•dfunc(x,...)41.离散型随机变量取某个值的概率dbinom(5,20,0.2)#X~B(20,0.2),P(X=5)dpois(10,5)#X~P(5),P(X=10)2.计算随机变量在某区间内取值sum(dbinom(46:54,100,0.5)#X~B(100,0.2),P(46≤X≤54)或pbinom(54,100,0.2)-pbinom(45,100,0.2)pbinom(5,20,0.2)#X~B(20,0.2),P(X≤5)1-pbinom(5,20,0.2)#X~B(20,0.2),P(X5)sum(dpois(0:16,5)#X~P(5),P(0≤X≤16)pnorm(2)#X~N(0,1),P(X≤2)pnorm(184,170,6)#X~N(170,62),P(X≤184)5•qnorm(0.95)#标准正态的下0.95分位数.•qnorm(0.025)#标准正态的下0.025分位数.•qchisq(0.05,4)#自由度为4的卡方分布下0.05分位数.•qt(0.975,5)#自由度为5的t分布下0.975分位数.3.分位数:R中给的是下分位数(2)给定分位数(样本值),计算p值(1)求分位数•pnorm(1.65)#标准正态下分位数为1.65的p值.•pchisq(2,4)#n=4的卡方分布下分位数为2的p值.•pt(1,5)#n=5的t分布下分位数为1的p值.•pf(4.56,7,8)#F(7,8)下分位数为4.56的p值64.产生各种分布随机数•rbinom(100,20,0.2)#产生100个B(20,0.22)的随机数•rnorm(1000,170,6)#产生1000个N(170,62)的随机数•rnorm(1000)#产生1000个N(0,1)的随机数•runif(10000)#产生10000个U(0,1)的随机数78三、绘制概率分布图1.与概率分布作图相关的基本作图函数与参数(graphics)命令解释plot(x)以序号为横坐标,以x的元素值为纵坐标绘图plot(x,y)以x为横y为纵坐标绘图polygon(x,y)绘多边形barplot(x)x的条形图points(x,y)添加点lines(x,y)添加线curve(x)画曲线type=“p”指定图形的类型.p:点,l:线,b:点连线,o:点连线,线在点上,h:垂直线,s:阶梯式,垂直线顶端显示数据,S:垂直线底端显示数据abline(a,b)斜率为b截距为a的直线abline(h=y)/abline(v=x)水平线/垂直线9rect(x1,y1,x2,y2)绘长方形title()添加标题legend(x,y,legend=“”)在(x,y)处添加图例axis(side,…)画坐标轴,side=1画在下边,2左边,3上边,4右边usr(x1,x2,y1,y2)当前图上加边框box()当前图上加边框rug(x)在x轴上用短线标出x数据的位置locator(n,type=“n”,…)鼠标点击n次后返回n个位置的坐标,并按type划点或线text(x,y,expression(表达式))在图上加数学表达式text(x,y,as.expression(substitute()))在表达式中代入某个变量值text(x,y,labels,)在(x,y)处添加labels指定的文字mtext(text,side=3,line=0,…)在边空添加用text指定的文字,side指定添加在哪边,line指定添加文字距绘图区域的行数par()后续图形按par中设定参数绘制10xlim=,ylim=指定轴的上下限xlab=,ylab=坐标轴的标签,字符型值main=主标题,字符型值sub=副标题adj=控制文字对齐方式.0:左对齐,0.5:居中,1:右对齐bg=“”指定背景色col控制符号颜色font控制文字字体.1:正常,2:斜体,3:粗体,4:粗斜体las控制坐标轴刻度数字标记方向.0:平行于轴,1:横排,2:垂直于轴,3:竖排lty控制连线线型.1:实线,2:虚线,3:点线,4:点虚线,5:长虚线,6:双虚线,lwd控制连线宽度的数字pch指定绘制点时使用的符号cex指定符号相对于默认值的缩倍数mar控制图形边空.c(bottom,left,top,right)四个值add=FALSE/TTRUE时表叠加图形到前一个图上11R中的绘图命令高级图形函数R的图形函数分为两类:高级图形函数――直接绘制图形并可自动生成坐标轴等附属图形元素;低级图形函数――可以修改已有的图形或者为绘图规定一些选择项。高级图形函数总是开始一个新图。下面我们介绍常用的高级图形函数,以及用来修饰这些高级图形函数的常用可选参数。12例plot()函数(最常用的是泛型函数)。plot(x,y)(其中x,y是向量)对两个变量画散点图。用plot(z)(其中z是一个定义了x变量和y变量的列表,或者一个两列的矩阵)也可以达到同样目的。如果x是一个时间序列对象(时间序列对象用ts()函数生成),plot(x)绘制时间序列曲线图。如果x是一个普通向量,则绘制x的值对其下标的散点图。如果x是复数向量则绘制虚部对实部的散点图。如果f是一个因子,则plot(f)绘制f的条形图(每个因子水平的个数)。如果f是因子,y是同长度的数值向量,则plot(f,y)对f的每一因子水平绘制y中相应数值的盒形图。如果d是一个数据框,则plot(d)对d的每两个变量之间作图(散点图等)。13高级图形函数的常用选项高级图形函数有一些共同的选项,作为函数的可选参数(自变量)。例如:plot(x)plot(x,main=Graphofx)其中的main就是一个可选参数,用来指定图形的标题。没有此选项时图形就没有标题。这样的选项还有14add=T使函数象低级图形函数那样不是开始一个新图形而是在原图基础上添加。axes=F暂不画坐标轴,随后可以用axis()函数更精确地规定坐标轴的画法。缺省值是axes=T,即有坐标轴。log=xlog=ylog=xy把x轴,y轴或两个坐标轴用对数刻度绘制。type=•type=p•type=l•type=b•type=o•type=h•type=s•type=S•type=n规定绘图方式:•绘点•画线•绘点并在中间用线连接•绘点并画线穿过各点•从点到横轴画垂线•阶梯函数;左连续•阶梯函数;右连续•不画任何点、线,但仍画坐标轴并建立坐标系,适用于后面用低级图形函数作图。xlab=字符串“ylab=字符串main=字符串sub=字符串定义x轴和y轴的标签,缺省时使用对象名。图形的标题;图形的小标题,用较小字体画在x轴下方。15常见低级作图函数16例函数par()的常用参数17181920x=seq(0,20,1)pmf=dbinom(x,20,0.2)plot(x,pmf,type=“h”,main=“B(20,0.2)分布条状图”)x-0:20;p-0.2;barplot(dbinom(x,20,0.2),main=“B(20,0.2)分布柱状图”)2.离散性分布例二项分布B(n,p)条形图21密度函数x=seq(-5,5,0.01)plot(x,dnorm(x),type='l',xlim=c(-5,5),ylim=c(0,2),main='TheNormalDensityDistribution')curve(dnorm(x,1,0.5),add=T,lty=2,lwd=2,col=blue)lines(x,dnorm(x,0,0.25),lty=3,lwd=3,col=green)lines(x,dnorm(x,-2,0.5),lty=4,lwd=4,col=red)legend(topright,legend=paste(m=,c(0,1,0,-2),sd=,c(1,0.5,0.25,0.5)),lwd=3,lty=c(1,2,3,4),col=c(black,blue,green,red))3.连续型分布例正态分布2223分布函数set.seed(1)x-seq(-5,5,length.out=100)y-pnorm(x,0,1)plot(x,y,col=red,xlim=c(-5,5),ylim=c(0,1),type='l',lwd=4,xaxs=i,yaxs=i,ylab='density',xlab='',main=TheNormalCumulativeDistribution)lines(x,pnorm(x,0,0.5),lwd=4,col=green)lines(x,pnorm(x,0,2),lwd=4,col=blue)lines(x,pnorm(x,-2,1),lwd=4,col=orange)legend(bottomright,legend=paste(m=,c(0,0,0,-2),sd=,c(1,0.5,2,1)),lwd=1,col=c(red,green,blue,orange))2425带分位数密度图#画N(0,1)分布密度单尾带p值x=seq(-6,6,length=1000);y=dnorm(x)r1=-6;r2=-2;x2=c(r1,r1,x[xr2&xr1],r2,r2)y2=c(0,dnorm(c(r1,x[xr2&xr1],r2)),0)plot(x,y,type=l,ylab=DensityofN(0,1)),xlim=c(-5,5))abline(h=0);polygon(x2,y2,col=red)title(TailProbabilityforN(0,1))text(c(-3.1,-2),c(0.02,-.007),c(p-value=0.023,u=-2))26•set.seed(1)#卡方分布•x-seq(0,10,length.out=1000)•y-dchisq(x,1)•plot(x,y,col=red,xlim=c(0,5),ylim=c(0,2),type='l',•xaxs=i,yaxs=i,ylab='density',xlab='',•main=T
本文标题:R语言与概率分布
链接地址:https://www.777doc.com/doc-2856366 .html