您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 常用分布与统计分析方法.
IntroductiontoStatistics----MathematicalModeling2008-7-12数学建模培训(概率统计模型部分)常用分布与统计分析方法IntroductiontoStatistics----MathematicalModeling2008-7-12概率统计的基本概念与常用的概率分布IntroductiontoStatistics----MathematicalModeling2008-7-12随机变量X(randomvariable)在自然界中,有些变量在每次观察前,不可能事先确定其取值;经过大量反复观察,其取值又有一定的规律,这种变量称为随机变量X。例(1).掷骰子出现某点数的概率为1/6,若掷100次,则出现该点数的次数X是随机变量;(2).1路公车每10分钟发一趟车,某人在随机的时间到达车站等车,则等车时间X是随机变量。1.随机变量、概率分布离散型随机变量X的所有可能取值是有限个或可列个。连续型随机变量最常见的一类非离散型随机变量。IntroductiontoStatistics----MathematicalModeling2008-7-12对连续型随机变量,考察事件{aXb}的概率。若存在非负的可积函数p(x),使得:对任意的a,b(ab),都有badxxpbXaP)(则称p(x)为随机变量X的概率密度函数。概率密度函数(PDF,probabilitydensityfunction)对所有随机变量X,可以定义以下的概率分布函数F(x):xdttpxXPxF)(xFxp)(1)(0)(dxxpxpP(x)的性质:IntroductiontoStatistics----MathematicalModeling2008-7-12常用的离散型分布二项分布(binomialdistribution)Bernoulli试验:连续n次独立地重复一个试验,每次试验结果只有两个不同的结果A和B,它们出现的概率分别是p和q,且p+q=1。设n重Bernoulli试验中事件A出现的次数为X,显然X为离散型随机变量。则X的概率分布为:nkqpCkXPknkkn,...,2,1,0称X服从参数为n,p的二项分布,记为X~B(n,p)。nkkXP,...,2,1,0010nnkknkknqpqpCIntroductiontoStatistics----MathematicalModeling2008-7-12Poisson分布(Poissondistribution)设X为离散型随机变量,X的概率分布为:,...2,1,00,!kkekXPk为常数,称X服从参数为的Poisson分布,记为X~P()。IntroductiontoStatistics----MathematicalModeling2008-7-12常用的连续型分布均匀分布(uniformdistribution)设X为连续型随机变量,X的概率密度为:其它值01bxaabxp称X在区间[a,b]上服从均匀分布,记为X~U(a,b)。显然有:abxxdxxpxXxPxx122121)(其中x1,x2[a,b],x1x2。IntroductiontoStatistics----MathematicalModeling2008-7-12指数分布(exponentialdistribution)设X为连续型随机变量,X的概率密度为:为常数其中0000xxexpx称X服从参数为的指数分布。IntroductiontoStatistics----MathematicalModeling2008-7-12分布(distribution)设X为连续型随机变量,X的概率密度为:0,00001xxexxpx其中,均为常数,称X服从参数为,的分布,记为X~(,)。01dtett正态分布(normal/Gaussiondistribution)(见后)IntroductiontoStatistics----MathematicalModeling2008-7-122.随机变量的数字特征均值(mean)或数学期望(mathematicalexpectation)离散型随机变量的均值设离散型随机变量X的分布律为:,...3,2,1,ipxXPii若1iiipxXE收敛,则称E(X)为随机变量X的均值或数学期望。xi:质点i的坐标;pi:质点i的质量E(X):质心坐标IntroductiontoStatistics----MathematicalModeling2008-7-12连续型随机变量的均值设X为连续型随机变量,它的概率密度函数为p(x),若dxxxpXE收敛,则称E(X)为随机变量X的均值或数学期望。小结:E(X)反映随机变量X的统计平均性质,代表随机变量取值的一般水平或集中的位置,略去了随机变量概率分布规律的具体细节。IntroductiontoStatistics----MathematicalModeling2008-7-12方差(variance)设随机变量X的均值为E(X),则:XDXXEXEXDX的标准差或均方差:的方差:2对于离散型随机变量X,其方差为:12iiipXExXD对于连续型随机变量X,其方差为:dxxpXExXD2IntroductiontoStatistics----MathematicalModeling2008-7-12计算D(X)的简单公式:22XEXEXD小结:D(X)反映随机变量X的相对于均值E(X)的偏离程度,代表随机变量取值的分散性,也是统计平均的性质。IntroductiontoStatistics----MathematicalModeling2008-7-123.总体和样本总体X(population)研究对象的某种特征值的全体组成的集合。用X表示。样本X1,X2,…,Xn(sample)在总体中选取部分有代表性的子集称为(随机)样本。一个样本是来自总体X的一组相互独立同X分布的随机变量。•样本值x1,x2,…,xn从总体X随机抽取的一组观测值,常用x1,x2,…,xn来表示样本或样本值。IntroductiontoStatistics----MathematicalModeling2008-7-124.统计量及其参数估计统计量(statisticalquantity)设X1,X2,…,Xn为总体X的一个样本,g(x1,x2,…,xn)为连续函数,则称g(x1,x2,…,xn)为一个统计量。显然,统计量g(x1,x2,…,xn)也是一个随机变量。总体X的数字特征——参数总体均值:刻划总体的平均取值总体方差2:刻划总体取值的分散(涨落)程度IntroductiontoStatistics----MathematicalModeling2008-7-12根据样本值推断总体性质——参数估计样本均值:niixnx11样本方差s:niixxns12211niixxns1221显然,样本均值、样本方差都属于统计量。通常用样本均值、样本方差作为总体均值、总体方差的无偏估计量。无偏估计:当n取得充分大,样本均值、样本方差分别逼近总体均值和总体方差。或(当n较大时)xIntroductiontoStatistics----MathematicalModeling2008-7-125.统计推断的两类问题——参数估计和假设检验参数估计问题假定总体X的分布函数形式已知,对其中的某些参数进行估计。估计方法:矩估计法、最小二乘法、最大似然法,……假设检验问题从样本值出发,判断关于总体分布的某种假设是否成立。假设检验问题举例为验证一硬币是否匀称(即正反两面出现的概率是否相等),做投掷试验。假定试验结果有以下两个:(1)正面55次,反面45次;(2)正面40次,反面60次。如何判断改硬币是否匀称?IntroductiontoStatistics----MathematicalModeling2008-7-121、提出原假设(或称零假设)和备选假设(或称对立假设)原假设:硬币匀称;备选假设:硬币不匀称2、指定显著性水平(一般取=0.05,0.01,…)值用以衡量(或拒绝)原假设成立所需证据的指标。值越小,否定原假设的条件越高,不容易否定原假设;值越大,否定原假设的条件越低,比较容易否定原假设。3、构造检验统计量WXi:第i次试验的结果,Xi=1表示出现正面,Xi=0表示出现反面1001)100(iiXY数次试验中出现正面的次)100(100次数次试验中出现正反面的YZ)100(差的绝对值次试验中出现正反面之ZYWIntroductiontoStatistics----MathematicalModeling2008-7-124、进行统计试验——收集数据、计算检验统计量及显著性概率值p假定已知检验统计量W的概率分布性质,如:04.0硬币2027.0硬币10匀称匀称WPpWPp5、根据显著性水平值进行判断对于第一个试验结果,p=0.27(=0.05),故硬币匀称假设成立;对于第二个试验结果,p=0.04(=0.05),故硬币匀称假设不成立;IntroductiontoStatistics----MathematicalModeling2008-7-126.正态分布(Normaldistribution)设随机变量X的概率密度为:xexpx22221)(其中-+,0均为常数。称X服从参数为,的正态分布,记作X~N(,2).:均值;:方差=0;2=1时,称为标准正态分布,记为X~N(0,1)。遵从正态分布的随机变量X,其正态分布函数为:xdtexXPxt22221)(IntroductiontoStatistics----MathematicalModeling2008-7-12正态分布的若干性质正态分布完全由其均值和方差2决定;正态分布的概率密度函数曲线呈对称的“钟形”;经验规则(3准则):9973.039545.026826.0xPxPxPIntroductiontoStatistics----MathematicalModeling2008-7-1268%95%99%++2+3--2-3p(x)x21IntroductiontoStatistics----MathematicalModeling2008-7-12回归分析方法(Regressionanalysis)IntroductiontoStatistics----MathematicalModeling2008-7-12变量与变量的关系:确定性关系函数关系U=IRv=gt变量与变量的关系:非确定性关系统计相关(具有统计规律)Y=f(x1,x2,…,xn)+……回归分析方法IntroductiontoStatistics----MathematicalModeling2008-7-12回归分析的基本问题Regression:therelationbetweenselectedvaluesofxandobservedvaluesofy(fromwhichthemostprobablevalueofycanbepredictedforanyvalueofx)寻求表达Y与x1,x2,…,xn的相关关系的经验回归
本文标题:常用分布与统计分析方法.
链接地址:https://www.777doc.com/doc-2451344 .html