您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 数据模型与决策-31(连续分布)
数据、模型与决策丁邦俊13818068959dingbangjunmba@163.com第三讲连续分布连续概率分布及其应用概率密度函数累积分布函数均匀分布正态分布例:将1克盐放入茶杯,加水搅拌后,盐在水中是均匀分布的,如果从杯子里倒出半杯盐水,那么这半杯盐水中含有多少盐?(0.5克)盐在水中是均匀分布的,盐的密度是常数这里涉及到累积的概念例:一个班级30名学生考试成绩为:不及格2人、及格6人、中12人、良好7人、优秀3人,那么良好以上的多少人?(10人)概率密度函数收入频率50010001500200025000.100.050.150.200.25这是一条收入分布曲线,如果希望计算收入在1000元以下人口比例,只要求图中红色的面积。概率密度函数收入频率50010001500200025000.100.050.150.200.25ab如果希望计算收入在a、b之间的人口比例,只要求图中红色的面积。累积分布函数累积分布函数F(t)定义为:随机变量不大于t的概率,即举例:收入在a、b之间的概率收入频率0.100.050.150.20abp=F(b)-F(a)密度函数:区间[a,b]上的均匀分布的密度函数是常数,即f(t)=c(c是常数)均匀分布abC由于随机变量落在a、b内的概率=红色部分的面积=1,所以密度函数:区间[a,b]上的均匀分布的密度函数是常数,即f(t)=c(c是常数)均匀分布abC由于随机变量落在a、b内的概率=红色部分的面积=1,所以均匀分布均匀分布的分布函数:F(t)=图中红色的面积abCt正态分布221exp22xPX具有相同的标准差σ,不同的平均数μ(=-10,0和20)的正态曲线:具有相同的平均数μ,不同的标准差σ(=5和10)的正态曲线:正态分布2(,)N:均值;:标准差;2:方差。为研究中国人的体型分类与国家标准《服装号型》的制定问题,自1986至1990年历时5年,在我国不同地区共测量了5115个成年男子和5507个成年女子的身高。经计算,其平均数和标准差的值为:成年男子的身高:平均数167.48厘米,标准差6.09厘米。成年女子的身高:平均数156.58厘米,标准差5.47厘米。成年男子身高的分布2N(167.48,6.09)成年女子身高的分布2N(156.58,5.47)正态分布面积与概率PaxbP(aX≤b)bP(Xb)P(X≤a)ba正态分布的Excel函数命令输入“normdista,,,1”,则得2,PNa的值。输入“1normdistb,,,1”,则得2,PNb的值。输入“normdistb,,,1normdista,,,1”,则得2,PaNb的值。成年男子身高的分布2N(167.48,6.09),身高175厘米的成年男子高不高?输入“=1-normdist(175,167.48,6.09,1)”,身高超过175厘米的成年男子有10.845%成年女子身高的分布2N(156.58,5.47),175厘米的成年女子高不高?输入“=1-normdist(175,156.58,5.47,1)”,身高超过175厘米的成年女子有0.0379%正态分布正态分布的Excel函数命令输入“normdist,,,0a”,则得正态分布2,N的密度函数px在a处的值:密度22212apae。输入“norminv,,”,知道求得a,使得下面的等式成立:概率2,PNa。成年男子身高的分布2N(167.48,6.09),身高多高的成年男子算比较高?倘若认为20个成年男子中至多只有1人比他高的算比较高,这也就是说比他高的只有5%,比他矮的有95%。输入“=norminv(0.95,167.48,6.09)”,得临界值177.50厘米。正态分布标准正态分布)1,0(N:均值为0,标准差为1的正态分布称为标准正态分布。如果X服从正态分布),(N2,那么XZ服从标准正态分布)1,0(N。标准化变换xms一般正态分布SmXZ=1Z标准正态分布将一般正态分布转化为标准正态分布是常用的方法标准化的例子12.01052.6XZx=5=10一般正态分布6.2=1Z标准正态分布00.12.0478P(5X6.2)=?P(50Z0.12)=0.0478标准化的例子5=102.97.1X一般正态分布21.1051.721.1059.2XZXZ;0=1-.21Z.21.1664.0832.0832标准正态分布P(2.9X7.1)=?P(-0.21X0.21)=0.1664概率95%11.64标准正态分布N(0,1)概率5%0概率95%1–1.64标准正态分布N(0,1)概率5%0概率5%1–1.64标准正态分布N(0,1)概率5%1.64概率90%0标准正态分布的中间部分的概率标准正态分布与的值双尾概率中间部分的概率10.2080%1.28160.1090%1.64490.0595%1.96000.0199%2.575812200,1N3σ原则,经验法则若X服从正态分布),(N2,那么()68.26%PX;(22)95.44%PX;(33)99.72%PX。正态分布“68-95-99”法则为研究中国人的体型分类与国家标准《服装号型》的制定问题,自1986至1990年历时5年,在我国不同地区共测量了5115个成年男子和5507个成年女子的身高。经计算,其平均数和标准差的值为:成年男子的身高:平均数167.48厘米,标准差6.09厘米。成年女子的身高:平均数156.58厘米,标准差5.47厘米。成年男子身高的分布2N(167.48,6.09)成年女子身高的分布2N(156.58,5.47)成年男子与女子身高的分布成年女子身高的分布成年男子身高的分布175.28181.65159.68153.31163.59169.31149.57143.8580%80%9%9%9%9%1%1%1%1%若随机变量X有正态分布),(N2,则Xc有正态分布2N(c,)cX有正态分布22N(c,c)若随机变量1X有正态分布211N(,),2X有正态分布222N(,),1X和2X相互独立,则12XX有正态分布221212N(,)12XX有正态分布221212N(,)正态分布性质正态分布应用例某个学校想新建一个阅览室供900个学生自修,但规模有待确定(当然最大是900个座位),经过调研,每一个学生每天去阅览室的可能性为1/3,为了保证去的学生以95%的把握都有座位,试估计阅览室规模的大小。解:设座位数为n,去阅览室的人数为X,则有X=X1+X2+...+X900其中X1=0或1,0表示不去阅览室,1表示去阅览室于是,问题转化为解不等式:P(Xn)95%根据中心极限定理(P138),X为近似正态分布,再有随机变量的期望与方差公式,得到正态分布应用从而,P(Xn)95%得,n=323.26,取整为324案例分析5全国汽车租赁公司作业:P145,练习3.11谢谢!
本文标题:数据模型与决策-31(连续分布)
链接地址:https://www.777doc.com/doc-616999 .html