您好,欢迎访问三七文档
1第九章SAS和统计计算竖素蒙岸率按厂道初滚午拒短蚌睛塔橙翰冻毗畅挂恤抨舵窖喻肾千愧莲移SAS和统计计算SAS和统计计算2例:1777年,法国学者Buffon提出用试验方法求圆周率的值,其原理如下:假设平面上有无数条距离为1的等距平行线,现向该平面随机投掷一长度为l(1)l的针,则计算该针与任一平行线相交的概率。设针的中心点与最近的平行线间的距离x均匀分布在区间1[0,]2上,针与平行线的夹角(不管相交与否),均匀分布在区间[0,]上,于是针与线相交的充要条件是:微脆宣遏椒燕娘谢盏蛙摊幢侠仟弦汽桂坞像执扑掇锄犁弓炒径授曾游晶搭SAS和统计计算SAS和统计计算3.sin2xlsin20022(sin).2lllpPXdxd假设l=1,则p=2。由中心极限定理,若试验次数为n,则p的估计(1)ˆ~(,)pppNpn近似20.6366p,(1)0.2313ppnnx黍吝长魔河埠咨筹振逸谅渠动羽治研搅椎逆蚀散诛镀忍谣判柑烤菏明掇宠SAS和统计计算SAS和统计计算4若要以95%的概率保证ˆp精确到三位有效数字,即ˆ0.001pp2251.960.2313/0.0018.8710n00(,)1sin22ˆ.nxxnnn在计算机上随机产生个数对,判定是否成立。记成立(即相交)的次数,则苏哲埋汲份叭胯虚湃左绽惑诌枝圭颤猿帝慢座塘街聋匝儒挎时忻害薯庸质SAS和统计计算SAS和统计计算5随机模拟的计算思路:(1)、针对实际问题建立一个简单便于实现的概率统计模型,使所求的解恰好是所建模型的概率分布或某数字特征。如事件的概率或模型的期望;(2)、对模型中的随机变量建立抽样方法,在计算机上进行模拟试验,抽取足够的随机数,并对有关的事件进行统计;(3)、对模拟试验结果加以分析,给出所求解的估计及精度(方差)的估计;(4)、必要时,还应改进模型以降低估计方差和减少试验费用,提高模拟计算的效率。考虑简单的定积分()bafxdx(如计算概率、各阶矩等,可归为定积分)钎贸却加窿纲板痢退裂娇肩筷酒及刺眶制洛尤礼贿值居赊呈惺澈顽酗仰负SAS和统计计算SAS和统计计算6随机投点法设a,b有限,0()fxM,令{(,):,0}xyaxbyM设(X,Y)在上均匀分布,为阴影部分的面积Mf(x)ab渔斧韦拧脾聪败席李芜侈生镶抒鸳切桑隙胺腺揣屿截躬洲愧嫡范澈鸡匡澄SAS和统计计算SAS和统计计算7向随机投点,若点落在{(x,y):yf(x)},称为“中的”。0()npMban0ˆ()nMban步骤:(1)、独立地产生2n个(0,1)U随机数iu,iv,i=1,2,…,n;(2)、计算()iixauba,iiyMv和()ifx;(3)、统计()ifxiy的个数on,01ˆ()nMban。临隐艺侗卑疲物却猎凸收鲸言垫斟负着惧透骨姆作隘鹿诗蕊筹阳归稻燎壕SAS和统计计算SAS和统计计算8精度:(,)onbnp,()pMba,2212()ˆ()()[()].oMbaVarVarnMbann以标准差衡量,1ˆ的精度为12n。1ˆ,E只甭敏鲁焕腿悄斥瞅稠茨樊峭名带砖综颁传祥汕喷城简怂拐绞纷初稀佬趁SAS和统计计算SAS和统计计算9样本平均值法设()gx是(,)ab上的密度函数,则()()()()()()bbaafxfXfxdxgxdxEgxgX由矩法,若有n个来自()gx的观测值,则可给出的一个矩估计,即样本平均值法。如:,ab有限,取()gx1ba,1,,nxx是(,)Uab的随机数,的估计为211()1ˆ()()nniiiiifxbafxngxn。巨流韭躯尘躲焉舶囤恨巳斡率却介警急可酌睦液隆晃瓦掩央股戍吁脉兔删SAS和统计计算SAS和统计计算10步骤:(1)、独立产生n个12(0,1),,,nUuuu随机数,(2)()()iiixabaufx计算:和。1,2,,in21ˆ()niibafxn2ˆ()E2222111ˆ()()()()nbiaibaVarVarfXbafxdxnnba221()()babafxdxn闸苦臂逢带先砧狐帖句兆贼乃浓再切莎埠肠榷力思矢赚晌逢蚌棵承敦勃倚SAS和统计计算SAS和统计计算11在0()fxM下,可证,对相同的n,2ˆ()Var1ˆ()Var。1ˆ()Var2ˆ()Var2()()()()0bbaaMbafxMbadxfxdxnMn2ˆ比1ˆ有效。事实上交想塔愚江或盂垢氯潦宽面吴坟樱犊副帜麓凛仍馏梢峦击递嗜匆悉炳屑尉SAS和统计计算SAS和统计计算12重要抽样法由样本平均值法知:对任一密度函数()gx()()(),()()bafxfXgxdxEgxgX1()1ˆ.()niiifxngxˆ是无偏的,其方差与()g有关,问题变为:如何选择()g使ˆ的方差变小。蛀输蜀细阻佯扣捶广键友孰采巧飞呀犀赃溢猩吊黍枪蛋针潍诅撂或啥郝舱SAS和统计计算SAS和统计计算13因为221()ˆ()()()fXVarEngX,若ˆ()0,()()/,()0.fxgxfxVar取则但,()()/,gxfx未知故不能取,但()()gxfx可取与形状接近的函数,,这样就能降低估计的方差,这就是重要抽样法的基本思想。忠哺淌疚泽妖异疙簧门输件耸俊粗蛾雪鹰孵料阑斧炙认曙疹亦痈抚苹猜坷SAS和统计计算SAS和统计计算14例:考虑10,(1),.xedxe的精确值为是可求的,现用MonteCarlo法估计首先考虑样本平均值法,即产生n个(0,1)U随机数1,,,nxx,则211ˆinxien,且2ˆ(),E,12222201110.242ˆ()(1)(1)(1).2xVaredxeeennn苔惰园扰住帜拇备阳胶陕寨篙熏桨力则栗火窍刚佯萄廷苯帘矮搪怠乒叫鳖SAS和统计计算SAS和统计计算15由重要抽样法的思想,选一个与xe相似的密度函数,21......2xxex利用线性近似取2()(1),3gxx则()(0,1)gx是上密度函数.,设1,......,nxx()gx是的随机数,,则的估计为211()13.()21ixnniiiiifxengxnx砌罗携筑捡钵抹玲灶长谈彪顶渭痪躲摹浑抱阁舅野草靴乞叫馈纯亦溺窟烃SAS和统计计算SAS和统计计算162也是的无偏估计,即2(),E且212201()()(1)()fxVardxengx212030.0269(1).21xedxexn(数值计算)方差小,即优于2ˆ。20.242ˆ().Varn肆蒲修绅鹊撕眶脱镐颓诌恍扎彰铺冕腕勉尘辊赶映碱拯政胚战阿宝锐袒化SAS和统计计算SAS和统计计算17分层抽样法另一种利用贡献率大小来降低估计方差的方法是分层抽样法。它首先把样本空间D分成一些小区间1,......,mDD,且诸iD不相交,iDD,然后在各小区间内的抽样数由其贡献大小决定,即定义()iiDpfxdx,则iD抽样数应与ip成正比。如此,对贡献大的iD抽样数多,可提高抽样效率。獭畔溃刘嘛吠为法胞磷灶问宜盛膛幅告驴凰砌戚珐丛葫佑宴毅辊躬生救法SAS和统计计算SAS和统计计算18考虑积分10()fxdx,将[0,1]分成m个小区间,各区间端点记为:ia,010,......,1maaa,则11011()().iimmaiaiifxdxfxdxI记1,1,......,iiilaaim,抽样步骤:(1)、产生U(0,1)上随机数{iju:1,......,,1,......,ijnim}矢海神显姥盎蛇骄镐当湃承淖渤匈女连榴欢迹徒嚼所贺慰无虎欧风摩县挽SAS和统计计算SAS和统计计算19(2)、计算1ijiiijxalu,1,......,,1,......,ijnim(3)、计算311ˆˆˆ().inmiiijijiilIfxIn,则3ˆEˆ()iiEII223111ˆ(){()}.inmmiiijiijiiillVarVarfxnn,其中1222()()iiaiiaiiIfxdxll罪研雇包阔练虫凶嘉老洋疑浅嗽坦汞圃眷磋炯缄拱羌渡狰徒斗知捌预贤寒SAS和统计计算SAS和统计计算20如10.xedx,将[0,1]划分为[0,0.5]和[0.5,1],则121,IeIee0.522221024(1)(1)4(1)0.03492xedxeee12222220.524()()4()0.09493xedxeeeeee设共抽n个,[0,0.5]上有1n个,2222312110.50.5ˆ()Varnnn,对1n求导,n给定雍擞竣略淡阀赦呀狈入镍拙歉香芽蔑莫痪溶宾鲁钉掺驴期罢姨生涣债硅添SAS和统计计算SAS和统计计算21当11120.034920.034920.09493nn0.186870.377530.18687.30811时,方差最小222123110.50.06125ˆ()/1/Varnnnnnn若将区间细分为10等分,计算诸2i,最优抽样次数分配1iimjjnn,方差为0.00246n闪庞烙饲枫季晰衡纤抖践抓吕惫琐算妹裤进裕再井稻防掣鹃忍勉鞠钵纳碳SAS和统计计算SAS和统计计算22一般在2i和il已知时,当n固定,1iiimiiinlnl时,方差最小,值为211miiiln注:一般2i未知,取简单分配1iiimiinlnlnbal,此时也有2321ˆˆ()()miiibaVarlVarn臂信普攫怒间丘辕夺飞碰常裔金荫南咬匆秒弦友雇堕囱趋灶辜同碾尿感总SAS和统计计算SAS和统计计算23关联抽样法考虑积分之差1212()()fxdxfxdxII,用1ˆI2ˆ,I作为12,II的估计,1ˆˆI2ˆI估计,则ˆ的方差为:1212ˆˆˆˆˆ()()()2(,)VarVarIVarICovII若1ˆ()VarI,2ˆ()VarI确定,则当1ˆI,2ˆI的相关度越高,ˆ的方差越小。软蜒膛事赞牛售要祁壶这棺肌扳击计闹伊在铣赫载武迈匀荒功眺坪蜂葵除SAS和统计计算SAS和统计计算24考虑用重要抽样法估计1I,2I,即改写为:1122()()()()hxgxdxhxgxdx,其中1()gx,2()gx为概率密度,()(),1,2.()iiifxhxigx先由1()gx,2()gx各产生n个随机数1,......,nxx和1,......,nyy,然后计算1211ˆ()().niijhxhyn,若要使得,iixy,有较高的正相关,可采用逆变换法由同一个(0,1)U分布的随机数产生,iixy,则可降低估计方差。江末我氟抱逝限匈奴务萨锻样限括芯螟狠嘎灯沽景坷钓沦逗返厩证诡鸵批SAS和统计计算SAS和统计计算25讨论10()fxdx,因为1100()(1)fxdxfxdx,故11201()(1)2fxfxdxII于是可先产生(0,1)U分布随机数12,,,nuuu,然后计算411ˆ()(1)2niiifufun,则4ˆ()Var21ˆ()2Var(条件:()fx单调且具有一阶连续导数)郝责腊砍帜群恰逞象讽栽垂起时唇抒衅裕澜慕庚豁签宣斟彬戒测罐赫么尺SAS和统计计算
本文标题:SAS和统计计算
链接地址:https://www.777doc.com/doc-2756409 .html