您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 部分摘录自-WhyProbabilityandSt
DeptofStat&FinUniversityofScienceandTechnologyofChina12010WhyProbabilityandStatistics?----someexamples张伟平zwp@ustc.edu.cn(O)3600565部分摘录自-----AModernIntroductiontoProbabilityandStatistics:UnderstandingWhyandHow,Springer,2005DeptofStat&Fin简介:概率论和数理统计UniversityofScienceandTechnologyofChina22010Diagramshowingthedifferencebetweenstatisticsandprobability.(ImagebyMITOpenCourseWare.BasedonGilbert,Norma.Statistics.W.B.SaundersCo.,1976.)DeptofStat&FinUniversityofScienceandTechnologyofChina32010•概率:随机(不确定性,偶然)现象的度量•统计:数据分析,从样本推断总体。总体数据概率分布统计分析关键词:随机,数据上半学期下半学期DeptofStat&FinEx1:主办国优势1932-1998年冬奥会主办国奖牌数和上一届奖牌数。42010UniversityofScienceandTechnologyofChinaDeptofStat&FinUniversityofScienceandTechnologyofChina52010美国在1998年日本冬奥会得13块奖牌,2002年2月冬奥会在美国盐湖城举行,预测其在2002年期望得多少?最终美国2002年作为主办国得到了34块,是个异常现象吗?2006年冬奥会在意大利都灵举行,2002年意大利奖牌数为12,预测其在2006年将获奖牌数目,给出95%预测区间。DeptofStat&FinUniversityofScienceandTechnologyofChina62010•下图是东道主上届奖牌数目vs本届奖牌数目(红点为拟合数目),使用Poisson回归(该模型拟合结果说明有主办国优势存在)。DeptofStat&FinUniversityofScienceandTechnologyofChina72010•美国1998年得到13块,2002年作为东道主期望得到16块(通过Poisson回归模型得到)。•实际上美国得到34块,按历史规律此事件发生得概率仅为0.000065,说明2002年美国冬奥会主办国得奖牌数目非常异常,主办国优势体现得尤其明显。DeptofStat&FinUniversityofScienceandTechnologyofChina82010•2002年意大利得到12块,按1998年前的规律,2006年期望个数为14.7个,95%置信区间为[8,23]•但实际上,意大利2006年冬奥会作为东道主只获得了11块奖牌,甚至少于上一届的12块(注意以前所有东道主的奖牌数目都高于上一届),可能性为20%.•而美国2006年作为非东道主得到26块奖牌,说明美国1998年之后实力确实有大幅度提升!DeptofStat&FinEx2:主办国优势中国可能的金牌数?92010UniversityofScienceandTechnologyofChinaDeptofStat&Fin模型:拟合结果所以北京奥运会的金牌数为49.294,95%置信区间为[41.05171,57.50797].UniversityofScienceandTechnologyofChina102010ebxayxy344.1286.6DeptofStat&Fin112010UniversityofScienceandTechnologyofChinaEx3:KillerfootballCardiovascular(心藏血管)mortalityinDutchmenduring1996Europeanfootballchampionship:longitudinalpopulationstudy,2000,BritishMedicalJournal,321:1552-1554作者声称6月22号那场足球比赛对全国人口死亡率有着明显的影响!DeptofStat&FinUniversityofScienceandTechnologyofChina122010他们考虑的死亡包括心肌梗塞、中风、以及归因于过量饮酒和观看6月22日荷兰队和法国队足球赛(荷兰队输了)而产生的紧张压力所导致的死亡。作者主要通过下图来支持他们的结论!DeptofStat&FinUniversityofScienceandTechnologyofChina132010中间的水平表示6月17到6月27的这段时间的平均死亡个数,上下两条线表示此平均个数的95%置信区间。对置信区间的解释是要特别小心的。95%置信区间DeptofStat&Fin142010UniversityofScienceandTechnologyofChinaEx4:身高的遗传E.S.Pearson在1893–1898年间在英国收集了n=1375位65岁以下母亲和18岁以上女儿的身高数据,PearsonandLee(1903)发表了此数据,我们以此数据来研究母亲身高和女儿身高之间的遗传关系。DeptofStat&FinUniversityofScienceandTechnologyofChina152010详细资料:http://mil.qianlong.com/4919/2003/09/21/42@1605800.htmDeptofStat&FinUniversityofScienceandTechnologyofChina162010使用回归得到Dheight=30.4869+0.5326*Mheight如果母亲的身高为63.78inches(162cm),则女儿的身高预测值为(163.7cm)64.45613=30.4869+0.5326*63.78进一步,预测的95%置信区间为[152.3cm,175.14cm]DeptofStat&Fin172010UniversityofScienceandTechnologyofChinaEx5:统计与情报机构二战期间,有关德国战争物资生产能力的情报对盟军的作战计划的制定是非常重要的。战争早期用来估计德国产能的方法被证实是不适合的为得到德国产能的更可靠的估计,来自美国使馆的经济战争部和英国政府经济战争部的专家,对缴获的德军装备上的标记和序列号进行了分析DeptofStat&FinUniversityofScienceandTechnologyofChina182010每一个德军装备上都有一些印记,包括以下全部或部分信息:标记人的名字和位置生产日期序列号其他方面的各种信息,如商标、模具号、浇铸号等等DeptofStat&FinUniversityofScienceandTechnologyofChina192010这些标记的目的是为了维持对质量标准检查的高效率以及对备件的控制这些信息给了盟军情报机构机会来了解德国工业产能第一个被分析的产品是在英国领空击落的德军飞机上的轮胎,以及在北非战场上缴获的德军供应库里飞机和车辆的轮胎DeptofStat&FinUniversityofScienceandTechnologyofChina202010每个轮胎上都有标记者的名字、序列号和由两个字母构成的生产日期这两个字母被推测为一个是代表生产的月份,一个是年份。因此代表月份的字母应该有12中变化,而代表年份的字母有3-6中变化DeptofStat&FinUniversityofScienceandTechnologyofChina212010下表是四个厂家所使用的月份字母编码DeptofStat&FinUniversityofScienceandTechnologyofChina222010接下来对轮胎上的序列号按照每个生产商和生产日期分类记录具体的,每个月的序列号可以是从1到某个未知的大数N,而观察到的序列号是个子集问题就是基于收集到的序列号对每个生产商每个月的产量N进行估计DeptofStat&FinUniversityofScienceandTechnologyofChina232010收集到从1939到1943年中期,来自5个生产厂家的1400个轮胎,从而得到单个月的样本数字下表表示了1943年第一季度所有厂家的平均月产量的估计值,以及战后来自军备部的统计数字。与来自盟军情报机构的数字比较,估计的精度是值得赞赏的,而情报机构用别的方式估计的月产能是900000到1200000!DeptofStat&FinUniversityofScienceandTechnologyofChina242010AnEmpiricalApproachtoEconomicIntelligenceinWorldWarIIRichardRuggles,HenryBrodie,JASA,Vol.42,No.237(Mar.,1947),pp.72-91DeptofStat&Fin252010UniversityofScienceandTechnologyofChinaEx6:光的速度1983年“米”的定义被修改为----平面电磁波(光)在“1/299792458秒”的持续时间内在真空中传播行程的长度。这实际上是定义了电磁波(光)的速度!DeptofStat&FinUniversityofScienceandTechnologyofChina262010关于光的速度的争论是持续了上百年历史的。AlbertMichelson在1879年的6月和7月早期对以前的两个实验进行了重新设定,并做了一系列的测量。DeptofStat&FinUniversityofScienceandTechnologyofChina272010光速测量的准则很简单,测量距离和时间。为得到准确的结论,距离和时间的测量精度要求很高。考虑到光速的特性,要是测量一个很长的距离,则距离的精度能以保证;要是测量一个很短的时间,则时间很难准确测量。DeptofStat&FinUniversityofScienceandTechnologyofChina282010在Michelson的时代,光速已经知道大约是300000km/s,因此他的目标是使此值更准确!下图表示了Michelson的实验装置DeptofStat&FinUniversityofScienceandTechnologyofChina292010DeptofStat&FinUniversityofScienceandTechnologyofChina302010因此需要测量四个量:•Distance•Radius•Displacement•Revolutionsperseconds(rps)每个量的测量中都存在误差!单独的误差可能回严重影响最终的结果!DeptofStat&FinUniversityofScienceandTechnologyofChina312010Michelson实验中distance大约是2000英尺,他用了名义上长度为100英尺的钢制尺子。仔细检查后发现实际长度是100.006英尺(系统误差)。他测量了5次,得到的值在1984.94到1985.17英尺之间,最后他用平均值表示“truedistance”值(减少随机误差)!其他的值都类似的确定!最终他的报告值(真空中,需要转换)为299944+/-51km/sDeptofStat&FinUniversityofScienceandTechnologyofChina322010尽管Michelson很
本文标题:部分摘录自-WhyProbabilityandSt
链接地址:https://www.777doc.com/doc-1228 .html