您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 往来文书 > 美妙统计数据谎言.ppt
2011年6月30日@阎浮提人间香袖美妙的统计数据谎言目录►前言►准确度的假象►错误的引导►诡诈的曲线►貌似精确的百分比►受人操纵的平均数►骗人的虚假趋势►公理式的抽样►民意制作►七十二变的概率►使用数据注意要点资料来源:瓦尔特.克莱默《统计数据的真相》、网络资料前言世界上有三种谎言:谎言、该死的谎言,还有统计数据。——本杰明.迪斯累里(BenjaminDisraelis)首先要掌握事实,然后你可以随意歪曲他们。——马克.吐温失业者按照其来源不同进行统计,数据或多或少;癌症风险和臭氧黑洞不断增加;1/3的人生活在最低生活水平线以下;一个联邦德国公民一年内吃掉了5.8升食用冰;音乐家可以比其他人更长寿;农村的空气有益于健康,或者农村的空气不利于健康;全球到2020年将会有100亿人口;道琼斯指数又涨了30点;网球运动员B在与一个左手握拍、带着眼镜的选手比赛时从未输过,该选手比B年轻;与男性相比,超过25%的女性经常错误地拐入单行道;恐龙灭绝于6000万年前;吃猪肉会导致心脏病;外国人更容易成为罪犯;绿党的选民经常阳萎(这绝对不是开玩笑—这是一个汉堡的性学研究者在德国联邦议会上所做的说明);人们在纽约睡觉时,最安全的地方是中央公园;还有30年我们就要与下一次的核灾害分别了,目前存在着气候灾害的威胁;如果在下一个星期天投票,某党X不会进入联邦议会。准确度的假象1909年4月6日,美国人罗伯特·埃迪温·皮尔里(RobertE.Peary)到达地球的北极,从而成为世界上第一个到达北极的人。至少皮尔里本人是相信这一点的。说得确切一些,他希望全世界的人都相信他所取得的这个结果,所以,他确定了他到达北极的位置是北纬89度57分11秒,距离北极点大约5公里—这些数据对于皮尔里的实际目标来说已经是一个巨大的成功了,并且准确地说,这种效果也是他精心策划出来的。实际上,皮尔里根本不可能把他自己的位置精确到30米的距离(因为11秒不会发生任何事情)。即使在今天,借助于卫星定位这种现代化的辅助手段,也不可能取得如此微小的、精确的结果。所以,这件事情在那个时候根本就是不可能的。就连皮尔里的朋友也承认,在最理想的情况下,皮尔里通过其有限的工具也只能准确地标注到6分(纬度)或10公里,其他指标干脆就是他自己杜撰的。统计学是一门完全特别的、完全稀奇古怪的科学。——威廉.拉贝(WilhelmRaabe)到底该向哪里走从这里到最近的邮局有多远?直行两个路口,然后右拐!我们到底走哪边?嗯,向前走两三个路口的样子,然后左拐。真相在哪里超市苹果单价4.98斤/元某辆汽车的制动距离是63.59米玛士撒拉甚至活了969岁彭祖146岁一位在孟加拉国种植水稻的农民每年可以挣98马克13芬尼,这个数字完全不是有意暗示这个调查研究会精确到一分一毫,因为事实上人们从来没有这样计算过。研究者只是做了一个猜测,即9100万居民平分20亿塔卡的国民收入,然后再按照当时的塔卡与马克的汇率换算成马克,从而得出上面的结论:98马克13芬尼。在这些附加的资料中,只有一项是精确无误的,即当时的货币汇率。国内生产总值和居民数量都是粗略的估计。如果把所有资料都集中到一起,那就会重新产生出一个(被误认为是)精确的数字。这样毕竟是偶然世界历史有多远世界历史有多久远?这还用问!上个星期教授已经讲过这方面的知识,当时世界已经有4000年的历史了。”他怎么知道的这么详细啊?“四千年零一个星期”。不为人知的计算27颗红枣精华错误的误导76%的交通事故是由没有饮酒的驾驶者造成的,所以酒后驾车也没有关系。德国纺织业发展德国《经济周刊》(Wirtschaftswoche)成功地进行了相关研究,以每10个月为一个周期,描述了德国纺织工业向坏的和向好的景象。左图表达的意思是,“纺织品在联邦德国私人消费那里,早在几年前就已经下降了。这种情形即便在1989年也几乎没有什么改变。在预测私人消费会实现实际增长2.5%的条件下,纺织品消费与前一年相比增长不会超过1.5%。”这种比较悲观的预测在图形当中得到了反映:曲线起始于高峰,终止于谷底。这个图表形成后,没过几个月就出现了完全相反的情形:曲线先是起始于谷底,然后持续地上升;图表旁边的文字说明是:“联邦德国的纺织工业在1990年也呈现出强劲地上升趋势。纺织工业在这一年的销售增长预计能够达到5%~6%。”犯罪率和死亡率一家美国报纸用哲理推论了发生在美国的暴力犯罪。绝大多数暴力犯罪发生在家中,即厨房、起居室和卧室。这家报纸的结论是:晚上,人们只有睡在中央公园才是比较安全的。伦敦《时报》(Times)文章“50%的女性被害者是被自己的男朋友或丈夫杀死的”对婚姻生活的危险性进行了推论。只有约10%的被害妇女是由完全不认识的人谋杀的,一般来说,犯罪嫌疑人来自受害人的家庭生活圈(特别是在周末或度假中,“这时家庭成员是在一起的”)。与老年人相比,青少年被误认为是具有较多自杀倾向的一类人群,这一基本判断就是建立在错误的比较基础上的。一家德国报纸文章“老年时会变得更幸福”分析论证了下面的结果:在20岁以下的青少年中,自杀在所有死亡中所占的比例最大,共计25%。而30~40岁的人自杀率占到10%,超过70岁的老年人自杀率不足2%。“年龄越大,决定自杀的比率就越低,”这家报纸如此写道,因此我们会随着年龄的不断增长而变得越来越幸福。诡诈的曲线某企业10年销售额飞速增长:当一个人在他的头脑里只有数字和图形的时候,他就不能找到踪迹间的因果关系。——叔本华无所不能的调整100101100.5102101.5103102.5101.5103105010203040506070809010011012345678910100101100.5102101.5103102.5101.510310510010110210310410512345678910100101102103104105123456789标致发动机惊人的省油非凡的牛市各种腰斩图1各种腰斩图2貌似精确的百分数本届录取的的女生50%是本校教师的妻子第二次世界大战中一位负责雷达业务的军官非常紧张的状态,这位军官长时间徒劳地一再向上级机关请求加强7名技术人员组成的雷达小组的力量,可是一直没有结果。但当其中一名成员的神经崩溃时,这位军官只是非常言简意赅地报告:“14%的人员由于过重的负担而变得精神恍惚,甚至出现神经错乱的现象”。一个农场主,在他所饲养的全部家畜中,57%是牛,14%是猪,其余的畜类占29%。但是,有谁能够想到,这位骄傲的农场主实际上只养着4头牛、2只羊和1头猪?这就是他的全部家畜。“在我们的全部议员中,女性议员的比例已经提高了50%!”在联邦德国自由民主党(FDP)的党主席选举后,新闻媒体这样报道。联邦德国议会中的全体自由民主党成员异常兴奋,并为之鼓掌喝采。“嗯,是这样的”,其中一个议员轻声地说:“以前我们有4个女性议员,而现在增加到6个……”。每两个人中就会有一个独居“近100年,人们的生活方式发生了剧烈的变动,”《南德意志报》写道。“20世纪初,大家庭成员之间彼此共同生活在一起是非常正常的现象。几乎有一半的居民……是生活在拥有5个人或者更多人的家庭中。而今天的德国与以前完全不同:2/3的居民独居或者是两个人一起生活。”证据是:66%的家庭人口小于3个人……在美茵河畔的法兰克福,甚至有77.5%的家庭人口小于3个人,其中49.2%的家庭只有1个人。因此得出结论:半数的人在独居!两个灼眼的百分数增长率的增长率:人们利用百分数很容易在和风细雨的现象中制造出一种狂风暴雨的幻象。现在假设一个公司的销售额如下:100101102.5从上面的数据可以得出结论:销售额先增长了1%,然后又增长了1.49%(1.5/101)。客观地说,这两个增长率数字非常小,也可以说,后一个增长率几乎贴在前一个数据之上,原则上我们不能用“具有活力”这个词来描述这个公司的销售情形。相反,如果我们不从增长率这个初始数据出发,而改用增长率的增长率来表示,那么,情况就会发生根本性的改变。如果销售额在第1年增长了1%,第2年比第1年又增长了1.49%,那么,第2年的销售额比第1年的销售额拥有令人骄傲的成绩:增长了49%小样本的百分数:百分数也给误解提供了肥沃的土壤。和小数一样,它也能为不确切的事物蒙上精确的面纱。美国劳工部(TheUnitedStatesDepartmentofLabor)的《每月劳动回顾》(MonthlyLabarReview)曾经指出,在华盛顿,某个特定月份中支付交通费用的兼职家庭帮工中,4.9%的人周收入是18美元。实际上,4.9%的兼职家庭帮工仅指2个帮工。也就是说,以上结果仅含有41个被调查对象。任何建立在小样本容量上的百分数都可能产生误导,直接给出具体数值的大小将更有价值。如果再将百分数表示成小数点后几位的小数形式,你可能正将天平从愚蠢的一端移向欺诈。受人操纵的平均数示之以弱?示之以强?篮球比赛的应对策略:鬼知道的权重如果在一个村庄中有10个农民,其中1个农民拥有40头牛,其他9个农民一头牛也没有。平均每人有4头牛一家公司,女员工每小时的收入是20元,男员工的收入是每小时30元,那么,这个公司的员工平均每小时的工资就不是25元,因为这要取决于男女员工的比例。真正的平均也就是所谓的“均衡的”算术平均值,即20和30的加权平均值,如果有7位女员工和3位男员工,那么,平均工资水平就是:0.7×20+0.3×30=23。飞机和火车哪个更危险标准的分母是全部计算在内的乘客—公里数。这样我们就会得到:火车:9人遇难每100亿乘客公里数飞机:3人遇难每100亿乘客公里数如果以乘客小时数做分数中的分母。死亡的平均值就应该是:火车:7人遇难每1亿乘客小时数飞机:24人遇难每1亿乘客小时数其实床上最危险,因为人们死在床上的可能性几乎是99%骗人的虚假趋势神一样的乌龟阿基米德和乌龟赛跑谬论假设阿基米德的速度是乌龟的10倍,乌龟速度为1米/小时,乌龟先跑100米,当阿基米德跑到乌龟的位置时,乌龟向前跑了10米,阿基米德跑完这10米时,乌龟向前跑1米,阿基米德跑完1米时,乌龟向前跑0.1米,阿基米德跑完0.1米时,乌龟向前跑0.01米,照此趋势,阿基米德永远都追不上他前面那只乌龟。假设有一口10尺深的井,井壁非常光滑,一只青蛙从井底向上爬,白天爬4尺,晚上下滑1尺,这个趋势,青蛙几天能爬出来?黄金价格的走势不靠谱的股市资源的有偏分布工资分布GDP发展趋势人口的增长货币量的增长产品销量股票持有量…….公理式的抽样如果人们通过对2000人进行访问调查,从而得到6000万人在想什么的结果,这种方式的效果直到今天为止对于我来说仍然是一个谜。对此我不能做任何解释。事情就是这样的。——伊丽莎白.诺艾尔-诺依曼随机样本的检验标准是:总体中的每个名字或事物是否具有相同的几率被选进样本?第二次世界大战期间,美国国家民意调查中心,(TheNationalOpinionResearchCenter)派出两组调查人员对一个南方城市的500名黑人进行提问,一组调查人员由白人组成,另一组是黑人。问题一共有3个。其中一个问题是:“如果日本占领美国,你认为黑人的境况会得到改善还是变得更糟?”黑人调查组中,9%的被调查者回答“变好”,而白人调查组该比例只有2%。回答“变坏”的比例也不相同,黑人调查组是25%,而白人调查组则是45%。第二个问题是用“纳粹分子”替代“日本”,两组的结果大体相同。第三个问题试图探寻被调查者对前两个问题的真正态度。“你认为目前致力于打败轴心国比在本国内进一步推进民主更重要吗?”黑人调查组中,选择“打败轴心国”的比例是39%,而白人调查组则是62%。民意调查最终将演变为一场与误差的遭遇战。所有信誉良好的调查公司将不可避免地投入到这场战斗中。死亡警报牢固的轰炸机油箱:60%的民用飞机驾驶员都活不过65岁活得更长一些!就去做指挥家!美化后的图标民意制作你喜欢加班吗?公司效益不错,如果有加班,你可以接受吗?您是否认为一个企业中所有的工人都应该加入公会?赞成:44%反对:20%弃权:36%
本文标题:美妙统计数据谎言.ppt
链接地址:https://www.777doc.com/doc-7291108 .html