您好,欢迎访问三七文档
统计数字会撒谎分享一本书——SDOUED胡劼367像“故事书”一样精彩的数据造假曝光宝典作者:美达莱尔·哈夫《统计数字会撒谎》《漫步华尔街》《股市作手回忆录》并列为所有时代最伟大的25本投资经典之一。——英国著名财经作家利奥·高夫揭露了广告运营、统计人员、专家、有关部门常用的造假伎俩,告诉我们如何识破这些骗术,以便正确决策1.精心挑选的平均数——我们为什么老是拖后腿当一个家伙希望用数据影响公众观点,或者向其他人推销广告版面,平均数便是一个经常被使用的伎俩。所以,当你被告知某个数是平均数时,除非能说出它的具体种类——均值,中位数,还是众数,否则你对它的具体含义仍知之甚少。希望数值较大——算数平均数数值较小——中位数众数——序列中出现次数最多的数1.精心挑选的平均数——我们为什么老是拖后腿实际上,即使我们的工资都不涨,也有让平均工资涨的方法:假设盖茨和乔布斯搬来上海,我们的平均工资就会涨到10k啦~~~你也来上海啦?恩,魔都是个好地方~1.精心挑选的平均数——我们为什么老是拖后腿你知道吗?咱拉高了上海人的平均收入呢起码拉高一千咧!实际上,即使我们的工资都不涨,也有让平均工资涨的方法:假设盖茨和乔布斯搬来上海,我们的平均工资就会涨到10k啦~~~因此,当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人?这种说不清楚的平均数没有任何意义1.精心挑选的平均数——我们为什么老是拖后腿2.没有披露的数据——想要什么结果就有什么结果某位统计专家曾经建议,在被告知某个调查的结果时,你需要做的就是反问一句:“你调查了多少名被访者”采用严重有偏的样本几乎能够产生任何人需要的任何结果。高露洁广告广告说啥我信啥广告骗术中,怎样才能完全依靠机遇形成毫无指导性的结论呢?答案就是足够小的样本2.没有披露的数据——想要什么结果就有什么结果我们来抛下硬币。只经过少次数试验的话,你有可能得到合理但不能当结论的结果,但是很多人就拿这种结果当结论去忽悠人。只有经过足够多次的试验后,平均数定律才是一种有用的描述,并可用来预测。另外,当图表中有意或无意遗漏了左侧的波动范围,我们需要对平均数,图表或趋势保留一些怀疑,不只怀疑,这个图表一定在坑爹没跑了!2.没有披露的数据——想要什么结果就有什么结果01234520082009201020112008200920102011最简单的统计图形是直线类图形。在显示趋势时,直线图形非常有用。数据是相同的,所以图形也相同,除了图形给人留下的印象不同之外,没有进行任何的伪造。只需要稍微改变横轴与纵轴刻度的比例关系,将纵轴的每一个刻度缩减为原来的l/10即可。没有人规定不能这样做,而这会产生一条更完美的折线——绝对的视觉冲击。显然,图形比文字更有效,因为它不存在任何形容词和副词来破坏图形的客观性所形成的幻觉,而且谁也无法指责你。3.令人惊奇的图形——看我72变024681012141618202224JFMAMJJASOND10万2020.220.420.620.82121.221.421.621.822JFMAMJJASOND10万形象化图形的前身是普通的柱状图,在比较两种成两种以上事物时,柱状图是一种描绘数量的便捷常用的方法。但柱状图也具有欺骗性:在描述单一物体时,柱体改变宽度的同时,长度也发生变化;在描述三维物体时,物体的体积又不容易进行比较,以上任何一种情况都提醒我们应该对柱状图保留一些怀疑。数字全是2:1,但视觉效果却是4:1,而在大多数时候视觉效果起着加工资的作用。4.一维图形的滥用——图形的魔术20466257233086737637494490102030405060200320042005200620072003-2007年税收收入及其增长速度不完全匹配的资料是一种保证你处在有利位置上的武器,而且屡试不爽。你不会知道杀死的是什么细菌,你也不会知道哪种细菌引起了感冒。你不会知道洗衣粉能洗掉的是怎样程度的污渍,也不知道能洗去多少污渍。5.不完全匹配的资料——数字炸弹舒肤佳广告奥妙洗衣粉两个事物之间的关联关系并不能用于说明其中一个将引起另一个的变化。数据是真实的,然而唯一不妥的是依据这些数据和事实推断出一个未经证实的结论。相关显示了一种趋势,而这种趋势通常并不是那种一对一的理想关系。6.相关关系的误解——吃的多所以笨?•对那些未加解释的平均数,我们根本不用太在意。(神马平均工资、平均智商、人均GDP都是浮云)7.如何进行统计操纵——见证奇迹的时刻•为了使最声名狼藉的统计资料看上去更有分量、更精确,你应该使用小数。•百分数也给误解提供了肥沃的土壤,和小数一样,它也能为不确切的事物蒙上精确的面纱。“现在就购买你的圣诞礼物,你将节省100%”听上去很有吸引力,但实际上混淆了比较的基础,相对于原来的价格,价格只缩减了50%,虽然对于打折后的价格而言,减少量的确是100%,但是听上去确实比干巴巴的5折有吸引力。平均睡眠时间约8小时平均睡眠时间为7.8小时平均睡眠时间为7.831小时(哇好专业也)•变换基数还能产生增加折扣的幻觉。7.如何进行统计操纵——见证奇迹的时刻•将一些看似能直接相加却不能这样操作的事情加在一起,会产生大量的欺骗和隐瞒折上折!!!“50%折扣再打20%折扣”=70%?60%一年只上一天班?8.如何反驳统计资料——真相只有一个•怎样凭双眼就能识破虚假的统计资料,并揭开它的老底,同样重要的是,如何在一大片充满欺骗性的数据海洋中找出可靠有用的资料。——提出5个问题•问题一:谁说的?首先寻找的是偏差——出于学术、名誉或收入的考虑而需要证明某些结论的实验室,希望获得一篇好报道的报界等等,他们提供的数据都有可能产生偏差•当某个权威人士被引用时,请弄清楚到底资料的内容是权威的,还是仅仅扯上了权威人士的大名。Eg:xx砖家说:辐射没影响。。。。有关部门说:油价上涨对百姓生活影响不大8.如何反驳统计资料——真相只有一个•问题二:他是如何知道的?数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结论的可靠性?——对于许多报告中的内容,通过观察,你会发现由于缺乏足够多的观测值,报告的内容不足以说服任何人。(前面的抛硬币的栗子)•问题三:遗漏了什么?通常,你并不会被告知包含了多少观测值,这个数据的缺失,特别当信息来源于信息存在利害关系一方时,已足以使你对整件事情提出质疑。比如,当均值与中位数相差甚远时,需要注意那些没有标明类型的平均数。很多数据因为没有比较而变得缺乏意义。Longlongago,x大学开始接收女学生时,一不赞成异性同校的人做了一个惊人的报道:x大学1/3的女生嫁给了大学老师!民风狠彪悍啊。然而原始数据更清楚的描绘了事实:总共只有3个女生被录取,其中1人嫁给了老师8.如何反驳统计资料——真相只有一个•问题四:是否有人偷换了概念?在分析统计资料时,请留心从搜集原始资料,到形成结论时的整个过程中,是否存在着概念的偷换。比如,疾病案例的增多不等于发病率的提高,民意调查中的获胜并不等于竞选时的获胜。典型的偷换概念:美国某个州长说,监狱的犯人每人每天所花费的钱与住酒店的钱一样8.如何反驳统计资料——真相只有一个•问题五:这个资料有意义吗?外推法是十分有用的,特别是当预测趋势时。但是,当看到利用外推法计算出来的数据和图表时,请记住:到目前为止的趋势都是事实,而未来的趋势只不过是受教育者的猜测。该方法暗含“其他所有条件都相同”以及“现有趋势将继续下去”的前提。但实际上,条件总在变化着。某个5年期间,美国家庭拥有的电视数量增加了近10000%,按照该速率对下一个5年进行推测,你将发现电视机的总数将超过几千万,即每个家庭将拥有40台电视。•许多控制甚至扭曲都是在合理范围内进行的。统计工作者经常要在许多方法中主观的选择一个方法以描述事实。•所有这些都在提醒大家,在报纸、杂志和书籍中看到统计资料、结论以及数据时,应该经过认真的思考后再接受他们。有时候,更仔细的一瞥将有利于进一步了解真相。•武断的拒绝统计方法是因噎废食,也不值得提倡。THANKYOU!
本文标题:统计数字会撒谎
链接地址:https://www.777doc.com/doc-3142900 .html