您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据时代0411补充版52
BIGDATA大数据时代天津财经大学企业管理系1203班BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK《大数据时代》——书籍基本信息书名:《大数据时代——生活、工作与思维的大变革》原作名:《BigData:arevolutionthatwilltransformhowwelive,workandthink》作者:维克托·迈尔-舍恩伯格肯尼思·库克耶译者:周涛出版社:浙江人民出版社出版年:2013年1月BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK作者简介“维克托·迈尔一舍恩伯格二十多年来一直致力于网络经济.信息与创新、信息监管、网络规范与战略管理的研究。从维也纳大学到哈佛大学,从新加坡国立大学到牛津大学,世界上最著名的互联网研究学府都留下了他的足迹。”而现在,在数据信息界孜孜不倦求索的维克托,是世界著名学府牛津大学网络学院互联网研究所治理与监管专业教授,牛津大学克伯学院教授研究员。法学、信息学与网络等多学科的跨界融合,让他不仅拥有严谨的思维,更拥有广博的视野。他先后有100多篇论文公开发表在《科学》《自然》等著名学术期刊上。同时也是多家出版机构的特约评论员,包括啥佛大学出版社、麻省理工学院出版社、通信政策期刊、美国社会学期刊等。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大数据定义大数据(BigData),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。一个数据库并不需要有以太字节计的数据。在相扑案例中,整个数据库包含的字节量还不如一张普通的数码照片包含得多。但是大数据分析法不只是关注一个随机的样本。这里“大”取的是相对意义而不是绝对意义,也就是说这是相对所有数据来说的。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大数据的特点——4“V”Volume(大量):数据体量巨大。从TB级别,跃升到EB级别(1TB=1,024GB;1PB=1,024TB;1EB=1,024PB)Variety(多样):数据类型繁多Velocity(高速):处理速度快Value(价值):价值密度低,商业价值高BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK案例1大数据——变革公共卫生2009年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK目录第一部分:大数据时代的思维变革第二部分:大数据时代的商业变革第三部分:大数据时代的管理变革第一部分大数据时代的思维变革BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第一部分大数据时代的思维变革更多:不是随机样本,而是全体数据更杂:不是精确性,而是混杂性更好:不是因果关系,而是相关关系123BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK01更多:不是随机样本,而是全体数据当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK02更杂:不是精确性,而是混杂性执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。BusinessAdministration|TianjinUniversityofFinanceandEconomics案例2无所不包的谷歌翻译系统资料来源:第52页第2章第2节——大数据的简单算法比小数据的复杂算法更有效IBM在名为Candide的项目上花费了大概十年的时间,将大约有300万句之多的加拿大议会资料译成了英语和法语并出版。翻译的标准非常高,投入资金也很多,但取得的成效不大,最终被迫停止了该项目。而谷歌翻译利用更大更杂的数据库(上万亿的语料库),也就是全球的互联网。它吸收了它能找到的所有翻译,还会去寻找联合国等国际组织发布的译本。尽管其输入源很混乱,但较其他翻译系统而言,谷歌的翻译质量相对而言还是最好的,而且可翻译的内容更多。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果关系,而是相关关系知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果关系,而是相关关系相关关系的核心是量化两个数据值之间的数理关系相关关系强是指当一个数据值增加时,另一个数据值很有可能也会增加。相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化BusinessAdministration|TianjinUniversityofFinanceandEconomics案例3沃尔玛,请把蛋挞与飓风用品摆在一起资料来源:第71页第3章第1节——关联物,预测的关键2004年,沃尔玛对历史交易记录这个庞大的数据库进行了观察,这个数据库记录的不仅包括每一个顾客的购物清单以及消费额,还包括购物篮中的物品、具体购买时间,甚至购买当日天气等。沃尔玛公司注意到,每当在季节性飓风来临之前,不仅手电筒销量增加了,而且POP-Tarts蛋挞的销量也增加了。因此当季节性风暴来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,以方便行色匆匆的顾客从而增加销量。BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美国折扣零售商塔吉特与怀孕预测资料来源:第77页第3章第1节——关联物,预测的关键塔吉特公司在完全不和准妈妈对话的前提下成功的预测了一个女性会在什么时候怀孕。公司分析团队首先查看了签署婴儿礼物登记簿的女性的消费记录,登记簿上的妇女会在怀孕大概第三个月的时候买很多无香乳液。几个月之后,她们会买一些营养品,比如镁、钙、锌。公司最终找出了大概20多种关联物,这些关联物可以给顾客进行“怀孕趋势”评分。这些相关关系甚至使得零售商能够比较准确地预测预产期,这样就能够在孕期的每个阶段给客户寄送相应的优惠券,这才是塔吉特公司的目的。BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美国折扣零售商塔吉特与怀孕预测资料来源:第77页第3章第1节——关联物,预测的关键杜西格在《习惯的力量》一书中讲到了接下来发生的事情。一天,一个男人冲进了一家位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”而当几天后,经理打电话向这个男人致歉时,这个男人的语气变得平和起来。他说:“我跟我的女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的人是我。”BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大数据的核心建立在相关关系分析法基础上的预测!第二部分大数据时代的商业变革BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第二部分大数据时代的商业变革数据化:一切皆可“量化”价值:“取之不尽,用之不竭”的数据创新角色定位:数据、技术与思维的三足鼎立456BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK04数据化:一切皆可“量化”大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚关灯打向“I”,开始关注信息本身了。BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例5大数据的早期实践资料来源:第98页第4章第1节——莫里的导航图,大数据的最早实践之一曾经,一位美国海军军官在上任为图表和仪器厂负责人时,利用以前海军的航海日志、地图和图表等数据整理成全新的航海图,整合之后,这些数据显示出了更有价值的模式,也提供了更有效的航海路线。多年后,当他前去到欧洲为他绘制的图表寻求国际支持的时候,四个国家授予了他爵士爵位,包括梵蒂冈
本文标题:大数据时代0411补充版52
链接地址:https://www.777doc.com/doc-27753 .html