您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据计算模式和关键技术
未来,已发生改变……大数据的关键技术1大数据关键技术1、数据采集2、数据存储与管理3、数据处理与分析4、数据隐私与安全1.5大数据关键技术分布式存储分布式处理大数据1.5大数据关键技术分布式存储:解决海量数据的存储问题单机无法存储集群分布式存储海量数据的存储1.5大数据关键技术1分布式数据库Bigtable分布式文件系统GFS分布式并行处理技术Mapreduce1.5大数据关键技术正如“不同的锁需要不同的钥匙”企业中不同的应用场景数据不同的计算模式,需要使用不同的大数据技术不同的计算模式需要使用不同的产品1大数据关键技术批处理流数据需要实时处理图计算需要实时处理实时计算交互式查询分析交互式计算不同的计算模式需要使用不同的产品MapReduce批处理计算模式的典型代表批处理计算MapReduce是批处理计算模式的典型代表可做迭代计算的Spark,实时性更好10流计算•代表技术:Storm、S4、Flume、Streams流数据(网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据)需要实时处理,给出实时响应,否则分析结果会失去商业价值。图计算代表技术:Pregel、GraphX、社交网络数据转换成图结构查询分析计算代表技术:Dremel、Hive、Cassandra、Impala等大数据计算模式大数据计算模式解决问题代表产品批处理计算针对大规模数据的批量处理MapReduce、Spark等流计算针对流数据的实时计算Storm、S4、Flume、Streams、Puma、DStream、SuperMario、银河流数据处理平台等图计算针对大规模图结构数据的处理Pregel、GraphX、Giraph、PowerGraph、Hama、GoldenOrb等查询分析计算大规模数据的存储管理和查询分析Dremel、Hive、Cassandra、Impala等表1-3大数据计算模式及其代表产品分布式存储分布式处理大数据1.云计算概念云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。云计算的优势企业不需要自建IT基础设施,可以租用云端资源云计算的优势企业不需要自建IT基础设施,可以租用云端资源图1-7云计算的服务模式和类型云计算的服务模式和类型公有云混合云私有云应用层软件即服务(SaaS)平台层平台即服务(PaaS)基础设施层基础设施即服务(IaaS)公有云面向所有公众私有云面向企业内部混合云部分给自己,部分给外部InfrastructureasaServicePlatformasaServiceSoftwareasaServiceSaaSPaaSIaaSGoogleApps,Microsoft“Software+Services”面向用户(云软件)SinaAPPEngine,GoogleAppEngine面向应用开发者(搭建开发平台作为服务出租)AmazonEC2,IBMBlueCloud,SunGrid面向网络架构师(基础设施作为服务出租)ServerStorageServerStorageVisualizationInfrastructurePlatformApplication从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型。由于是计量服务,SaaS允许出租一个应用程序,并计时收费IaaS将基础设施(计算资源和存储)作为服务出租PaaS类似于IaaS,但是它包括操作系统和围绕特定应用的必需的服务SaaS•云计算关键技术包括:虚拟化、分布式存储、分布式计算、多租户等云计算关键技术云计算数据中心的建设阿里全球云计算数据中心部署苹果云计算数据中心部署
本文标题:大数据计算模式和关键技术
链接地址:https://www.777doc.com/doc-6382948 .html