您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 构建新一代企业大数据平台
2©Copyright2013EMCCorporation.Allrightsreserved.建立在PAAS平台上的新一代数据平台解决方案3©Copyright2013EMCCorporation.Allrightsreserved.Agenda企业新一代数据平台的技术需求创新的技术平台建设思路4©Copyright2013EMCCorporation.Allrightsreserved.面向大数据的分析NowWhat?SoWhat?What?大数据分析•企业内、外部的结构化和非结构化数据•数据量在TB级以上•以数据挖掘、预测和实时分析为主,强调对业务驱动传统BI分析•企业内部的结构化数据,•数据量在GB~TB级•以报表、查询和分析为主,反应当前业务现状5©Copyright2013EMCCorporation.Allrightsreserved.更丰富、更细致的客户管理大数据分析在企业的应用更准确、更及时的营销管理更高效、更全面的风险管理Customer360oSingleViewKeyLifeEvents&NextBestActionStressTest&CreditAssessments6©Copyright2013EMCCorporation.Allrightsreserved.通用银行业大数据分析平台管理分析类应用数据交换平台应用集市数据区核心系统总账系统国结系统网银系统……系统企业内外部半结构化、非结构化数据数据产生层数据交换层数据传输数据稽核数据处理流程调度监控告警……数据服务层非结构化数据区沙盘演练数据区用户评价信息移动互联信息……元数据数据应用层历史归档数据区HDS客户主题协议主题产品主题事件沙盘演练应用实时分析应用数据管控层POS增量财务增量库存增量采购增量……增量临时数据区实时数据区核心数据总账数据国结数据……数据主题数据区社交媒体信息网银数据……客户管理财务管理风险管理……管理客户管理财务管理风险管理……管理运营管理用户访问层决策人员管理人员数据科学家业务人员客户汇总账户汇总机构汇总产品汇总……7©Copyright2013EMCCorporation.Allrightsreserved.企业大数据平台数据内容及实现技术Page7•应用平台提交请求访问的数据,包括结构化和非结构化两类•在线存储周期超过数据生命周期规划的数据•适合Hadoop分布式架构管理•无法用二维表结构来逻辑表达的无结构性的数据。例如文本、音频数据等。•方便用数据库的二维表结构来逻辑表达实现的数据,数据结构字段含义确定,清晰。例如:客户信息、用电记录等。是挖掘数据价值的主要对象。•支持分析型应用,时效性较低•支持前台交易系统查询需求,具有可靠性高、并发度大、采集频率短的特点按数据格式类别划分按数据格式类别划分按数据采集频度划分大数据平台在线数据归档数据非结构化数据结构化数据准实时数据非实时数据•面向贴源数据查询和主题数据整合。•数据区,适合X86MPP数据库集群范式化模型数据•面向分析类应用。•对应ADW和CM数据区,适合MPP数据库集群维度模型数据按数据模型划分8©Copyright2013EMCCorporation.Allrightsreserved.Page8企业大数据平台架构原则平台8技术-跨平台数据交换批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-平台内数据复制跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载,数据的形式不发生变化,不涉及数据转换。数据复制后产生的数据副本主要是为了便于数据引用,需要制定数据副本的生命周期管理策略以及保证数据副本的只读属性。数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过全行指标口径和维度、度量信息,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。9©Copyright2013EMCCorporation.Allrightsreserved.Page9企业大数据平台架构原则平9数据-历史数据分级存储和访问近线数据存储形式保持源表源结构,主要以数据库形式存储,支持在线数据查询、访问和应用支持,响应时间秒级。归档数据以廉价大容量磁盘方式存储,存储形式会根据数据环境和未来应用的差异,采用不同于源结构的存储形式。同时,归档数据需要创建“被动索引”并具备恢复到主题数据区或者汇总数据区的能力。数据-非结构化数据管理对于交易和处理过程中形态尚不稳定的非结构化数据,可由各平台根据时效性、一致性控制和完整性控制等要求考虑自行处理安全-数据访问安全对于普通的查询访问应用,应该具备屏蔽敏感信息的展现的能力。面向行内用户的数据访问,应按照数据的属主进行访问隔离。运维-系统日常运行性能管理在数据量不断增加、访问用户数量的增长、用户数据使用成熟度的变化、数据ETL持续滚动开发等场景的不断变化下,需要围绕日常性能管理,不断调整系统设计和运行策略。10©Copyright2013EMCCorporation.Allrightsreserved.建设新一代数据平台的驱动力完整的大规模数据的快速捕获流程多种类型数据的存储数据的实时共享与交换海量&剧增数据的支撑能力传统数据仓库技术和新技术的结合Hadoop技术的合理运用与性能11©Copyright2013EMCCorporation.Allrightsreserved.Agenda企业新一代数据平台的技术需求创新的技术平台建设思路12©Copyright2013EMCCorporation.Allrightsreserved.CONSUMERGRADE先行者:服务于海量客户的互联网巨头企业MAINFRAMESoftware-DefinedDatacenterNewData-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-DefinedDatacenterNewData-fabrics私有的数据中心与基础架构13©Copyright2013EMCCorporation.Allrightsreserved.CONSUMERGRADE先行者:服务于海量客户的互联网巨头企业MAINFRAMESoftware-DefinedDatacenterNewData-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-DefinedDatacenterNewData-fabrics私有的数据中心与基础架构存储并且在非常大量的数据上进行分析14©Copyright2013EMCCorporation.Allrightsreserved.CONSUMERGRADE先行者:服务于海量客户的互联网巨头企业MAINFRAMESoftware-DefinedDatacenterNewData-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-DefinedDatacenterNewData-fabrics私有的数据中心与基础架构快速应用开发存储并且在非常大量的数据上进行分析15©Copyright2013EMCCorporation.Allrightsreserved.CONSUMERGRADE先行者:服务于海量客户的互联网巨头企业MAINFRAMESoftware-DefinedDatacenterNewData-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-DefinedDatacenterNewData-fabrics私有的数据中心与基础架构快速应用开发存储并且在非常大量的数据上进行分析大规模自动化运维16©Copyright2013EMCCorporation.Allrightsreserved.企业级的需求…快速应用开发MAINFRAMECLIENT-SERVER&WEBCONSUMERGRADE存储并且在非常大量的数据上进行分析新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备,海量日志,多种应用…无处不在的数据采集Software-DefinedDatacenterNewData-fabrics17©Copyright2013EMCCorporation.Allrightsreserved.来自金融企业的独有需求…快速应用开发MAINFRAMECLIENT-SERVER&WEBCONSUMERGRADE存储并且在非常大量的数据上进行分析新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备,海量日志,多种应用…无处不在的数据采集Software-DefinedDatacenterNewData-fabrics收集数量庞大的事件数据的同时对特定交易事件进行实时反应与传统应用和基础架构有机配合18©Copyright2013EMCCorporation.Allrightsreserved.来自金融企业的独有需求…快速应用开发MAINFRAMECLIENT-SERVER&WEBCONSUMERGRADE存储并且在非常大量的数据上进行分析新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备,海量日志,多种应用…无处不在的数据采集Software-DefinedDatacenterNewData-fabrics收集数量庞大的事件数据的同时对特定交易事件进行实时反应与传统应用和基础架构有机配合配合不同云计算平台实现高效运维和水平扩展...ETC19©Copyright2013EMCCorporation.Allrightsreserved.NewExperiencesNewBizModelspioneeredbynewConsumerInternetgiantsInternet-of-thingsPervasivetelemetryMAINFRAMECLIENT-SERVER&WEBCONSUMERGRADEOperateatScaleinahighlyautomatedway新一代PaaS平台Software-DefinedDatacenterNewData-fabrics快速应用开发收集数量庞大的事件数据的同时对特定交易事件进行实时反应存储并且在非常大量的数据上进行分析与传统应用和基础架构有机配合配合不同云计算平台实现高效运维和水平扩展...ETC新一代Paas平台建设思路20©Copyright2013EMCCorporation.Allrightsreserved.Software-DefinedDatacenterNewData-fabricsTheSoftwareDefinedDataCenterNewExperiencesNewBizModelspioneeredbynewConsumerInternetgiantsInternet-of-thingsPervasivetelemetryMAINFRAMECLIENT-SERVER&WEBCLOUDERAOperateatScaleinahighlyautomatedwayAWSVMW...ETCPivotal:面向数据的企业级Paas平台PivotalPlatformFromVMwareFromEMCBigDataFastDataRapidApplicationDev&IntegrationCloudAbstraction&AppAutomation存储并且在非常大量的数据上进行分析在收集数量庞大的事件数据的同时对特定事件进行实时反应快速应用开发配合不同云计算平台实现高效运维和水平扩展与传统应用
本文标题:构建新一代企业大数据平台
链接地址:https://www.777doc.com/doc-29624 .html