您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 万振龙:数据治理与大数据平台设计
数据治理大数据平台设计万振龙议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计数据治理背景数据治理现状“维持”代替“管理”2历史“包袱”沉重3相关方利益交织,协调困难4方案规划容易,落地困难5过度依赖技术工具6对于数据没有明确区分7议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计数据治理要素组织流程、活动与机制技术平台与工具计划、制度与标准规范OrganizationProcess&Activities&MechanismPlatform&ToolsPlan&Rule&Standards数据治理策略获得支持引入外援找到“痛点”确定“起点”责任到人持之以恒绩效评估经验总结做好绩效实事求是确定方法奖惩机制标准先行使用工具数据治理实施建议数据质量提升是目标主数据管理是关键***元数据管理是基础议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计什么是元数据•元数据的定义–技术元数据–业务元数据–操作元数据为什么要进行元数据管理1Why?23456数据的参考框架解决数据模糊性可视化数据流动影响和血缘分析推进标准化建设规范化数据审计6.经验分享5.4.3.2.全局治理尽快见效高层支持业务参与1.奖惩机制标准先行数据定义标准化分类词数量月销售量月销售量++标准单词对象词素词素词素词素分析原属性名(标准化对象)月度销售数量标准单词标准域数量类型:数字型长度:19,0标准用语月度销售数量类型:数字型长度:19,0月度销售数量+修饰词标准单词标准单词标准单词分类词(域)数据定义标准体系标准体系标准单词标准域标准用语数据模型标准化结构实体、属性、关系、主键,范式化等命名规则、用语词典、标准域等管理数据管理政策、方针等配置管理、版本管理等质量准确性、完整性、实时性、一致性应用查询结果的准确性、使用便利性、查询结果的迅速性模型设计标准实施路线模型优化模型诊断设计规范设计指南按照模型设计规范和指南统一设计企业内部数据模型元数据管理系统可使用可管理可控制模型要素关系定义规则应用系统注册元数据库脚本同步指导数据库设计审核、评估、发布提交反馈标准化体系(数据定义&模型设计)元数据服务标准规范制定完善引用元数据管理工具的选择•元模型易于扩展•界面友好•安全和系统管理•配置管理•发布、查询、报表功能•平台开放•提前试用议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计什么是主数据•企业主数据分散存储在企业各系统内,对企业至关重要的核心业务实体的数据,比如客户、合作伙伴、员工等–关键–分散–缓慢–共享主数据类型当事人事物地域财务和组织主数据与参考数据•参考数据可以是主数据,但不一定是主数据为什么要作主数据管理数据冗余难亍应变阻碍业务数据冲突Why?如何做好主数据管理经常遇到的问题如何做好主数据管理识别并管理主数据相关方整理并分析主数据的生命周期识别主数据含义、上下文、类型主数据实施流程运行维护项目实施主数据识别数据梳理项目实施要点•选择工具•定制开发•制定标准规范•确定组织架构注册准入废弃维护审批申请主数据管理系统访问服务查询匹配查重数据校验安全管理ERPCRM人事财务……标准规范管理流程组织机构统一数据共享强化决策支持提升数据质量主数据管理体系数据导入数据分发版本管理通知议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计数据质量问题2、数据的定义1、数据的值域6、结构完整性5、业务规则8、数据流7、数据转换数据质量3、数据的完整性4、数据的有效性组织架构设计评审委员会技术主管部门业务部门统计部门(业务部门)负责业务规则的制定,在业务层面统管数据质量和安全。技术部门负责数据集成、使用等过程中的数据质量,并对数据质量报告进行定期发布。技术部门设置评审委员会,对数据方面的变更进行管控,具备技术方案否决权。●业务与技术部门各司其职,共同做好数据质量管理工作数据质量治理流程数据录入/质量检查生产库后台库一级检控复制数据仓库ETL二级检控短信通知短信通知录入修改应用服务确认技术主管部门《数据质量管理规范》业务部门管理员策略和方法策略Descriptionofthecontents方法反面影响和正面的效果征得了领导层关注改进工作分布实施,循序渐进数据质量报告定期发布应用系统需求和架构经过严格评审系统的数据结构变更需要进行严格评估数据发生变更时,通报所有相关方Descriptionofthecontents技术手段从源头改起,形成良性循环24小时监控,及时按照预案处理问题多环节设置数据质量监控功能短信及时通知相关业务人员核对问题BI系统不断整合不断改进工具软件最佳实践从数据剖析(Profiling)开始尽量使用工具进行数据剖析数据剖析工作需要持续开展数据集成过程也需要进行数据剖析数据质量评估和改进需要被动和主动两种方式最佳实践得到高层的支持关键数据先行,渐进开展在数据的“上游”解决质量问题“防患于未然”优于“后期治疗”数据质量报告要大范围发布议程•数据治理的背景和现状•数据治理策略•元数据管理•主数据管理•数据质量管理•大数据平台设计关于大数据的几个问题•什么是大数据•大数据与传统数据仓库是什么关系•Hadoop与MPP数据库传统数据仓库数据采集数据存储计算数据展现ERPCRM财务人事数据挖掘报表展现数据集市多维分析EDW抽取转换清洗加载分析人员管理员源数据数据转换数据仓库业务用户数据展示ODSQ&A
本文标题:万振龙:数据治理与大数据平台设计
链接地址:https://www.777doc.com/doc-5056074 .html