您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 用 IBM InfoSphere 和 Cognos 集成企业元数据
用IBMInfoSphere和Cognos集成企业元数据提高数据的可靠性和敏捷性,跨企业形成共同的语义RamyaH.Prasad,IT专家,IBMRishiS.Balaji,IT咨询架构师,IBM简介:企业和组织要想有效地做出决策,就一定要了解驱动日常活动的大量数据的质量和正确性。通过本教程学习如何升入了解您的元数据,从而在整个企业内提高数据可靠性、增强敏捷性和改进共同理解。本教程讨论业务和技术元数据集成的重要性,讲解如何使用各种IBM产品集成企业内的各类元数据。简要概述业务问题和集成解决方案之后,本教程详细讲解如何使用IBM®InfoSphere™和Cognos®产品套件中的工具集成元数据。发布日期:2010年11月11日级别:中级简介为什么要集成元数据?企业和组织每天都要处理大量数据。这些数据驱动业务决策和法规报告等许多日常活动。为了有效地使用数据,IT系统必须能够访问元数据。这种可见性会在整个企业内提高数据可靠性、增强敏捷性和改进共同理解。业务用户和技术用户在理解数据方面常常遇到以下问题:l缺少可信的信息¡数据来自哪里?¡它有多可靠?l缺少敏捷性¡数据最近修改过吗?¡如果我修改数据,其他系统会受影响吗?l缺少共同的语义¡customer和client在概念上意义相同吗?¡我应该如何称呼某一实体,企业中的其他人才能理解我的意思?回页首解决方案概述如果企业架构能够集成来自各种源系统的业务和技术元数据,就可以解决这些问题。从高层面上说,元数据指关于数据的信息,比如数据的定义、结构、来源等等。对元数据的详细描述请参见参考资料中链接的developerWorks文章Integratingheterogeneousmetadata。页码,1/33典型的数据集成架构把来自各个源系统的数据提取、转换和装载(ETL)到数据仓库、数据集市和多维数据集中。为了满足业务用户的需要,用报告工具进一步集成数据并以指示板视图的形式显示。另一方面,技术用户负责集成的IT方面。按照这种架构,元数据集成(这是上述问题的解决方案)需要集成以下技术和业务数据:l用来填充数据仓库、数据集市和多维数据集的源系统的相关信息l用来执行转换的ETL作业的相关信息l用来填充特定报告的数据集市表的相关信息l特定术语在报告中的含义(业务元数据)实现这种集成的关键是构建一个企业级的元数据存储库,作为所有元数据的单一可信来源。这样的存储库就位之后,不同的应用程序和用户可以通过连接它构建沿袭和可跟踪性解决方案,帮助回答前一节中列出的问题。图1给出企业元数据集成解决方案的概况。虚线上面的标签指出各种元数据类型(报告名和包、数据库表、ETL作业和数据源名称)。图1.企业元数据集成解决方案注意:上图显示集成架构的技术方面。因此,没有显示填充到元数据存储库中的业务元数据。回页首用于元数据集成的IBM工具本教程中描述的解决方案基于IBMInfoSphereInformationServerV8.1、Cognos8BusinessIntelligence(BI)V8.4页码,2/33和ImportExportManagerV8.1,fixpack1。IBMInfoSphereInformationServer是一个数据集成软件平台,可以帮助组织从多个系统上简单或复杂的数据源获得有用的信息和业务价值。这个平台由多个组件组成,它们对数据进行分析、清理、转换和集成,从而交付有用、有意义的信息。本教程用来演示元数据集成的InfoSphereInformationServerV8.1组件包括:l元数据存储库lInfoSphereMetadataWorkbench(在本教程余下的部分中简称为Workbench)lImportExportManagerlInfoSphereBusinessGlossarylInfoSphereDataStageInfoSphere元数据存储库作为集中存储所有元数据的数据存储,DataStage和BusinessGlossary等其他组件都可以访问它。Workbench的作用是在来自各个来源的数据之间建立自动的链接,提供有用的沿袭报告和影响分析信息。ImportExportManager组件由一些桥组成(MetaBroker也是桥),它们帮助导入和导出元数据存储库中的元数据。它支持各种数据源,比如数据文件、数据库表、数据模型、业务术语表、Cognos报告等等。图2显示CognosBI和InfoSphere集成的业务用户和技术用户透视图之间的关系。图2.CognosBI和InfoSphere集成这种集成意味着业务用户可以使用web链接访问业务术语表和来自业务报告的沿袭报告。页码,3/33对于技术用户,这种集成意味着:l来自CognosBI的报告元数据、来自DataStage的ETL作业元数据和来自DataStage的仓库元数据需要相互映射,以便能够通过沿袭报告跟踪它们。l需要把术语表数据填充到元数据存储库中以启用术语表集成。l为了让CognosBI报告和InfoSphere工具(Glossary和Workbench)之间的链接起作用,必须为CognosBI配置正确的URI。回页首集成元数据的步骤本教程解释如何通过以下步骤实现这个数据映射和配置过程:l使用ImportExportManager把关于数据文件、数据表、业务术语、报告和模型的元数据导入到Workbench中。l在元数据之间建立手工和自动链接。l针对InfoSphere集成配置CognosBI。集成元数据的第一步是把元数据放进存储库中。通过MetaBroker和桥把来自各种工具的元数据导入元数据存储库。还可以使用这些工具把元数据从存储库导出到InfoSphereInformationServer。有多种类型的桥,它们可以导入和导出数据库表、报告、模型、用户信息等的元数据。本教程讲解如何使用这些桥把元数据导入Workbench。用IBMInfoSphere和Cognos集成企业元数据提高数据的可靠性和敏捷性,跨企业形成共同的语义RamyaH.Prasad,IT专家,IBMRishiS.Balaji,IT咨询架构师,IBM简介:企业和组织要想有效地做出决策,就一定要了解驱动日常活动的大量数据的质量和正确性。通过本教程学习如何升入了解您的元数据,从而在整个企业内提高数据可靠性、增强敏捷性和改进共同理解。本教程讨论业务和技术元数据集成的重要性,讲解如何使用各种IBM产品集成企业内的各类元数据。简要概述业务问题和集成解决方案之后,本教程详细讲解如何使用IBM®InfoSphere™和Cognos®产品套件中的工具集成元数据。标记本文!发布日期:2010年11月11日级别:中级访问情况3575次浏览建议:0(添加评论)平均分(共2个评分)页码,4/33把元数据导入Workbench把元数据导入Workbench涉及以下任务:l导入数据库对象l导入和发布连续的文件l导入CognosBIOLAP模型和报告定义l查看DataStage作业l导入业务术语表术语l创建管理员导入数据库对象按以下步骤使用ODBC3.0MetaBroker把描述数据库模式和表的元数据导入Workbench:1.打开ImportExportManager工具,选择ODBC3.0MetaBroker作为源(见图3)并单击Start。图3.ImportExportManager显示ODBC3.0Metabroker还可以在DataStageDesigner中使用Viabridges导入选项显示BridgeSelection对话框,见图4。在这个对话框中,选择ODBC3.0MetaBroker并单击OK。图4.DataStageandQualityStageDesigner显示桥选择页码,5/332.使用ODBCDataSourceAdministrator工具设置ODBCDSN名称作为系统DSN,见图5。图5.ODBCDataSourceAdministrator显示配置的系统DSN3.在ParameterSelection对话框中,选择Verbose选项(见图6)并单击OK。图6.ODBC3.0MetaBroker参数页码,6/334.在Schema\Tableselection弹出窗口中,选择需要导入的数据库模式和表(见图7)并单击OK。图7.Databaseschema\tableselection屏幕5.处理完成之后,在状态弹出窗口中单击Filter。6.在MetadataSelection对话框中,选择某些表或整个模式(见图8)并单击OK。图8.Metadataselection-数据库筛选选项页码,7/337.数据库元数据现在已经导入到元数据存储库中了,可以供InfoSphereInformationServer的所有组件使用。重复这些步骤导入其他数据库模式和表。可以在Workbench中查看导入的数据库元数据,见图9。图9.Workbench显示数据服务器和表回页首页码,8/33导入和发布连续的数据文件DataStage作业的源数据要么是数据库表形式的,要么是连续的文件。另外,作业的查找数据可以采用连续文件形式。一定要把关于这些文件的元数据导入元数据存储库,以便能够使用它们和进行依赖分析。为此,执行以下步骤:1.在DataStageandQualityStageDesigner中,选择ImportTableDefinitionsSequentialFileDefinitions,见图10。图10.DataStageDesigner显示连续文件表定义选项2.在ImportMetaData(Sequential)对话框中,输入源目录、文件名和项目文件夹等信息(见图11)并单击Import开始导入。图11.Importmetadata—连续文件页码,9/333.在DefineSequentialMetaData对话框的Format选项卡上,选择所需的分隔符,见图12。另外,根据需要选择Fixed-widthcolumns和Firstlineiscolumnnames选项。图12.定义连续元数据格式页码,10/334.在DefineSequentialMetaData对话框的Define选项卡上,选择作为键的列名(见图13)并单击OK完成导入。图13.连续文件元数据—列定义5.重复这些步骤导入所需的所有连续文件。回页首把连续文件表定义发布到元数据存储库中发布连续文件表定义有助于获得数据依赖关系。这还有助于了解依赖于所选连续文件的作业,提供从源连续文件直到Cognos报告的完整数据沿袭报告。按以下步骤发布连续文件表定义:1.在DataStageDesigner中,找到刚才从连续文件创建的表定义。右键单击表定义并选择SharedTableCreationWizard,见图14。选择各自的表定义并单击Next。图14.SharedTableCreationWizard选择选项页码,11/332.在SharedTableCreationWizard的CreateorAssociateTables屏幕上,选择CreateNew。在CreateNewTable对话框中,指定主机系统和文件的目录路径(见图15),添加描述文件用途的说明。单击OK,确认设置,创建共享的表定义。图15.SharedTableCreationWizard3.现在可以在Workbench中查看发布的连续文件,见图16。页码,12/33图16.Workbench—数据文件属性在作为共享的表发布时,导入的连续文件的结构包括数据文件、数据文件结构和数据文件字段,见图17。图17.导入的连续文件的结构回页首把CognosOLAP模型和报告导入Workbench用于导入报告和模型的桥是:lCognos8BIReporting—ContentManager,用于报告多个模型、报告等lCognos8BIReporting—ContentManagerPackages,用于导入模型lCognos
本文标题:用 IBM InfoSphere 和 Cognos 集成企业元数据
链接地址:https://www.777doc.com/doc-5906955 .html