您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 山东地税数据仓库模型构建及应用(1)
北京机械工业学院硕士学位论文山东地税数据仓库模型构建及应用姓名:赵焕申请学位级别:硕士专业:企业管理指导教师:孙志恒20070101山东地税数据仓库模型构建及应用作者:赵焕学位授予单位:北京机械工业学院相似文献(10条)1.学位论文吕洪敏基于Oracle数据仓库应用技术的研究与实现2007数据仓库是一项基于数据管理和利用的综合性技术。近年来,数据仓库技术在信息技术领域中日益成熟,己成为业界研究的重点。企业要想在市场竞争中取胜,获得更大的经济效益,可以利用数据仓库技术,对企业的业务数据进行深层次的挖掘、分析历史和当前的业务数据以及相关环境的数据,快速获取其中有用的决策信息,为企业提供快速、准确和方便的决策支持。数据仓库是面向主题的、集成的、时变的和非易失的数据集合,支持管理的决策过程。数据仓库不是一个新的平台,而是一个新的概念。数据仓库也不是一个现成的产品,而是一个解决方案。数据仓库是在收集各种分散、异构数据源的基础上,对数据进行转换和集成,从而为决策者提供单一的分析环境,帮助其进行科学决策。联机分析处理(On-LineAnalyticalProcessing,OLAP)是数据仓库的一个典型的应用。它能将数据仓库中的数据按照不同的粒度级进行聚合和预计算,从而在用户面前展现多维数据视图。同时,联机分析处理还提供了较直观的多维分析操作,包括切片、切块、上卷、下钻和旋转等,使用户能多角度、多层次地观察数据仓库中的数据。本论文对面向决策支持的数据仓库技术进行了深入的研究,利用数据仓库和联机分析处理的相关知识,独立设计了钢铁销售决策支持的数据仓库系统的架构,建立了数据仓库系统,并在此基础上进行应用研究。本文阐述了数据仓库的基本概念及特点、数据仓库的体系结构、数据仓库的数据组织、数据仓库的数据分析等知识,介绍了Oracle公司提供的基于Oracle9i数据仓库解决方案及其关键工具,在对本文的理论基础进行了详细的介绍后,研究了如何将数据仓库及联机分析处理有关理论、方法应用于决策支持系统中。完成的主要工作有:结合钢材销售主业务,构建数据仓库模型,划分了合同、销售及来款三个主题,建立了满足此模型需求OLAP三层客户/服务器体系结构,进而完成了为销售决策提供支持的数据仓库环境的设计;运用OWB工具实现了部分系统需求数据的ETL转换;为了在两维的屏幕中显示多维数据,运用了最新的OracleBusinessIntelligenceTools中的Discoverer及相关工具,实现了OLAP多维分析操作;设计了基于Oracle数据仓库的应用模型,独立完成了某钢铁公司销售决策支持系统的数据仓库架构设计、建模及OLAP分析,从而实现了数据仓库系统在销售决策中的实际应用。实践证明,本文中数据仓库系统的应用模型设计方法及开发步骤,充分利用了Oracle产品集,开发出了高效、灵活、实用的DSS系统,在实际的推广应用中受到了柳钢销售分析决策人员的一致好评。文中的数据仓库系统的应用模型设计方法、开发步骤及数据表现形式,对基于Oracle数据仓库的设计及开发具有一定的参考价值。2.期刊论文吴隆基采用Oracle数据仓库解决方案构建图书馆数据仓库-情报科学2005,23(1)本文给出了用Oracle数据仓库解决方案来构建图书馆数据仓库的实现技术,解决了异构分布式图书馆数据库资源的共享问题,使异构分布式图书馆自动化信息系统进一步具备了当今世界上最先进的异构数据仓库特性.3.学位论文尹潘地学数据仓库关键技术及其应用研究20062005年1月国务院副总理曾培炎在国土资源部视察工作后,提出了“金土工程”,指出了国土资源信息化的重要性,而地学数据仓库则是它的一个重要研究方向。近年来,随着“数字地球”和“数字国土”战略的提出和实施,大量的基础性数据库已接近完成,数据正以几何级数的速度增长,数据的管理与使用变得日益复杂;同时,地学的多学科交叉趋势也日益明显,传统的单主题数据库已难以满足多学科综合研究的需要,因此,如何将地学领域不同类别不同比例尺的海量数据进行集成,以适应地学数据的综合分析处理,便成为一个突出的问题。然而,由于地学数据所固有的海量、多类别、多分辨率、多格式等特点,使地学数据集成的研究十分困难。传统的数据库技术难以解决海量多类别数据集成的问题,但近年来计算机领域新发展的数据仓库技术可为这一问题提供解决思路。目前,数据仓库在数据格式单一的商业领域已应用得比较成熟,但在地学领域的研究还处于初步阶段,涉及多源多比例尺多格式的地学数据集成的研究有待于突破。从现有研究情况来看,目前地学领域的数据仓库还是没有摆脱现有商业数据仓库基于时间的数据组织形式,因而在地学(特别是地质)领域有3个主要问题难以解决:(1)不同类别数据集成。商业数据可以按时间集成,而地学数据按时间集成就比较难,特别是不同类别不同格式的数据集成更为困难。(2)分级存储。海量数据往往需要根据数据粒度的大小来进行分级和分布式存储,如果地学数据以时间来组织的话,就难以确定数据的粒度,也就没有分级存储的依据。(3)数据的综合分析。对地学矢量和栅格数据的分析,主要侧重于空间方面的综合性分析,而以时间为主的数据组织形式显然与此不太谐调。而地学数据仓库是一个用以更好地支持地学决策分析处理、面向主题、集成的、能存储空间数据、随空间不断变化的地学数据集合。它集成了计算机科学、数据库技术、空间分析技术、GIS和RS等技术,在空间数据存储、管理、分析、利用等方面有着传统GIS和遥感软件所无可比拟的优势。论文共分为7章三部分:第一部分为第一章,是论文的选题部分,包括本文的选题来源、目的、意义和选题的国内外研究现状、发展趋势及存在问题。第二部分包括第二、三、四、五、六章,主要包括地学数据仓库模型、地学数据仓库关键技术研究、OracleSpatial空间应用技术、GDWMS系统在地学数据仓库三层架构中的理论和技术研究、GDWMS系统。本文的第三部分是第七章,介绍论文的结论、主要工作、创新点和下一步的工作建议。地学数据仓库是很新的研究领域,目前没有一个成熟的模型和产品,它在理论、技术和方法等很多方面还不成熟。本文在构建地学数据仓库和开发GDWMS系统过程中,涉及到众多的理论和应用技术。取得了以下认识和结论:(1)地学数据仓库理论是不断发展的。虽然目前地学数据仓库的三层架构,明确了各层间数据的来源和流向,但地学数据仓库是个庞大的系统工程,上述思想只是个大体框架。作者结合地学特点和数据仓库技术,提出了地学数据仓库模型和该模型所对应的数据流程。该模型是建立地学数据仓库的基础,也是GDWMS系统架构的指导思想。通过深入的研究了地学数据仓库的特点、组织、结构功能特征和数据流程,提出了地学数据仓库各层所涉及到的理论、方法和技术,丰富了地学数据仓库理论。(2)地学数据仓库是多学科交叉的成果,涉及到学科众多,元数据、数据挖掘和空间索引技术则是不可或缺的。文中介绍元数据的定义、作用和描述,深入分析了地学数据仓库与元数据的关系,元数据和GIS的关系。研究表明,元数据是地学数据仓库的存在和运行的基础,数据仓库中所有的存储结构、分析、管理和操作都是通过元数据来进行的。所以,数据仓库中元数据的构架好坏直接影响到数据仓库能否健康运行。空间数据挖掘是地学数据仓库分析和输出的重要技术手段,空间数据挖掘同OracleSpatial相结合,利用OracleSpatial函数和空间数据挖掘方法,能够发现空间数据中隐含的信息,为地学数据仓库的存储层空间数据分析提供了新的手段。空间索引是地学数据仓库存储、分析、查询和管理的关键。文中通过OracleSpatial空间拓扑分析和四叉树索引研究,得出结论,空间数据索引在地学数据仓库的存储层、分析层和表达层都有着极其重要的作用。(3)oracle是功能强大、应用很广的数据库技术,OracleSpatial是数据库技术和空间信息技术相结合的新兴空间存储、管理和分析技术。本文中的GDWMS就是以OracleSpatial来存储、管理和分析空间数据。本文对OracleSpatial的空间数据模型、存储模型、空间索引技术、元数据技术、数据挖掘技术进行了深入研究,分析了OracleSpatial在处理空间数据方面的具体优势,并在构建地学数据仓库过程中,体现出这些优势。本文对OracleSpatial的空间数据模型、存储模型、空间索引技术、元数据技术、数据挖掘技术进行了深入研究,分析了OracleSpatial在处理空间数据方面的具体优势。通过深入研究,发现OracleSpatial并不能准确地表达空间数据的拓扑关系,故引入9交模型,使得拓扑分析的结果更准确完整。(4)通过FME和OracleSpatial技术的综合利用,实现了矢量空间数据集成。利用FME掌握的超过150多种GIS数据格式的核心技术,通过VB+FME组件的二次开发,实现了不同格式GIS数据的转换;把地学数据仓库的OracleSpatial作为空间存储对象,保存FME的转换数据,实现了数据格式和空间的统一。这样,便于地学数据仓库的存储、分析、管理和查询。(5)地学数据仓库涉及到众多技术,这些技术的综合利用能够解决比较复杂的问题。在GDWMS系统功能模块开发过程中,几乎每个模块都就用到了多种技术,从综合利用结果来看,效果是比较好的。例如,矢量数据的快速显示,用分层理论来指导快速显示框架;元数据技术定义显示数据表结构和显示设计的参数;数据挖掘确定显示的数据;空间数据索引限定了显示、加载和卸载范围。(6)地学数据仓库的不同层次,所用到的理论和技术不同,深入分析各层所涉及的理论和技术有助于更好的实现地学数据仓库功能。如GDWMS系统所对应的地学数据仓库存储层用到FME理论;分析层用到的空间面元拓扑关系分析、OracleSpatial9交模型、OracleSpatial线性四叉树理论、金字塔理论;表达层用到空间数据压缩、分层管理器理论、栅格数据快速显示技术,并进行了详细论述。(7)根据地学数据仓库理论,结合OracleSpatial技术,利用图形二次开发组件,能够开发出比较适合地学数据仓库理论和功能的系统。GDWMS根据地学数据仓库理论,设计系统三层架构,分别对应地学数据仓库的三个层,利用OracleSpatial作为存储和分析对象,结合FME技术、编程技术、分层理论等相关技术和方法,能够比较好的完成地学数据仓库简单功能。(8)总的来说,本文的总体的思路和构建地学数据仓库的过程为:①分析数据仓库和地学数据仓库发展历史和现状。②提出地学数据仓库模型,及该模型的数据流程。③分析并深入研究地学数据仓库涉及到的技术。④深入分析地学数据仓库涉及的理论。⑤开发地学数据仓库系统——GDWMS系统;⑥验证该模型和地学数据仓库理论。⑦得出结论。从文中结论分析可以看出,GDWMS系统能够很好的结合地学数据仓库三层架构和地学数据仓库模型,从试验结果可以看出GDWMS系统能够解决较为复杂的地学问题。总之,地学数据仓库是多领域、多学科交叉的成果,需要各行各业技术人员多年不辍劳作,同时它又是个应用领域广、结构复杂、面临的困难繁多的大型系统工程。作为地学新生事务,它在很多方面还有缺点和不足,还需要不断的改进,以使其在实际应用中更好的发挥作用。4.学位论文张鑫基于Oracle的电信级数据仓库查询优化研究与实现2007数据仓库已被世界各地的各种公司和部门所采用来进行海量数据的存储与查询、联机事务处理和知识挖掘。其中,如何缩短用户响应时间及对查询性能的优化始终是数据仓库需要面对的重要问题。本文从数据仓库开发设计、数据粒度和分区设计、数据仓库查询主题等方面对基于Oracle的电信级数据仓库,特通平台进行了分析和研究。在此基础上,针对该平台不能满足当前用户对查询响应时间要求的问题,从数据粒度和分区设计、数据存储方式、用户查询语句优化、平台整体优化等方面提出了解决方案。通过对Oracle性能的主动和被动管理,以及优化工具SQLTrace、EXPIAINPLAN和优化器的使用,缩短了数据仓库用户查询响应的时间,提高了查询效率。最
本文标题:山东地税数据仓库模型构建及应用(1)
链接地址:https://www.777doc.com/doc-26694 .html