您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 基于数据仓库的销售数据的查询分析
重庆大学硕士学位论文基于数据仓库的销售数据的查询分析姓名:张起荣申请学位级别:硕士专业:计算机技术指导教师:郭平;肖传正20050801重庆大学硕士学位论文中文摘要I摘要企业管理对决策提出了越来越高的要求,而决策是否有正确性及效率信赖于数据的支持。数据仓库为决策的数据支持提供了完整的解决方案。一般而言,数据仓库的体系结构包括五层:数据源、监视器、集成器、数据仓库、客户应用。数据仓库的创建包括:概念模型设计、逻辑模型设计、物理模型设计、物理创建等过程。数据仓库建立后,必须为其添加经过预处理后的数据,以使数据仓库正常运行。数据的预处理包括的过程有:①选择源数据源;②从数据源中抽取所需数据;③按数据仓库数据的标准格式和语义,对数据进行清洗、转换;④将数据加载到数据仓库中。完成数据装载后,即可对数据仓库中的数据进行查询分析。联机分析OLAP作为数据仓库操作工具和数据表现工具,为数据仓库的查询和分析带来了很大的便利。OLAP有两种主要模型:MOLAP型和ROLAP模型。MOLAP是采用多维数据库系统存储数据的,其体系结构分为数据层、应用层、和表示层。在ROLAP模型中,数据是以关系形式的行和列来存储的,以商业维度的形式为用户显示数据。MOLAP模型和ROLAP模型的差异主要表现在:查询性能和分析能力、数据加载性能、数据存储性能、维护能力等方面。在实际应用中是选择MOLAP还是选择ROLAP,应主要考虑应用规模问题。本文以SQLServer为工具,进行椰树饮料销售的E-R模型设计,包括饮料销售事实表和饮料销售维表。实现了基于饮料销售数据的SQLServer数据库和AnalysisManager数据库的创建和连接。对数据仓库维和多维数据集进行创建后,就可根据企业对不断变化的数据应用进行不断的更新。企业的管理人员需要对数据仓库中已经汇总的数据进行深入的分析,通过SQLServer的数据钻取功能可以实现查询分析。关键词:数据仓库,数据查询,销售分析重庆大学硕士学位论文英文摘要IIABSTRACTEnterprisemanagementdemandsformoreadvancedlevelofdecision-making.Thecorrectnessandeffectivenessofdecision-makingdependsuponsupportofdata.Datawarehouseprovidesanintegratesolutiontodatasustain.Generallyspeaking,architectureofDatawarehouseincludesfivelevels:datasource,monitor,integrator,DatawarehouseandClientapplication.Processofestablishingadatawarehouseincludes:Conceptmodeldesigning,LogicmodeldesigningandPhysicmodeldesigning.Inordertomakeadatawarehouseworkswell,pretreateddatamustbeloadedintowhenitestablished.Processofdatapre-treatmentincludes:①datasourcesselection;②Extractingdatafromdatasources;③Cleaningandtransformingdataaccordingstandardformandsemanticsofthedatawarehouse;④Loaddataintothedatawarehouse.Wecanqueryandanalyzedataindatawarehousewhendatahasbeenloaded.Asoperatingtoolanddatapresentingtool,OLAPbringconveniencetodatawarehousequeryandanalysis.OLAPhastwomodels:MOLAPmodelandROLAPmodel.MOLAPusesmulti-dimensionaldatabasetostoredata.WhileinROLAP,dataisstoredasrowsandcolumnsinrelationform,andexhibitedtocustomersasbusinessdimension.ThemaindifferencebetweenMOLAPandROLAPliesinquerycapability,analysiscapability,datastoragecapability,dataloadcapabilityandmaintenancecapability.DatascaleisthemainconsiderationforselectionbetweenMOLAPandROLAP.WithSQLServer,thispaperdesignsE-RmodelforYeshupalmdrinkingsaleincludingfacttablefordrinksaleanddimensiontablefordrinksale.AndrealizesestablishmentandconnectionofSQLServerwarehouseandAnalysisManagerwarehousebasedondrinkingsalesdata.Afterdatawarehousedimensionandmulti-dimensiondatasetestablished,wecouldupdatedatawarehouseondemandofenterprise.Ifmanagerneedstodeeplyanalyzegathereddataindatawarehouse,thedatadrillfunctionofSQLServercanqueryandanalysisdata.Keywords:Datawarehouse,DataQuery,SaleAnalysis重庆大学硕士学位论文1绪论11绪论1.1问题的提出随着信息技术的不断推广和应用,众多企业在使用管理信息系统处理日常经营业务和管理事务过程中,积累了大量的信息。市场竞争的日趋激烈,使企业随时处于生存的危机中,逼使企业的管理者加深对决策重要性的认识。企业的决策者希望能得到适当的战略信息,做出正确的决策,以实现:在保住和巩固现有的客户的基础上,不断拥有更多新的客户;不断提高产品品质量和改进对客户的服务水平,提高市场占有率;不断提升产品的销售结构,使销售额能达到预期增长水平;不断改进内部控制,使成本费用水平达到最小化。战略信息对于企业的生存和可持续性发展,具有非常重要的意义。与企业其他信息相比,战略信息的不同之处在于:战略信息是一个独立的事关企业整体的全局性数据;战略信息必须准确,必须符合商业规则;战略信息必须直观,获取容易,必须对分析有用;战略信息必须可靠,每个商业要素均只能有一个确定值;战略信息必须是事先就准备好的,处于备用状态的数据。然而,由于企业积累的数据大部分是反映以往日常经营活动的操作型数据,这些数据分散在多种互不兼容的结构和体系中,互不关联甚至互相矛盾,无法直接用于企业的战略决策和目标的制定。因此,众多企业的决策者在决策中,都面临共同的难题:企业拥有海量的数据,但缺乏足够的战略信息。以下是椰树集团信息化现状,该现状代表了国内众多饮料食品企业信息化水平和共同面临的难题。椰树集团作为中国饮料行业前十名企业,年销售收入13亿元。椰树集团在不同地市拥有众多办事处和工作站,他们都拥有一定数额的销售费用。以销售数据检索方面,众多系统都是采用预先定义好的格式,无法满足使用者的不同需求。以销售数据的检索为例,销售数据的检索只能产生时间与品牌数据二维表和具体某个客户订单明细表,无法反映出地区销售、促销花费及效果、销售人员支出及业绩等。由于没有此类信息的支撑,不能给企业的决策和管理层提供有价值的信息。针对以上现状,企业要拥有足够的战略信息,就必须解决三个问题:①数据仓库的构建包括数据仓库的数据组织、数据变化和集成工具、客户端分析工具的构建。②数据预处理对不同数据库系统中的数据的抽取、转换和加载入数据仓库的问题。③数据仓库效率重庆大学硕士学位论文1绪论2对数据仓库中数据进行合理的聚集,通过查询结果和响应时间分析,考察数据仓库存取效率,并作相应地改进。本文将就此三个问题的解决展开论述,最后提出了数据仓库的构建、数据获取和查询分析策略。1.2研究的主要特点及方法本文针对数据仓库的三个问题:数据仓库的构建;数据预处理问题;数据仓库效率进行深入的研究,并将研究结果付诸于“椰树集团饮料销售数据的查询分析”项目中。本研究具有如下特点:①数据库模型及其物理构建的实现;②通过对数据源的抽取、转换和加载的研究,探讨数据的预处理过程;③元数据的表示;④通过查询分析的实现方式,探讨仓库的存取效率及改进策略;本文以椰树集团销售数据的查询分析项目为背景,采用的方法为:通过SQLServer2000关系数据库工具,实现数据仓库的创建和维护,通过SQLServer2000数据库转换工具,实现数据仓库的加载,采用OLEDB,实现数据仓库系统与数据源的接口;采用PivotTable,实现客户端多维数据的定制与操作,采用EnglishQuery仓库的查询。1.3研究的成果本研究以SQLServer2000数据库为工具,通过对椰树集团的销售数据抽取、转换和加载,最终实现销售数据的查询分析,从中提取用于支持决策的战略信息。希望能通过对数据仓库构建、数据预处理、查询分析的研究,为大型企业的战略信息的开发和利用探索一条途径。1.4本文的内容安排第一章绪论,介绍课题的研究目标、特点和各章节的安排;第二章数据仓库概述及背景,介绍数据仓库的相关知识和课题的研究背景及发展趋势;第三章数据仓库模型设计,本章给出了数据仓库的构建模型;第四章数据预处理,介绍数据的预处理过程;第五章数据仓库联机分析,介绍数据仓库数据查询分析的方法和策略;第六章数据仓库开发及应用,以集团销售数据的查询分析为实例,设计实重庆大学硕士学位论文1绪论3现了数据仓库的构建、数据加载、分析和辅助决策。第七章结语,本文的研究成果。重庆大学硕士学位论文2研究背景42研究背景2.1数据仓库2.1.1数据仓库的概念数据仓库就是一个面向主题的、集成的、不可更改的、随时间不断变化的数据集合,它用以支持企业或组织的决策分析处理。[1][2][3][4][5][6]2.1.2数据仓库的特征①数据仓库的数据是面向主题的。②数据仓库的数据是集成的。③数据仓库是随时间变化的。④数据仓库是不可更新的。[3][4][5]2.1.3数据仓库与传统数据库的比较表2.1数据仓库与传统数据库的比较[5]Table2.1Datewarehousecomparingwithtraditionaldatawarehouse对比内容数据库数据仓库数据内容当前值历史的,存档的,归纳的,计算的数据数据目标面向业务操作程序,重复处理面向主题域,分析应用数据特征动态变化,按字段更新静态,不能直接更新,只能定时添加,刷新数据结构高度结构化,复杂,适合操作计算简单,适合分析使用频率高中到低数据访问量每个事物只访问少量记录有的事物可能需要访问大量记录对响应时间的要求以秒为单位时间长2.2数据仓库的体系结构及功能构成一个数据仓库的基本模型如图2.1所示。重庆大学硕士学位论文2研究背景5图2.1数据仓库的体系结构Fig2.1Datawarehouse’ssystemstructure上图简要说明了数据仓库的体系结构包括五层:数据源、监视器、集成器、数据仓库、客户应用。先从数据源中提取数据,然后在集成器中进行清洗、转换、计算和综合并加载至数据仓库中,最后向用户提
本文标题:基于数据仓库的销售数据的查询分析
链接地址:https://www.777doc.com/doc-26614 .html