您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 医学信息学论文基于数据仓库的医院客户关系管理技术分析与研究
基于数据仓库的医药企业客户关系管理技术分析与研究于芳卢大国摘要:本文表述了一个基于多维查询分析的客户关系管理系统,在OLAP多维分析算法的基础上对数据进行分析。从系统的功能设计出发,设计了系统整体的体系结构,并设计每个模块功能要求。以星型模式设计了实例数据库的多维数据模型,并采用了SQLSERVER2000企业版设计了数据转换服务包DTS,实现了数据的抽取、转换与装载,通过运用Analysisservers自带的挖掘工具来分析现有的医药行业数据,从而得出结论,为其更好得实施CRM提供理论依据。关键词:数据仓库;OLAP;数据挖掘;关联规则;多维数据集AnalysisandresearchabouttechnologyofmedicineenterprisecustomerrelationsmanagementbasedondatawarehouseFangYuDaguoLuIstudiedcustomerrelationmanagementsystembasedonmanydimensions,thenanalysiscalculatewaybasedonmanydimensionsoftheOLAP.Idesignedwholesystemstructureandfunctionrequestofeachmoldfromfunctionofthesystem.Manydimensionsdatamodelsofthedatabaseisdesignedthroughstarmodel,anddesignedthedataconversionserviceofDTSadoptingtheSQLSERVER2000businessenterpriseversionandcarriedoutsampleconversionandloadofdata.IanalyticaltheexistingmedicineentertoselladatabyusagetheAnalysisserverstakingminingtooltogetaconclusionthus,thosewillcarryouttheoriesbasistoCRMofmedicineprofessionKeyword:Datawarehouse;OLAP;Datamining;Connectionrule;dimensions1、医药行业CRM特点(1)医药行业服务的超前性:在医药服务行业中,最为普遍的就是个性化需求表现的特别突出,同样的需求在不同的客户身上体现出来的个性化特征尤为明显。(2)将传统流程以基于互联网的模式整合在单个CRM中。2、研究目的本文研究的主要目的是:①通过数据仓库技术了解医药行业客户目前的需求和潜在客户的需求②探讨增强医药行业竞争力的新途径③数据仓库在医药行业实施CRM中的重要性3、系统设计和实现系统分为四个模块:数据仓库模型设计、数据转换与管理控制模块、多维数据分析模块和数据挖掘模块。3.1数据仓库模型设计3.1.1概念模型设计数据仓库模型设计首先要进行的是概念模型设计。通过概念模型设计,可以确定数据仓库的主要主题及相互关系。进行概念模型设计所要完成的工作有两个[1]:①界定系统边界②确定主要的主题域及其内容。下面介绍最常用的表示法E-R(实体-联系)法。该方法的步骤为:①任务和环境的评估;②需求的收集和分析;③主题选取,确定主题间关系;④主题内容描述;⑤E-R图;例如,订货销售主题与药品信息、客户信息主题的关系可以用E-R图表示为(如图3.1):E-R图具有良好的可操作性,形式简单直观,易于理解,便于与用户交流。该模型只是对企业模型进行静态的描述。3.1.2逻辑模型设计进行逻辑模型设计所要完成的主要工作有:1)分析主题,确定当前要装载的主题;2)确定数据粒度的选择;粒度选择的主要标准是数据仓库中表的总行数。3)确定数据分割策略;4)增加导出字段;5)定义关系模式;6)记录系统;通过逻辑设计,可以对每个主题的逻辑实现进行定义,并将相关内容(如适当的粒度划分、合理的数据分割策略、增加的导出字段、记录系统定义等)记录在数据仓库的元数据中。3.1.3物理模型设计物理设计中,主要解决数据的存储结构、数据的索引策略、数据的存储策略、存储分配优化等问题。物理设计的主要目的有两个:一是提高性能,二是更好地管理存储数据。访问的频率、数据容量、选择的RDBMS支持的特性和存储介质的配置都会影响物理设计的最终结果。对于一个多维数据集的设计,比如销售模式,首先考虑针对销售数据,客户可能提出的问题:某年某类产品的销售情况如何?某年两个连续的季度销售情况有何变化?销售员的工作业绩如何?哪些产品目前一段时间内购买量大?同类的药品哪类产品销售量大而且药效好?针对某类产品,销售员工的销售量是多少?国家经济状况和医疗保障制度是否对销售有影响?……对上面的一系列问题进行分析,可以通过得知销售多维集分析的目的是使得医药行业可以从时间、客户、销售员工和产品几个维度来统计分析销售数据,从而改进销售战略,吸引更多的客户。建立数据仓库的第一步是确定商业需求,根据需求确定分析主题。(如图3.2)所示就是一个销售数据分析为例的星型模式。3.2数据转换与管理控制设计SQLServer的关系型数据库服务器是数据仓库分析和服务的主要数据来源。通过引入DTS(DataTransformationServer,数据转换服务)来完成数据从OLAP源转移到OLAP系统的工作。在这个转换过程中,DTS要进行数据校验、清理、合并和必要的转换。订货分析的DTS包DTS即为数据转换服务,主要是把不同的数据来源中的数据结合起来,并利用自身的数据转换功能把这些结合后的数据放入数据仓库之中[2]。在对订货分析主题的星形模式进行设计后,利用DTS把数据源中的数据转换放入数据仓库contract_mart的相应的维表与事实表中。数据转换实现过程为:①创建连接②数据转换③建立数据导入的工作流④执行SQL任务⑤确定流程顺序⑥执行并保存DTS包其中转化过程中SQL查询过程如下:﹡SELECTDISTINCTmonth,yearAS标志,SUBSTRING(month,2,2)AS月,SUBSTRING(year,1,1)AS年FROMordertime﹡SELECTDISTINCThomephone,postalcode,city,address,hiredate,birthdate,firstname,lastnameAS标志SUBSTRING(homephone,9,9),SUBSTRING(country,8,8),SUBSTRING(postalcode,7,7),SUBSTRING(city,6,6),SUBSTRING(address,5,5),SUBSTRING(hiredate,4,4),SUBSTRING(birthdate,3,3),SUBSTRING(firstname,2,2),SUBSTRING(lastname,1,1),employeeidFROMEmployees﹡SELECTDISTINCTCompanyName,ContactName,Address,City,PostalCode,Country,Phone,FaxAS标志SUBSTRING(Fax,8,8),SUBSTRING(Phone,7,7),SUBSTRING(Country,6,6),SUBSTRING(PostalCode,5,5),SUBSTRING(City,4,4),SUBSTRING(Address,3,3)AS地址,SUBSTRING(ContactName,2,2),SUBSTRING(CompanyName,1,1),CustomerIDFROMCustomers﹡SELECTDISTINCTleibie,shengchanchangshang,shpchd,pizwh,lingsjzje,kcsx,jj,kcje,chbdj,kcshl,dw,shpgg,jixing,zjm,spmc,spbhAS标志SUBSTRING(leibie,16,16),SUBSTRING(shengchanchangshang,15,15),SUBSTRING(shpchd,14,14),SUBSTRING(pizwh,13,13)AS[位号],SUBSTRING(lingsjzje,12,12),SUBSTRING(kcsx,11,11),SUBSTRING(jj,10,10),SUBSTRING(kcje,9,9),SUBSTRING(chbdj,8,8),SUBSTRING(kcshl,7,7),SUBSTRING(dw,6,6),SUBSTRING(shpgg,5,5),SUBSTRING(jixing,4,4),SUBSTRING(zjm,3,3),SUBSTRING(spmc,2,2),SUBSTRING(spbh,1,1),spidFROMypxx﹡SELECTOrders.OrderID,Orders.CustomerID,Orders.EmployeeID,Orders.timeid,Orders.spid,Orders.OrderDate,Orders.FreightFROMOrdersINNERJOINCustomersONOrders.CustomerID=Customers.CustomerIDINNERJOINEmployeesONOrders.EmployeeID=Employees.EmployeeIDINNERJOINordertimeONOrders.timeid=ordertime.timeidINNERJOINypxxONOrders.spid=ypxx.spid创建流程的优先顺序:﹡执行SQL任务删除现有的ORDERS数据﹡将数据汇集到各个维表中﹡将数据汇集到事实表中执行并保存DTS包,如(图3.5)所示:图3.5流程控制3.3多维数据分析模块创建一个OLAP数据库与SQL数据库类似,SQL数据库保存关系型表,而OLAP数据库保存多维立方。通常创建OLAP的一般步骤为:①数据源。②创建维。③浏览维的元数据。④处理维。⑤创建立方。⑥设计存储和处理。⑦浏览多维数据。3.3数据挖掘模块3.3.1数据挖掘定义数据挖掘[3]从技术角度来看比较公认的是W.J.Frawley.GpiatetskyShapiro等人提出的:数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在的有用信息,提取的知识表示为概念(Concept)、规则(Rule)、规律(Regularities)、模式(Patterns)等形式。3.3.2Analysisservers数据挖掘实例过程及分析通过借助分析服务器的工具标识数据中的规则和模式,从而可以预测医药行业利润提高的可能性因素以及将来要出现的问题。在Analysisservers中创建数据挖掘解决方案时,首先要创建描述业务问题的模型,然后生成数据的数学模型的算法运行数据,此过程称作“定型模型”。再依据该算法直观地浏览挖掘模型或创建预测查询。下面是通过一个医药企业销售的OLAP数据集来创建挖掘模型从而得出结论。(1)创建Analysisservers项目为Orders创建新的项目,数据源定义了连接到挖掘模型所基于的数据源时使用的连接字符串和身份验证信息。同时还提供摘要信息,使用该信息修改结构可以使其与项目的关系更密切。其中数据源中包括表Customers,Employees,Orders,Ypxx,Ordertime,Suppliers等。表Customers记录数有91个,属性包含有Customerid,name,monthly-Income,card,Country,Phone等,用户Country属性中有USA,Germany,Mexico,UK,France,Sweden,Spain,Canada,Argentina
本文标题:医学信息学论文基于数据仓库的医院客户关系管理技术分析与研究
链接地址:https://www.777doc.com/doc-2639816 .html