您好,欢迎访问三七文档
数据处理教案引言:根据高专中专部安排,由我带10级综合班的数据处理课和Office办公自动化课,根据教学的要求,特写此教案,该教案分为5部分,第一部分介绍数据处理定义,结构,常用软件;第二部分计算机基础;第三部分介绍Excel数据处理;第四部分介绍常用数据库(access、sql语句),第四部分介绍简单的关系数据库、数据建模等;第五部分介绍简单的数据处理、报表制作等。第一部分数据处理定义,结构第一节数据处理定义教学目的:通过对数据处理的定义使学生明白,在当今的社会,数据是如何的重要,数据处理在现代社会中起到什么样的作用。教学内容:重点是数据处理的定义,难点为如何看待数据和信息的关系,模糊数据和数字数据的区别教学方法:口述与上机教学进程:全面4个课时为理论口述讲解,后面4个课时上机介绍数据处理常用软件。1.1.1数据处理定义数据处理是对数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程1.1.2数据处理软件数据处理离不开软件的支持,数据处理软件包括:用以书写处理程序的各种程序设计语言及其编译程序,管理数据的文件系统和数据库系统,以及各种数据处理方法的应用软件包。为了保证数据安全可靠,还有一整套数据安全保密的技术。1.1.3数据处理方式根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。数据处理主要有四种分类方式①根据处理设备的结构方式区分,有联机处理方式和脱机处理方式。②根据数据处理时间的分配方式区分,有批处理方式、分时处理方式和实时处理方式。③根据数据处理空间的分布方式区分,有集中式处理方式和分布处理方式。④根据计算机中央处理器的工作方式区分,有单道作业处理方式、多道作业处理方式和交互式处理方式。1.1.4数据处理加工数据处理对数据(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应用领域中,数值计算所占比重很小,通过计算机数据处理进行信息管理已成为主要的应用。如侧绘制图管理、仓库管理、财会管理、交通运输管理,技术情报管理、办公室自动化等。在地理数据方面既有大量自然环境数据(土地、水、气候、生物等各类资源数据),也有大量社会经济数据(人口、交通、工农业等),常要求进行综合性数据处理。故需建立地理数据库,系统地整理和存储地理数据减少冗余,发展数据处理软件,充分利用数据库技术进行数据管理和处理。1.1.5数据清洗有关商务网站的数据处理:由于网站的访问量非常大,在进行一些专业的数据分析时,往往要有针对性的数据清洗,即把无关的数据、不重要的数据等处理掉。接着对数据进行相关分分类,进行分类划分之后,就可以根据具体的分析需求选择模式分析的技术,如路径分析、兴趣关联规则、聚类等。通过模式分析,找到有用的信息,再通过联机分析(OLAP)的验证,结合客户登记信息,找出有价值的市场信息,或发现潜在的市场。第二节数据处理结构教学目的:通过对数据处理结构的介绍使学生明白数据仓库、数据集市与数据挖掘的关系。教学内容:重点是数据仓库的图像理解,难点也是数据仓库整体结构的理解。教学方法:口述与上机教学进程:全面4个课时为理论口述讲解,后面4个课时上机介绍数据仓库案例。1.2.1商业智能在中国的发展机会(数据处理)商业智能就像几年前的ERP(企业资源管理)一样,正成为企业首席技术官们关注的焦点,呈现如火如荼的发展态势。众所周知,在ERP等基础信息系统部署完之后,企业能够对其业务数据进行更为有效的管理,于是如何利用这些数据创造价值成为企业下一步思考的问题。商业智能系统已经作为一种含金量极高的管理工具,融合在部分大型企业管理文化的血脉之中了。商业智能在帮助企业管理层发现市场机会、创造竞争新优势的作用显而易见,因此成为企业信息化的新宠也是必然的。商业智能软件市场稳步增长从全球范围来看,商业智能领域并购不断,商业智能市场已经超过ERP和CRM(客户关系管理)成为最具增长潜力的领域。从中国市场来看,商业智能已经被电信、金融、零售、保险、制造等行业越来越广泛地应用,操作型商业智能逐步在大企业普及,商业智能不局限于高层管理者的决策之用,也日益成为普通员工日常操作的工具。不过,尽管这个市场潜力巨大,但仍有不少的现实情况导致这一市场的发育没有大家预期中的那么好。首先一点,国内的成熟、专业的商业智能实施顾问较少,不但上游厂商的相关人才少,下游负责实施的渠道合作伙伴更是缺乏相关人才,很多时候用户要启用商业智能工具,但是不太明确自己的需求,负责实施的人很多时候也是一知半解,不能给用户很好的解决方案;其次,目前多数商业智能厂商,尤其是国外厂商都是通过分公司或办事处来销售的,而未来国内制造业企业多数需要本地化服务,这种模式必将改变。同时,商业智能系统的销售、服务要求代理商要有很强的能力,如何选择、培养、发展这些代理商将是商业智能大发展面临的一个很重要问题。SaaS将成为重要交付模式同时,商业智能系统的核心不是平台,而是模型。目前,由于国内应用商业智能的企业并不多,应用深入的更少,应用基础也比较薄弱,即使拿来国外先进的商业模型也不一定能运转起来,所以尽快建立各种适合国内企业特色的模型是各服务商未来要加大投入着力解决的。当然,对企业而言,商业智能的有效应用,离不开数据的支持。如果没有准确的数据,那么所要分析产生的报表、决策都与事实存在差距,将会导致整个决策的错误,因此,必须要求前期的数据准确。最后,随着云计算的大规模普及,下一代商业智能的精细分析系统很可能会建设在动态的基础架构上,而虚拟化、云计算等技术的发展也会带动商业智能系统的建设和应用,这就是“云智能”。我国企业需要抓住“云智能”机遇,加快发展、迎头赶上,才能从容应对下一阶段的全球化竞争。1.2.2数据仓库技术的发展及体系结构1数据仓库技术的发展及概念传统的数据库技术是以单一的数据资源,即数据库为中心,进行事务处理工作的。然而,不同类型的数据有着不同的处理特点,以单一的数据组织方式进行组织的数据库并不能反映这种差异,满足不了现代商业企业数据处理多样化的要求。总结起来,当前的商、世企业数据处理可以大致地划分为2大类:操作型处理和分析型处理。操作型处理也叫事务型处理,主要是为企业的特定应用服务的(这是目前最为常用的),分析型处理则用于商业企业管理人员的决策分析,这种需求既要求联机服务,又涉及大量用于决策的数据,传统的数据库系统已经无法满足,具体体现在:1)历史数据量大;2)辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;3)由于访问数据的能力不足,它对大量数据的访问能力明显下降。数据仓库技术的出现为解决上述问题提供了新的思路。数据仓库的创始人Inmon指出:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程”。它从大量的事务型数据中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据聚合在一种特殊的格式中,作为决策分析的数据基础,从而在理论上解决了从不同系统的数据库中提取数据的难题。同时,利用联机分析处理(OLAP)技术可以对数据仓库提供的数据进行深入加工。2企业数据仓库的体系结构一个典型的企业数据仓库系统通常包含数据源、数据存储与管理、OLAP服务器以及前端工具与应用4个部分。1)数据源。数据源是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于企业操作型数据库中(通常存放在RD-BMS中)的各种业务数据,外部信息包括各类法律法规、市场信息、竞争对手的信息以及各类外部统计数据及各类文档等。2)数据的存储与管理。数据的存储与管理是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(具体包括数据仓库的数据字典、记录系统定义、数据转换规则、数据加载频率以及业务规则等信息)。按照数据的覆盖范围,数据仓库存储可以分为企业级数据仓库和部门级数据仓库(通常称为“数据集市”,DataMart)。数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。这些功能与目前的DBMS基本一致。3)OLAP服务器。对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,发现数据趋势。4)前端工具与应用。前端工具主要包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库或数据集市开发的应用。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具既针对数据仓库,同时也针对OLAP服务器。1.2.3商业智能(BI)落地需要的三大工具商业智能(后面简称BI)的各类角色用户必须借助和使用工具实现其需求。BI角色分为业务、业务融合技术、技术这三类,对于其相应的应用需求(含演绎型和归纳型)和管控开发需求,需要借演绎型需求支撑工具和归纳型需求支撑工具,及管控开发型工具来予以实现。本篇先讲述演绎型需求支撑的7种工具,其可分为描述统计工具、经营技术与方法、经济预测方法与模型、OLAP分析、知识发现工具、专家系统以及决策方法与模型。管控开发支持型工具一般包括系统管理工具、开发工具;笔者认为BI以认识论和组织理论为基本原理,采取相适宜的“工具”,旨在帮助“相关角色”对职责范围内的“有关内容”做出最佳决定的整体解决方案。它由“三维模式”和“三层漏斗”组成,是辅助整个企业集理念,组织,流程,技术为一体的整体决策支持方案三维模式由角色维、内容维和工具维构成,体现了BI的主体、客体和工具等一般性原理。根据BI的定义,只有清晰划分相关角色并据以确定需求,并借助工具才能实现BI辅助主体对职责范围的有关事项做出最佳决定的宗旨。BI的业务类角色、技术类角色以及业务融合技术类角色对应存在着业务应用需求(指业务类的演绎型需求和业务融合技术类的归纳型需求)和技术应用需求,即管控开发型需求。这种需求能否得以有效实现和提升,必须借助工具。针对三大类角色的两种需求,BI的工具分为应用型支撑型工具和管控开发支持型工具。鉴于文章的范围,硬件支撑工具的内容请参见相关书籍。应用支撑工具可以分为描述统计工具、经营技术与方法、经济预测方法与模型、OLAP分析、知识发现工具、专家系统以及决策方法与模型。管控开发支持型工具一般包括系统管理工具、开发工具。一般来说,这些工具以软件包的形式形成产品。鉴于BI对于业务应用的重要作用及业务应用成功对BI的重要意义,本文着重分析BI的应用型支撑工具,并对有关产品作简单介绍。一、实现演绎型需求的7种工具BI的演绎型内容可以分为三个层次:报表查询、综合分析、决策选择讨。如下图所示,BI的演绎型需求通过描述性统计工具、报表与展示工具、经济预测方法与模型、经营技术与工具、OLAP分析及专家系统工具、决策方法与模型来实现。上图中,描述性统计工具帮助用户在报表查询层次实现对事实的充分了解;综合分析以逻辑的方式帮助相关主体寻求原因或对简单问题直接获得建议,需要运用经济预测方法与模型、经营技术与工具及OLAP分析来得以实现。专家系统和决策方法与模型是实现定量和部分定性决策的有力工具。通过该类工具,用户在决策选择时通过评价各个方案的优劣来辅助主体选择最优,得出结论。BI演绎型应用的三层次结构合理、有步骤地解决了前提、逻辑规则和结论这一演绎型思维方法的迁移
本文标题:数据处理教案
链接地址:https://www.777doc.com/doc-2428036 .html