您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据处理方向课程群
大数据处理方向培养具有良好科学素养,在具备一定的数学、计算机等方面知识的基础上,较全面地掌握大数据方向的基本理论和技术,能运用所学知识解决实际问题,具有较高的综合业务素质、较强的创新与实践能力、能从从事大数据分析、大数据应用开发、大数据系统研发、数据可视化等工作(1)数学基础课程群数学是进行数据分析和处理的基础和工具,必须重视数学基础课程的学习。可以将高等数学、概率论与数理统计、离散数学和线性代数等课程划分到数学基础课程群中。(2)程序设计课程群作为计算机专业的学生,程序设计的学习和程序设计能力的培养至关重要。该课程群应该包含如C语言、C++以及JAVA语言等程序设计语言,此外还需要包含数据结构、算法、软件工程等课程。(3)计算机核心类课程群包含计算机专业中必修的一些核心课程,如:操作系统、计算机组成、编译原理和计算机网络等。(4)大数据处理类课程群了解和掌握大数据处理的主要组成过程是该课程群建设的关键,具体来说其过程包含如下几个部分:1)数据采集,负责将分布异构的、结构化或非结构化的数据抽取到中间层,经过清洗、转换、集成,最后加载到数据仓库。2)数据存储,用关系数据库或NOSQL等将数据有效存储起来。3)基础架构,包括分布式文件系统、云存储等技术,如开源的分布式系统基础架构Hadoop等。4)数据处理,其中包括自然语言处理,即让计算机“理解”人类的语言。MapReduce作为一种用于处理大规模数据集的并行编程模型,也非常重要。5)统计分析,是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动,包括多种数据分析方法,例如:假设检验、显著性检验、T检验、方差分析、卡方校验、回归分析、曲线估计等。6)数据挖掘,指从大量的数据中通过算法搜索隐藏于其中信息的过程。其常通过机器学习、专家系统和模式识别等方法来实现。7)模型预测,包括预测模型和建模仿真等。8)结果呈现,将大数据分析和处理的结果以易于理解的方式呈现出来。该课程群可以包含如下课程:数据库原理与应用、Hadoop实践、数据分析、机器学习、数据挖掘、云计算技术、数据可视化、并行与分布式计算、社交网络分析、模式识别和大数据实例分析等。
本文标题:大数据处理方向课程群
链接地址:https://www.777doc.com/doc-2511917 .html