您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 《数据挖掘》教学大纲
河北经贸大学课程水平认定《数据挖掘》学习大纲课程名称数据挖掘课程类型必修课总学时32学时学分2学分适用专业统计学开课单位数统学院一、学习性质《数据挖掘》是大数据背景下现代统计数据分析不可缺少的重要工具。通过本课程的学习,培养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求的专业人才。二、学习目的本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题,了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非统计技术评估数据挖掘对话的结果等。三、学习要求重点掌握几种数据挖掘策略及每种策略的适用时机;如何通过几种数据挖掘技术建立模型来解决问题。四、课程内容与学时分配课程内容与学时分配课程内容学时分配自学自学研讨调研第一章引言22第二章数据预处理22第三章分类和预测48第四章复杂类型数据的挖掘44第五章数据挖掘的应用和发展趋势22五、课程考核和成绩评定课程考核为闭卷考试。成绩评定:考试成绩实行百分制,其中基础知识测试题的分值掌握在40分左右;综合能力测试题的分值掌握在60分左右。60分为及格。六、推荐教材和学习参考书推荐教程作者出版社及出版时间数据挖掘:概念与技术JIAWEIHANMICHELINEKAMBER机械工业出版社,2006学习参考书作者出版社及出版时间数据挖掘导论范明,范红建人民邮电出版社,2006数据挖掘与应用张俊妮北京大学出版社,2009数据挖掘-概念、模型、方法和算法闪四清,陈茵,程雁清华大学出版社,2003七、学习具体内容第一章引言一、基本要求要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体的认识;重点掌握Clementine基本功能和操作;海量数据的选择,会正确解释软件处理的结果,尤其掌握样本信息的解释。二、授课方法自学。三、学习内容(一)什么激发了数据挖掘以及它的重要性(二)数据挖掘定义(三)在何种数据上进行数据挖掘1、关系数据库2、数据仓库3、事务数据库4、高级数据库系统和高级数据库应用(四)数据挖掘功能——可以挖掘什么类型的模式1、关联分析2、分类和预测3、聚类分析4、孤立点分析5、演变分析(五)数据挖掘软件Clementine的基本功能和操作四、重点难点数据挖掘的概念和基本功能五、思考与讨论1、什么是数据挖掘?2、数据挖掘的对象是什么?3、数据挖掘的主要功能有哪些?4、Clementine的基本功能和操作。第二章数据预处理一、基本要求要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,尤其是样本信息的解释;同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理。二、授课方法自学。三、学习内容(一)数据预处理的原因(二)数据集成和变换1、数据集成2、数据变换(三)缺失值处理的方法1、处理带有缺失值的记录2、处理带有缺失值的字段3、归因或填充缺失值4、用于缺失值的CLEM函数四、重点难点数据集中缺失值的处理方法及Clementine软件实现。五、思考与讨论1、为什么进行数据预处理?2、数据预处理的主要方法和适用范围是什么?第三章分类和预测一、基本要求要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现,了解分类、预测方法的基本应用。二、授课方法自学。三、学习内容(一)什么是分类,什么是预测(二)分类预测:决策树1、决策树的基本思想2、C5.0算法及软件实现3、决策树的案例及分析(三)分类预测:神经网络1、神经网络的基本思想2、神经网络的软件实现3、神经网络的案例及分析(四)预测1、线性回归和多元回归2、非线性回归3、其他回归模型(五)分类预测的准确性1、评估分类法的准确率2、提高分类法的准确率3、准确率足够判定分类法吗四、重点难点分类、预测的各种建模方法、软件实现及应用五、思考与讨论1、分类预测的作用和基本思想是什么?2、决策树的基本思想和软件实现。3、神经网络的基本思想和软件实现。4、分类预测模型的评估。第四章复杂类型数据的挖掘一、基本要求要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型的构建方法及应用。二、授课方法自学。三、学习内容(一)复杂数据对象的多维分析和描述性挖掘1、结构化数据的概化2、空间和多媒体数据概化中的聚集和近似计算3、对象标识符和类4、类复合层次的概化5、对象立方体的构造与挖掘6、用分而治之方法对规则数据库进行基于概化的挖掘(二)空间数据库挖掘1、空间数据立方体构造和空间OLAP2、空间关联分析3、空间聚类方法4、空间分类和空间趋势分析5、光栅数据库挖掘(三)时序数据和序列数据的挖掘1、趋势分析2、时序分析中的相似搜索3、序列模式挖掘4、周期分析四、重点难点时间序列数据挖掘模型的构建方法及应用五、思考与讨论1、什么是复杂类型数据?2、复杂类型数据的数据挖掘模型主要有哪些?3、时间序列数据挖掘模型的构建方法及软件实现。第五章数据挖掘的应用和发展趋势一、基本要求要求学生了解数据挖掘的应用和发展趋势。二、授课方法自学。三、学习内容(一)数据挖掘的应用1、针对生物医学和DNA数据分析的数据挖掘2、针对金融数据分析的数据挖掘3、零售业中的数据挖掘4、电信业中的数据挖掘(二)数据挖掘的发展趋势四、重点难点数据挖掘的应用范围和发展趋势。五、思考与讨论1、数据挖掘的主要应用领域。2、数据挖掘的发展趋势。
本文标题:《数据挖掘》教学大纲
链接地址:https://www.777doc.com/doc-4833761 .html