您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 开题报告(数据挖掘)
附表三:高校教师在职攻读硕士学位研究生论文选题计划表研究生姓名:指导教师:专业:计算机应用技术所属院(所):计算机科学与技术学院2010年4月2日─1─研究生姓名专业计算机应用技术导师姓名研究方向数据挖掘毕业论文题目数据挖掘在高职教学中的应用论文类型理论研究应用研究用于生产其它选题目的和意义:由于我国大众化高等教育的普及,高校学生数量的激增,给高校教学工作带来了诸多新的问题。尤其是高职学生,他们的主体是普通高中应届毕业生高考最后一批录取的学生。这些学生在学习意识、学习方法、学习能力及学习动力上比较欠缺,并可能有较多常见的心理问题。大部分学生没有养成良好的学习习惯。他们中的大部分学习基础比较差.自制力也比较弱,学习目标不够明确,缺乏刻苦钻研精神。很多学生就读离职并不是因为自身渴望学习。而是无可奈何或出于应付家长的要求。他们对所学的专业并没有太多了解,因此学习目标不够明确同时,他们还对社会对其的容纳有一种怀疑,这种怀疑直接导致了自信心的不足,由此也影响到学生学习的动力。此外,由于这批学生普遍没有养成良好的学习习惯,叉影响了良好学习氛围的营造,不良的学习氛围又反过束影响学生的学习动力。教师迫切地需要科学地研究高职教学各个环节中的大量的数据信息。从中获取知识,继而科学地指导教学。二十世纪,数据库技术取得了决定性的成果并且得到广泛应用.大量信息在给人们带来方便的同时也带来了一大堆难题;第一是信息过量,难以消化;第二是信息真假难以辨识:第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。人们开始提出一个新的口号:“要学会抛弃信息”,并开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”如何从含有海量信息的数据库中提取潜在、有价值的信息来辅助决策,预测未来成为信息处理的更新更高的要求,知识发现和数据挖掘技术应运而生,共显示出强大的生命力。数据挖掘使数据库技术进入了一个更高级的发展阶段。─2─数据挖掘技术(DataMining)被称为未来信息处理的骨干技术之一,是一个多学科交叉研究领域,融合了数据库,人工智能、机器学习,统计学,知识工程、面向对象方法、信息检索,高性能计算以及数据可视化等多项最新技术.数据挖掘技术从80年代末开始出现。短短二十多年它的发展速度很快。目前数据挖掘技术在零售业的购物篮分析、金融风险预测、产品质量分析、通讯及医疗服务、基因工程研究等许多领域得到了成功的应用.很多专题会议也把数据挖掘和知识发现列为议题之一。把数据挖掘技术应用于高等学校的教学与管理中,是数据挖掘技术在又一个领域的应用.高等学校多年来的教学和管理工作积累了大量的数据,目前,鉴于社会对高等学校发展的需求和高校数据管理的现状,利用这些数据理性的分析学校各方面工作的成效以及教师发展状况,对高校教学管理决策支持系统的影响变得十分重要。数据挖掘技术能从大量数据中发现有用的知识,这些知识对高等学校教学管理的决策支持是十分有意义的。利用数据挖掘技术从数据仓库中获取高质量的信息,可以检验教学效果,调节课程设置。合理安持师资,正确评价教师的年度工作,及辅助调整招生计划、分析预测就业趋势等等。虽然目前数据挖掘技术主要在商业领域中得到广泛发展,但它面向应用的本质决定了在任何需要的领域都会发挥它的价值.在高校教育教学及管理中有大量直接或间接的数据,关系到教师评价、人才管理及学生选课指导、学生成绩分析等内容。这些数据具有复杂性、多因素性和模糊性等特点,是一类带有大量不确定因素的半结构化问题或非结构化问题而大量的数据主要是以各级管理部门提供的统计报表和简单信息查询方式存在,对这些数据所隐含的价值没有充分挖掘利用。通过数据挖掘技术,找出有价值的信息,客观、科学、全面地供教学管理部门参考。以学生成绩为例,教师对学生成绩的分析处理一般仅仅是统计成绩处在优、一般、差级别的人数,对于学生取得这些成绩的原因往往无法了解。如果教师能够找到有关影响学生学习成绩的因素,必然对教学质量的提高起到积极的作用。─3─国内外研究动态:自1989年第11届国际联合人工智能学术会议上首次提出KDD这一概念以来,数据挖掘日益受到人们的关注。并已经成为当前计算机领域的一大热点,其研究的重点也逐渐从发现方法转移到系统应用,并且注重多种发现策略和技术的集成,以及多学科之间的相互渗透。从总体上,国外在数据挖掘领域中的研究内容十分广泛,从挖掘知识的种类看,己经取得了明显的成果。1、关联规则的研究。近几年对关联规则的研究内容较多。现在,关联规则的挖掘已经从单一概念层次关联规则的发现发展到多概念层次关联规则的发现,并把研究的重点放在提高算法的效率和规模可收缩性上。目前,人们对于定量关联规则以及其他种类的关联规则的发现研究较为深入,提出了关联规则的兴趣性的概念。与此同时,在提高挖掘过程的效率方面也作了不少的研究。比较著名的算法有Apfiori,Charm,FP-Growth,MagnumOPUSS,GenMax2、数据分类技术研究。基于决策树的分类方法在大规模数据库条件下的应用研究;在较高的抽象层次分类中,M.Mehte.等人针对大型数据库提出了种快速分类算法,称为QUEST中的超级学习算法,SLIQ:分类与回归的管状领域研究、最近邻分类方法的改进等等。3、聚类规则研究。近年,聚类开始在大型数据库中得到研究,R.Ng和1.Han基于随机搜索以及统计学中的两个聚类算法PAM和CLARA,给出了一个适用于大型应用的聚类算法:CLARANS。M.Este等人针对CLARANS算法的缺点,提出了改进技术。T.Zhang等人则提出了另一种聚类算法:BIRCH。4、泛化、简约和特征提取研究。利用数据可视化大大扩展了数据的表达和理解能力,这是数据简约的一种非常重要的技术,它正受到广泛的重视。与国外相比,国内对数据挖掘与知识发现(MDKD)的研究稍晚,1993年国家自然科学基金首次支持对该领域的研究项目。目前,清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等竞相开展数据挖掘的基本理论及其应用研究。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京─4─大学也在开展对数据立方体代数的研究;华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造:南京大学、四川联合大学山东师范大学硕士学位论文上海交通大学等单位探讨,研究了非结构化数据的知识发现以及Web数据挖掘。现在尽管与国际上的进展相差并不远,一些研究成果例如:总参六十一所李德毅教授在云模型方面的研究、复旦大学的施伯乐教授在关系数据厍中知发现方面取得很大的成果,南京大学开发的KNIGHT系统等.但在实际应用方面却鲜有所闻,成功的例子很少,没有形成整体力量。总的说来.国内在数据挖掘方面的开发还停留在实验的阶段,没有能够真正的投入到实际生产应用中去。数据挖掘最先应用于金融和商业领域,在教育层面上还只能算是新生事物,处于发展的初级阶段。国内高校目前在校园信息网中开展数据挖掘的研究并不广泛。浙江大学使用关联规则发现技术对高校的人事信息库进行挖掘,试图找到影响学科发展的因素,发现如何评价一个学科,以及影响学科发展的各个要素之间的关系。另外。曲阜师范大学体育系与上海市体委就体育人才的选拔探讨了数据挖掘的可行性。在每年对中小学生的体质调查中,积累了大量的数据,利用数据挖掘技术,他们试图从数据中深入寻找各种因素的相互联系,发现一些随机因素动态变化而产生的新的指导学校体育科研和教学训练的规律,进而发现运动人才。数据挖掘在教育层面上的研究还只能算是新生事物,处于发展的初级阶段。在教育信息化的大趋势下,将数据挖掘技术应用于教育领域内的学生招募、市场细分、学生来源分析、课程相关性、学习评价度量、学生生涯规划、远程开放教育的个性化服务等方面,必然有十分广阔的前景。数据挖掘是一种技术,和其他技术一样,数据挖掘也需要时间和精力来研究、开发和逐步成熟,最终被人们接受。目前己经有很多通用的数据挖掘系统,但是还不能达到期望的智能系统那样。在近来的数据挖掘研究和开发中,一些挑战也已受到一定程度的关注,并考虑到了各种需求,而另一些处于研究阶段。然而,这些问题将继续刺激进一步的研究和改进。我们相信,随着数据挖掘任务和方法的发展,一定能带给我们更多的利益,可以节约我们的时间和金钱,并发现新的知识。─5─主要内容:高等学校多年来的教学和管理工作积累了大量的数据,目前这些数据还未能得到有效利用,只是一个待开发的“宝藏”。鉴于社会对高等学校发展的需求和目前高校数据管理现状,利用这些数据理性地分析学校各方面工作的成效以及学生培养过程中的得失变得十分重要。本文主要研究在高校扩招、师生比过大的教学条件下,教师如何利用丰富的信息资源,采用数据挖掘技术,获得辅助决策知识,指导教学,从而进一步提高教学质量。数据挖掘技术主要介绍数据挖掘的基本知识,包括数掘挖掘的过程、数据挖掘的任务、数掘挖掘的分类以及数据挖掘的常用技术和方法。探索数据挖掘技术在高校教学中的应用,提出数据挖掘技术在高校教学应用中的实施方案。实验设计方案:第一步,确定挖掘对象、目标。清晰地定义出问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应是有预见的。第二步,数据采集。这是一个工作量较大,占据时问较多的一个阶段。教师需要在以往的教学实践中,注意收集数据信息,有些数据的产生可以直接获得,有些数据需要对学生进行调查获得。第三步,数据转换。这一步是将教师收集到的不同的数据信息集成并转换为一个分析数据模型,这一数掘模型是针对算法而准备的.不同的算法可能需要不同的分析数据模型。第四步,数据分类挖掘。分类挖掘的目的是为了建立一个分类模型。首先要选择合适的挖掘算法,并使用合适的程序设计软件实现这一算法:接着对所得到的经过转换的数据进行挖掘。第五步,分类规则结果分析。这一步主要解释和评估分类结果。第六步。知识的应用。这一步是将分析所得到的知识集成到教师的教学环节中去,教师可利用所得知识改进教学策略.指导进一步教学。─6─准备工作情况和主要工作措施:利用学院的教务管理系统,获得学生的成绩信息。设计学生信息调查表,由学生填写,内容包括学生对计算机公共基础课程的感兴趣程度、课堂学习效果、对本课程的认识和教师的教学方法等。利用数据挖掘算法对数据进行处理,建立决策树,得出推动计算机课程教学的规则。论文进度安排及预期达到研究结果:2010.4-2010.9资料查询、确定论文主题2010.9-2010.10数据挖掘的理论研究2010.10-2010.11数据挖掘常用技术研究2010.11-2010.12数据挖掘的应用研究2010.12-2011.1数据挖掘的新技术研究2011.1-2011.2数据挖掘的发展方向2011.2-2011.4撰写论文2011.4-2011.5论文修改─7─文献综述:(4000字以上,参考文献30篇以上,其中至少10篇外文参考文献)─8─考核小组对报告人查阅专业技术文献情况的评价1.查阅与本专业相关的专业技术文献数量是否达到30篇(其中外文10篇)?2.查阅的文献是否全面,是否反映本学科专业的最新学术动态,对撰写硕士学位论文是否具有指导意义指导意义?3.文献综述是否认真、有条理,能否较全面地概括文献的主题和创新点?请对文献综述进行综合评价并给成绩(按合格、不合格)。考核小组负责负责签字:年月日─9─选题报告会记录选题报告人:报告会主持人:学位论文题目:参加报告会成员:报告会日期:地点:记录人:报告会记录及考核意见:─10─报告会负责人签字:年月日─11─所在院(所)对选题的意见:负责人:年月日所在系(研究室)对选题意见:负责人:年月日导师对选题的意见:导师:年月日
本文标题:开题报告(数据挖掘)
链接地址:https://www.777doc.com/doc-4567654 .html