您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告3
1本科生毕业设计(论文)开题报告学生姓名:导师姓名、职称:所属学院:管理学院专业班级:信息管理与信息系统设计(论文)题目:基于数据挖掘的大学生心理行为管理系统2015年3月8日2开题报告填写要求1.开题报告应根据教师下发的毕业设计(论文)任务书,在教师的指导下由学生独立撰写。2.开题报告内容填写后,应及时打印提交指导教师审阅。3.“设计的目的及意义”至少800汉字(外语至少500字),“基本内容和技术方案”至少400汉字(外语至少200字)。进度安排应尽可能详细。4.指导教师意见:学生的调研是否充分?基本内容和技术方案是否已明确?是否已经具备开始设计(论文)的条件?能否达到预期的目标?是否同意进入设计(论文)阶段?3撰写内容要求(可加页):1.目的及意义(含国内外的研究现状分析)1.1国内的大学生健康研究现状分析高等教育自1999年扩招以来,在校大学生人数不断增长,经过了十多年的时间大学生的人数成倍的增长,大学生的心理健康已经成了各界关注的问题,而我国的心理健康研究方法主要是心理测量法和问卷调查法,然后对这些测量表和问卷进行分析得出结果我国大学生心理健康研究主最常用的心理健康测量表有卡特尔人格因素测验(16PF)、大学生人格问卷(UPI)、埃克森人格问卷(EPQ)、自评量表(SCL-90)其他还包括考试焦虑量表、自尊量表躯体自信量表等。上述这些表基本都是从国外引进经过了汉化,不少学者认为不科学,也有不少学者致力于开发适合我国学生群的测量表,我国的大学生心理健康教育从最初的开设心理学课程和心理教育教育讲座,普及心理知识,校内建立心理咨询和辅导机构等应对方式。近几年随着科学技术的发展特别是计算机科学技术的发展,网上出现各种各样的测评网站。学校也开始开发这样的网站,学生可以在网上测评,网站会根据测评的结果来分析个人和群体行为特征给出适当的结果和建议。1.2国外的大学生健康研究现状分析国外的研究以美国的为例,美国非常重视学校心理健康教育的研究有不少的学者进行了对比研究,如孙晓青等认为美国的大学生心理健康研究已经有相当的规模、研究量表多样化、研究范围多维化,研究范式实证化是其主要的特征。与我国类似,国外的学者认为大学生心理状况存在较大的问题,据世界卫生组织报道,美国年青人的疾病负担中,有一半来自心理障碍。较之于我国大学生心理健康研究角度和内容,国外的角度更加宽泛,内容更加丰富。41.3国内研究现状分析数据挖掘(DataMining),又称为数据库中的知识发现(KDD),是从大量数据中获取有效、新颖、潜在有用且最终可理解的模式的非平凡过程。简单的说,数据挖掘是从大量历史数据中寻找其规律的技术,是统计学、数据库和人工智能技术的综合。国内对数据挖掘和知识发现的研究晚于国外。1991年,陈文伟等学者根据信息论示例学习方法提出了IBLE算法,这个算法在选择实体重要特征时,是用信息论中信道容量的概念作为衡量标准进行度量,所以,信道容量能够克服了相互信息依赖正、反比例的缺点。该算法选取一组重要的特征来建立规则,把它作为决策树的结点。所以,为了实现实例正确有效地判断,就必须用多个特征组合成规则的结点进行识别。1997年国家通过自然科学基金开始对数据挖掘的研究进行支持。之后国内的很多科研单位和院校都在这个领域获得了丰硕成果,这些单位包括中科院、清华大学、中国科大、复旦大学等,他们的成果为我国在此领域的发展起到了重要作用,得到了学术界的高度重视。现在决策树的研究方向主要是以下几点:(1)提高决策树的精度预测精度是决策树研究的重点,同时也是判断各种决策树生成算法和剪枝算法优劣最重要的衡量指标。通过构造多变量决策树从而减小树的规模,最终实现提高决策树精度的目的,所以如何提高决策树的预测精度也成为决策树方法研究中重要的一个研究方向。(2)修剪简化决策树决策树的修剪主要分为两个部分:一是通过对各种决策树剪枝方法的比较和分析,找出它们自身的特性和优缺点,并根据情况从中选择最适用的方法:二另辟蹊径找到不同于传统方法或者优于现用的剪枝方法。(3)决策树与其他技术的结合在知识发现中,一种方法是无法处理全部的数据集的,为了完成数据采掘的任务,必需要和其它方法相结合。为提高处理效率和精度,研究者将决策树同人工神经网络技术、遗传算法和模糊集理论等技术结合起来一起研究,取得了良好的效果。所以,决策树多元化、和其他技术的交叉结合也是决策树方法研究的一个重点。(4)软件实现51.4国外研究现状分析数据挖掘(DM)最早出自于数据库中的知识发现(KDD),数据挖掘技术通过多年的不断研究和实践应用,现在已经逐渐发展成为一门综合性的学科,涉及了诸如数据库技术、人工智能、统计分析、机器学习、模糊数学等众多领域,并不断地吸收这些领域的理论、技术和研究成果,形成了具有自己特色的研究分支。对于数据挖掘我们一般有两种定义,即广义定义和狭义定义。广义上定义数据挖掘,就是从大型数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。狭义上定义数据挖掘,则是指从特定形式的数据集中提炼知识的过程。我们一般认为归纳学习方法中的示例学习是决策树学习的基础,它出自于概念学习系统CLS(conceptlearningsystem)。CLS第一次在概念学习中应用了决策树,可惜的是CLS却不能出现太大的学习问题,这是它最大的缺点,但它却是以后出现的很多决策树学习算法的基础。Quinlan于上世纪七十年代末提出了一个著名的学习算法ID3算法,信息论中嫡的概念在这个算法中首先得到了应用,并将决策属性分类的判别能力利用信息增益来度量,选择决策节点属性。用这个算法来形成决策树是通过选择窗口来实现的,所以有着较强的学习能力,在处理大规模的数据库问题时相对比别的算法有优势。但ID3算法的缺点也很明显,主要有无法处理属性值缺失、不能对连续属性进行处理、计算信息增益时偏向取值较多的属性等。专家和学者也通过改进这些缺点,形成了各种各样的算法。二十世纪八十年代,LBreiman等人针对ID3算法最后生成的决策树分枝较多、规模较大的缺点,提出了CART算法,这个算法就是完全克服了这些缺点。因为此算法源于ID3算法,所以它们的原理相似。在以RT算法中,提出并应用了杂度削减的概念,在决策树的生成过程中,取杂度削减最大的节点作为分裂节点,并最终生成二叉树;当树剪枝和误差评估时,则使用的是重采样技术,直至最终生成最优决策树。分类过程中,CART算法的全部或部分训练集是一直驻留在内存中。上世纪90年代早期,Quinlan自己也将ID3算法进行了改进,提出了现在人们熟知的C4.5分类算法,这个算法与以往算法最大的区别就是运用信息增益比值来进行估算,对每个属性的信息增益率计算6得出具有的最高信息增益率的属性,就是测试属性。它继承优点弥补缺点,是ID3算法的升级和发展。Mehta等人于上世纪九十年代后期提出了一种快速可扩展的分类算法,SLIQ分类方法。在决策树的构造过程中,根据数据量大于内存容量的情况,利用在磁盘上属性列表和内存中类列表两种数据结构,通过采用预排序技术和广度优先的决策树生长方法,使用此算法可对磁盘上的数据集进行分类,同时不降低精确度。SLIQ在处理数据时,由于内存中一直驻留着类表,而导致处理的数据量很小。上世纪九十年代后期,J.Shafer等人也提出与SLIQ具有可比性的一种算法-SPRINT算法,这是一种可扩展的、可并行的归纳决策树。它不受内存限制、处理速度快,在设计上兼顾并行处理,允许多个处理器相互合作生成一致的决策树模型。在SPRINT算法使用过程中,建树和剪枝是分开的,顺序是先建立生成决策树,剪枝是在决策树生成之后进行,剪枝完成后,所留决策树只是原始决策树很小的一部分,由于计算复杂,所以决策树的执行效率非常低。PUBLIC算法由Rastogi等人于上世纪九十年代末提出,在算法中提出的观点是建树和树的剪枝是集成在一起的,在建立决策树时,树的相关节点的目标函数值是根据函数计算得出的,假如这个节点在以后的调整阶段将会删除,那么就不对此结点进行扩张,否则继续扩展该结点。我们把通过这样的计算生成的PUBLIC决策和对同一样本集使用预剪枝策略生成的决策树进行比较,结果发现这两种树完全一样,由此可见,PUBLIC算法的执行效率是很高的。1.5目的及意义随着计算机的普及,人们逐渐步入了网络化的生活,学习、工作、娱乐都离不开电脑。我们走向了虚拟的网络世界,交流足不出户在社交工具上进行,工作是离不开软件工具,娱乐更是不再完全依赖电影院,一切可以更快更好的在电脑上解决。然而,虚拟的网络生活也产生了越来越多的心理问题,在学生中更是普遍。目前大学生主要以独生子女偏多,还有部分是来自父母离异的单亲家庭,对于一些来自特殊环境的孩子心理问题成了严重的挑战。因为大学生刚入校,面临一个全新的、开放的、更加宽松的环境,部分学生的心理和行为7一时难以适应,譬如思想比较封闭,精神紧张,行为拘谨。人际关系也发生巨大改变,许多学生面临复杂和多样的人际关系,新生出现消极的情绪和心理,如不满、悲观、失望,由此导致苦闷,缺乏学习动力,自卑等等。如果这些心理状态长期得不到调整,必将导致心理疾病。各个高校基本都对学生进行心理调查,可是如何分析、解释、和使用这些庞大的心理测量结果,才能使心理教育工作更有针对性,从而提高心理辅导工作的水平和效率,使得测试结果发挥更大作用,数据挖掘和知识发现技术正是解决了这一难题,使用数据挖掘的技术可以对学校学生测评的海量数据进行分析挖掘得出合适的结果,同时随着高校心理健康教育的进一步深化,高校学生心理档案的建立、心理健康水平的测量、心理咨询中心的日常管理工作等都成为心理咨询中心的综合性工作的决定性因素,学生心理管理系统的使用可以使学生心理档案的建立更加快捷,信息量更大,管理更科学,从而促使学生心理健康教育与咨询工作的深入开展。2.研究(设计)的基本内容、目标、拟采用的技术方案及措施2.1研究内容及目标在MicrosoftVisualStudio2008的平台上采用B/S结构,开发一个基于数据挖掘技术的大学生心理行为管理系统,对学校学生进行网络测评,针对数据挖掘技术在大学生心理问题领域的应用进行研究。重点是大学生心理问题数据的分类挖掘。在详细分析和比较各种常用分类算法的基础上,结合心理问题数据的特点,选择决策树算法构建大学生某种心理问题有无症状的决策树模型,然后给出相应的结果和建议。2.2拟采用的技术方案及措施83.进度安排研究背景和国内外研究趋势数据挖掘理论基础、挖掘技术分析决策树算法介绍数据采集对学生行为数据进行分析实施数据挖掘的方法分析应用决策树算法的结果得出及、得出结论9毕业设计题目的确定:2014-12-20至2015-01-10学生选题确定:2015-01-10至2015-01-29开题报告完成:2015-03-03至2015-03-16毕业设计查阅收集资料,整理:2015-03-17至2015-03-22需求分析,确定功能模块,建立模型:2015-03-23至2015-04-05详细设计,包括数据设计和模块设计:2015-04-06至2015-04-19界面设计,代码分析与实现:2015-04-20至2015-05-03系统修改与调试:2015-05-04至2015-05-10论文初稿完成:2015-05-11至2015-05-13论文修改稿完成:2015-05-14至2015-05-17论文定稿完成:2015-05-18至2015-05-19毕业设计答辩:2015-06-084.阅读的参考文献不少于15篇(其中近五年外文文献不少于3篇)[1]毛国君,段立娟,王实.数据挖掘原理与算法.北京:清华大学出版社,2005[2]UMFayyadetal.Advancesinknowledgediscoveryanddatamining.Cambriage:MA:AAAI/MITPress,2003.[3]王惠中,彭安群.数据挖掘研究现状及发展趋势.工矿自动化,2011[4
本文标题:基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告3
链接地址:https://www.777doc.com/doc-2536563 .html