您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 基于大数据的高校招生预测系统的设计与实现
文章编号:1〇〇9-2552(2016)12-0080-04DOI:10.13274/j.cnki.hdzj.2016.12.018基于大数据的高校招生预测系统的设计与实现韩娜,廖晨,许杰维,陈美德,张星(北京理工大学珠海学院商学院,广东珠海519085)摘要:校园网站是一个充满信息的学习平台,有时候因为物理信息收集的样本空间少,对有效信息的判断也不到位,而导致信息收集不完整等不良结果发生。文中以北京理工大学珠海学院商学院网站历年招生数据为基础,构建智能化的高校招生预测系统,在校园网络数据上使用相应的数据挖掘手段,给学校的招生带来可视化的招生预测信息等内容。该招生预测系统以WampServer(Windows下的Apache+MySQL+PHP)为开发环境,ThinkPhp为技术核心框架,作为一个整体开发解决方案,能够解决应用开发中的大多数需要,并且结合Jquery以及Html5+Css来实现系统,使用Sublimetext等编译器来编写网站代码,并通过Chrome以及火狐等浏览器来测试系统的稳定性。通过此系统,可以为学校招生提供提高信息获取量,增强信息利用度。关键词:大数据;智慧校园;预测系统;修正指数曲线中图分类号:TP311文献标识码:ADesignandimplementationofCollegeenrollmentforecastingsystembasedonbigdataHANNa,LIAOChen,XUJie-wei,CHENMei-de,ZHANGXing(SchoolofBusiness,BeijingInstituteofTechnologyatZhuhai,Zhuhai519085,GuangdongProvince,China)Abstract:Thecampuswebsiteisalearningplatformwhichisfullolinformation.Sometimesbecauseolthelackolphysicalinformation,thejudgmentoltheeffectiveinformationisnotinplace.Thispaper,basedonthewebsiteolSchoololBeijingInstituteolTechnology,Zhuhai,Businessenrollmentdata,constructstheintelligentcollegeenrollmentforecastingsystem,thecampusnetworkdatausingthecorrespondingdataminingmethods,tobringtheschoolenrollmentandenrollmentforecastinformationandothercontent.ChangingenrollmentpredictionsystemwithWampServer(WindowsApache+MySQL+PHP)developmentenvironment,ThinkPHPtechnologyasthecoreframework,developedasawholesolvingscheme,tosolveinthedevelopmentandapplicationolmostneed,andcombinedwithjQueryandHtml5+Csstorealizethesystem,usingSublimetextcompilertocompilethesitecode,andthechromeandFireloxbrowsertotestthesystem’sstability.Throughthissystem,itcanimprovetheinformationacquisition,enhancethedegreeolinformationutilization.Keywords:bigdata;smartcampus;forecastingsystem;modifiedindexcurve信息疼术2016年第12期0引言随着时代的变换,21世纪迎来了数据化与信息化的时代。这个历史性的时代,带来更多的是信息的快速增长与流动,信息数据的数据量也呈现爆炸性增长。2008年IBM在一份报告中提出“智慧地球”理念,更是把云计算、物联网、应用集成为一个—80—庞大的网络体系。对于校园体系这样一个完整的校园平台,每天收稿日期:2015-12-04基金项目:2015年广东省大学生创新创业训练计划项目作者简介:韩娜(1981-),女,硕士研究生,研究方向为算法设计、机器学习、移动互联网。产生的数据量也非常庞大:校园热点,校园新闻,学院信息等等的信息发布,都可能带来庞大的浏览数据,而怎么从中获取重要的信息就成为了校园网络发展的一大重要问题,因此“智慧校园”也应运而生。智慧校园的诞生,是对校园资源的进一步整合,有效地把校园的数字空间以及物理空间进行衔接利用。校园数据庞大,如何成功地进行数据收集、数据清理、数据变换、数据分析、数据实施是目前需要解决的一大问题,对此,本文基于数据挖掘的智慧校园招生信息推广,主要针对校园网站缺乏信息收集与分析手段进行的技术改进,并予以推广。该应用既服务于学生,也服务于学校管理阶层。1大数据时代的智慧校园建设背景分析校园网站是一个充满信息的学习平台,在这个平台中,每日的信息流量非常庞大,但是对于这些信息,校园管理者却很少进行收集、加工并利用,使得很多信息流失。因为信息的收集不到位,需要花费在物理信息收集上,从而增加了相关的费用,有时候因为物理信息收集的样本空间少,对有效信息的判断也不到位,而导致信息收集不完整等不良结果发生。而该应用有效利用校园网访客信息,并且在大数据的平台下进行智能化分析处理,不仅给学生带来二次访问的良好用户体验,还能给学校管理阶层带来可视化的招生源地域分布信息、学生在校学习生活偏向分析等有益内容。智慧校园的信息来源分为校外与校内两种,可根据浏览人群位置的不同,提供不同的校园网络服务。校外浏览人群可针对招生信息的提供进行相关信息显示,这有效缓解了因为地理位置或经费问题而无法达到宣传校园信息的问题,并且该人群的IP地址会被百度流量统计平台拦截并且进行信息分类,然后实时反馈到热点图应用。在当今网络的数据海洋里,数据挖掘、数据分析能有效了解高中毕业生对高校信息,就读专业的了解,通过信息对比能有效把握考生心理,为校园招生提供一个招生信息平台。招生预测也是大数据对数据处理的一种体现。图1所示为招生信息模拟数据展示图。2高校招生预测系统的构建大数据处理平台的构建,包括了多项数据信息使用,数据从采集到应用这个过程需要一个完整的信息数据应用体系:数据感知、数据通信、数据管理图i招生信息模拟数据展示图构建、数据分析处理、数据模块化应用。智慧校园的应用体系,需要保证构建的统一数据处理。另外,云服务平台的构建,也是大数据时代下智慧校园建设的一个重要方案之一。2.1系统结构基于大数据的高校招生预测系统框架如图2所示,此框架图分为三个模块,分别是前台模块、后台模块以及数据库模块。前台模块为网站的各项服务功能以及植入的IP获取模块,后台模块用于接收前台截取解析到的数据然后将其分析出新的可利用数据,数据库模块为存储数据的模块,存储了学校各方面的招生信息以及前后台的数据。图2系统框架图2.2高校招生预测系统的数据处理平台使用语言及技术在技术上,智慧校园系统米用了以Thinkphp、HTML5、Css3、MySQL等技术来实现平台的运作。先通过获取首页访问者的信息(如图3获取访问信息流程图所示),网站控制器处于待机状态,当访客访问到网站的时候通过其发过来的访问请求获取其IP同时将其IP解析出地址等一系列数据之后,将数一81—据存放到数据库以供后台使用,同时网站再次进入待机状态。数据会通过系统后台自动过滤以及数据解析而得到新的可利用数据(如图4预测功能流程图所示),在获取数据之前获得数据库权限,然后利用SQL语言对数据库的各项数据进行统计以及条件筛选,最后将筛选出来的数据分为三个阶段,再通过修正指数曲线计算出预测值。然后将得到的预测值以其数据的类型不同将其在后台显示出来。再将数据分析得到的值呈现出来。图3获取访问信息流程图图4预测功能流程图2.3高校招生预测系统的数据处理方法及检验在统计方面,例如在招生预测方面,该系统利用修正指数曲线,修正指数曲线模型的特点是一阶差分的环比为一个常数。根据这一特点,当某一时间序列的一阶差分的环比近似为一常数时,可以用该模型来进行预测来年的招生数据,经过三和法求出方程所需未知数,最后得到预测方程:7=7475-(5393x0.72501)其中,为饱和值,经过代入实际数据计算验证,误差值保持在正负55以内,属于正常误差。在数据呈现以及可视化方面,利用了具有动态改变性以及组内数据有差异性的热力图来显示分析的数据。对校园网站日流量,月流量进行分析,通过访问者的IP地址对其访问的流量,浏览的页面,浏览的主要信息的关键字,在线时间,等情况进行数据采集,进而进行数据整合、分析。图5折线图为往年各个年份的招生统计信息,而2016年的数据为经过分析预测得出的数据,下面条形图反应的是在近期各个月份访问本网站的人数,通过筛选而得出的各个不同月份的数据统计量,而图形的实现是通过Js来实现(图5-7皆为使用Js技术实现),通过设置显示的数据以及相应图形的各种参数来实现。网站统计2016年招生预测表Sa,-各学院总腦测以及专业预测______商学院信息学院快金学院计算机学院车辆与丁程棠pZMut.com备注:数据均为模拟。CAdminZhhit图6学院预测数据表通过对访客IP地址信息的简单采集、筛选、整合分析,对系统进行相关的数据处理,分析相关的偏好,对二次访问的IP地址进行偏好消息推送,返回相关的信息提示,增强用户体验和浏览效率。图7为各学院的预测招生人数,各个学院根据往年的招生数据作为预测的数据,预测出下一年的数据。而当点击各个学院的条形图的时候会跳转到一82—当前学院的专业详细信息图,如图7所示学院预测数据表-专业详细表。网站统计备注:数据均为模拟。图7学院预测数据表-专业详细对于信息后台,管理者可以从中获取信息数据流量等数据,查找相关需求数据,进行相关的数据处理,得到相关的处理结果,进而保证校园招生、教学管理、后勤服务的效益。图7是点击了“商学院”选项之后跳转的页面,这个图的数据是根据各个专业的招生人数分析预测得到的,最后将数据导入Js代码中获取图形。2.4智慧校园数据应用反馈层建设智慧校园的初衷在于对大数据分析后,利用相关的数据进行现实分析与未来引导,数据呈现的分析结果是有一定的预测性的,能更好地把握与调整相关的校园策略,已经相关的信息平衡,加速校园体系、风气的建设。智慧校园的构建,可以模仿相关数据层次图示(如图8所示的智慧校园建设与反馈)。图8智慧校园建设与反馈3结束语基于大数据的高校招生预测系统,结合了在大数据时代诞生的数据挖掘技术,有效地把握了大数据时代的趋势,结合大数据时代技术工具和当下的校园知识信息平台,通过两者的结合,有效把握技术漏点并加以排查,创造一个健全的大数据时代的数字校园。数据挖掘技术工具的使用,是更进一步对大数据时代的靠拢。智慧校园的信息来源,就是在校园数据平台中挖掘有效的数据区域,这块区域就形同稻田里的一根有意义的“针”,要发现这根“针”所面临的问题就是所有的稻草看起来都像一根“针”。智慧校园的实现是对大数据时代的具体表现,虽然在实现上有很多未能成功的领域,但是智慧校园已经成为了必然趋势,一个有效的数据体现平台,是对校园信息的充分反映。参考文献:[1]杨威,刘彦宏.高校智慧校园建设中的关键问题与对策[j].中国教育信息化,2013(12):23:39-42.[2]金良.大数据时代降临[N].纽约时报,2012-02-12.[3]袁兴梅.ThinkPHP架构和工作流技术在信息化管理中的应用[J].
本文标题:基于大数据的高校招生预测系统的设计与实现
链接地址:https://www.777doc.com/doc-5957010 .html