您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > 数据挖掘在人力资源管理系统中的应用
华中科技大学硕士学位论文数据挖掘在人力资源管理系统中的应用姓名:陆海伦申请学位级别:硕士专业:通信与信息系统指导教师:张士军20030429IAbstractMostoftheexistinghumanresourcemanagementsystemdonothavedecisionsupportfunctions,andthecontradictionsoftherapidincreaseindataanddataanalyzingmethodslaginhumanresourcesmanagementsystemaremoreprominent.Peoplehopetogoonscientificresearchandbusinessdecision-makingorenterprisemanagementonthebasisofthesubstantialdata’sscientificanalysis.However,thecurrentlyavailabledataanalysistoolsaretooinappropriatetoprocessthedatain-depth.Dataminingisappropriateforresolvingtheshortcomingsoftraditionalmethodsofanalysisandlarge-scaledataanalysisandprocessing.ApplyDataminingtechniquestohumanresourcemanagementsystemsothatitiscapablenotonlyfordataentry,storage,selectionandstatisticsetc,furthermorewithdecisionsupportfunctionsystemcanservetheenterprisedevelopmentbetter.Thethesistakesthespecifichumanresourcemanagementsystemastargetandplanstodevelopadataminingsubsystem.Provingdataminingtechnologycanbeappliedforhumanresourcesmanagementsystemandprovidepowerfuldecisionsupport.Thisthesiscomparesandresearchestheexistingmethodsofdatamining;BecauseID3arithmeticofdecisiontreetechniquehasunderstandablerules;theamountofcomputingisnotlargerelatively;itcanhandlecontinuousanddiscretedata;canclearlyrevealthedegreeofimportanceofattributesetc.Itwaschosenforthehumanresourcemanagementsystem.Anditwasmadesomeimprovementsbaseditsapplicationinhumanresourcesmanagement.HumanresourcesmanagementsystemusesMSSQLServer2000databaseandDelphiasdevelopmenttool.ConsideringcomputeamountofdataminingsubsystemsislargerandthescopeislimitedtotheuseofhumanresourcemanagementdepartmentsoItakeVBandSQLServer2000databaseasdevelopmenttool.DesigningdifficultyofHRMSconsistindataminingsubsystemstructuralpart,aswellasdecisiontreearithmeticandsubsystemsinterfacedesign.Throughtrueexamplestestthisthesisprovethattheusingofdecisiontreearithmeticinhumanresourcemanagementsystemachievesthedesiredtarget.KeywordsDataMiningDecisionTreeID3ArithmeticHRMSII1[1][2]1.1[3,4,5]1[6][7]1.2HRMS[8][9]2[10]3[11]4[12]1.3[13]561.4[141.5HRMSHRMSHRMS7822.12.1.1[15][16][17]92.1.2[18]10[19]2.1.3[20]11[21]122.22.2.1[22]132.2.2[23]PNPPNNN14[24][25]2.2.3152.3ID3[26]2.3.1[25][27]12nFFF×××LjF12,,,nvvvLjvFj∈1622loglogppnnpnpnpnp−−n++++12,,,nvvvL12,,,vHHHLiHipiniHipin1()(,)vipniiHAIiipn=+=+∑pniH12,,,vBBLB2.3.2PE′PE′′NE′NE′′17PENEPE’NE’PENEPE’’NE’’PE=PE’+PE’’NE=NE’+NE’’kAkAkA2.3.318112()24Pu=212()24Pu=1921212log242421212log2424PNPNNNN1A11v2v3vA17()24Pv=29()24Pv=38()24Pv=11()puv21()puv124()9puv=225()9puv=131()8puv=237()8puv=2777(log0)2477−−2294455(loglog249999−−)2281177(loglog248888−−)2284444(loglog)248888−−22114477(loglog)2411111111−−2254411(loglog245555−−)2022124488(loglog)2412121212−−22124488(loglog)2412121212−−2284444(loglog)248888−−2263333(loglog)246666−−22105555(loglog2410101010−−)1A2333(log933−−2242222(loglog94444−−)2222(log922−−212555(log955−−2444(log944−−2232211(loglog)93333−−2221111(loglog)92222−−242222(loglog94444−−2)2555(log855−−221111(loglog82222−−2)2333(log833−−2251144(loglog85555−−)2232211(loglog83333−−)2333(log833−−2222(log822−−2.3.4iP12,,,vvvv⋅⋅⋅12,,,vHHH⋅⋅⋅iHijPiHiHjH21logCijijjiiPPHH=−∑1()viiiHIHH=∑22*A[28]2.3.52.3.623[30][31[31[29]][32][33]][34][35][36]242.4[37]2.4.12.4.2[38]25[39]TT'T'T'T26[40][41]272.52833.13.1.1293.1.2303.1.3313.232IDFKIDFKIDIDIDFKIDFKIDFKIDIDFKIDIDFKFKEmailFKIDFKIDIDFKIDIDIDFKIDFKIDFKIDIDFKIDSQL333.33.3.13.3.234SQL3.3.335363.3.437××iiii383.3.53940413.43.54244.14.1.14.1.243444546Å474.2[42]484.34955.15.2505152535455数据挖掘在人力资源管理系统中的应用作者:陆海伦学位授予单位:华中科技大学相似文献(10条)1.学位论文赵翔数据挖掘中决策树分类算法的研究2005决策树方法是数据挖掘中一种重要的分类方法。本课题从新的建树准则、决策树修剪、多变量决策树、多决策树组合、不完备信息系统下的模型建立等几个方面对决策树方法进行了研究和探讨。本课题的主要研究工作和成果有:1、针对传统决策树算法的不足(如ID3、C4.5),提出了基于协方差及高阶相关系数的决策树生成算法,避免了经典的以信息熵作为建树准则的决策树生成算法盲目地偏向于属性值较多的属性的缺点。2、针对决策树的构造和修剪通常不能同时进行所产生的效率低下的问题,提出了基于粗糙集的决策树构造方法。利用优先策略,将知识相依性同时作为属性约简和建树的准则,在决策树预修剪的同时进行节点生成,大大提高了决策树构造的效率。3、针对单变量决策树忽视信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大的缺陷,提出了一种基于主成分分析的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树。4、探讨了用Boosting方法组合多决策树,构造决策森林的方法。5、在不完备信息系统中的模型拓展。提出了一种加权联系度容差关系,在各属性重要性排序的前提下对不完备信息系统进行进一步的粗糙集模型拓展,使其更加符合人的主观要求和客观现实。从而为进一步探讨在不完备信息系统中构造分类器模型打下基础。2.期刊论文田苗苗数据挖掘之决策树方法概述-长春大学学报2004,14(6)数据挖掘在科研和商业应用中正发挥着越来越重要的作用.分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器.本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法.介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势.3.学位论文程向前基于决策树的数据挖掘算法和可视化研究2007数据挖掘是一种可以从海量数据中智能地和自动地抽取一些有用的、可信的、有效的、可以理解的模式的过程,也被称之为数据库中的知识发现。分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学习一个分类函数或构造出一个分类模型(即分类器)进行类型的划分。该函数或模型能够把数据库中的数据记录映像到给定类别中的某一个。分类方法应用领域广泛,如金融市场走向分析、顾客信用度分析、医疗诊断等。决策树是数据挖掘中一种应用最为广泛的分类器。其原因主要有:(1)决策树分类的直观表示方法较容易转化为标准的数据库查询;(2)决策树分类归纳的方法行之有效、尤其适合于大型数据集;(3)决策树在分类过程中,除了数据集中己经包括的信息外,不再需要其他额外的信息;(4)决策树分类模型的预测准确度较高。由于决策树本身具有建树思想简单、易于提取规则、贴近人类思维、便于理解等优点,使其在分类数据挖掘中得到了广泛应用。决策树算法的研究可以扩大算法的应用范围,提高算法的运行效率以及分类的准确率。本文从属性离散化、降维、属性选择标准、剪枝、与其它数据挖掘方法的结合等几个方面对目前决策树在分类数据挖掘中的研究状况进行了阐述。本文在介绍了一些典型的决策树分类算法的基础上,重点描述了一种基于决策树的数据挖掘新算法,即基于属性相似度的决策树分类器的研究成果。不同测试属性在决策中的地位也不相同,部分测试属性甚至对决策不起任何作用,完全可进行约简。实验也证明数据集中无关的、干扰的属性会影响分类器的性能,导致性能变差。因而本文首先进行了属性选择,只保留与决策最为相关的属性,而将其他属性都去除。然后通
本文标题:数据挖掘在人力资源管理系统中的应用
链接地址:https://www.777doc.com/doc-1002643 .html