您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > CART算法在新浪微博客户分类中的应用研究
济南大学毕业论文-I-摘要基于当今这个高度信息化的时代,数据挖掘技术及数据仓库的高速发展,通过网络平台交流的用户日趋增加,客户分类就成为了当今社会首要解决的问题。本论文在数据挖掘的理论、方法及技术上,以决策树为建模主要思想,采用决策树中的基于Gini指数的分类和回归树(CART)算法,把新浪微博客户信息转化为属性-结论式的形式,通过构建树、修剪树、评估模型三步骤,将客户进行分类,从而快速准确地区分目标客户及非目标客户。在数据挖掘技术模型的基础上,将新浪微博的目标客户模型做部分的调整,最终能够得到最优化模型。该模型有着响应时间较短且精度高的特点,若运用到实际生活中能够大大地提升客户分类的效率,那么无论是企业还是个人都将从中受益良多。关键词:决策树;目标客户;CART;新浪微博;数据挖掘济南大学毕业论文-II-ABSTRACTOursociety,nowisfullofinformation.Basedontherapiddevelopmentofthedatawarehouseanddataminingtechnology,competinginnetworkplatformincreasesdaybyday.Sothecustomermanagementbecomesoneofthemostimportantissues.Thispaper,basedonthetheory,technologyandmethodsaboutdataminingandgotclassificationtreeforthemainideasofthemodeling.MadethecustomerinformationofMicro-blogintotheproperties-theConclusionform,usingtheCARTalgorithmofclassificationtreewhichbasedonthesmallestofGiniindex.Bybuildingthetree,pruningthetreeandassessingthetree,thecustomersareclassified.Asaresult,targetandnon-targetcustomersaredistinguishedrapidlyandaccurately.Basedonthedatamining,themodelsofmicro-blogwithtargetcustomersdosomeadjustments,thenwecanfinallygettheoptimizationmodel.Thecombinationofdatawarehousemodel,appliedtoreallifecangreatlyimproveefficiency,inotherwords,thecustomerorthecompanywillbothbenefitlotsfromthis.Keywords:DecisionTree;SearchingTargetCustomers;CART;Micro-blog;DataMining济南大学毕业论文目录摘要........................................................................................................................................IABSTRACT.........................................................................................................................II一、前言...............................................................................................................................1(一)研究背景.............................................................................................................1(二)选题目的.............................................................................................................2二、数据挖掘与客户分类概述...........................................................................................3(一)关于数据挖掘.....................................................................................................31.数据挖掘的概念及其操作过程...................................................................32.数据挖掘常用技术.......................................................................................5(二)关于客户分类.......................................................................................................61.客户分类的概念..............................................................................................62.新浪微博客户分类的意义..............................................................................63.新浪微博客户操作流程..................................................................................74.新浪微博客户分类中的具体应用..................................................................85.新浪微博客户分类及特征..............................................................................8三、CART算法及其在新浪微博客户分类中的具体应用..............................................10(一)CART算法简介................................................................................................10(二)CART算法的优缺点及适用性........................................................................13(三)CART算法在新浪微博客户分类中的具体应用............................................141.问题定义......................................................................................................142.数据准备......................................................................................................143.数据变换......................................................................................................164.CART算法的具体应用过程........................................................................21四、对新浪微博客户分类的结果分析.............................................................................28(一)客户分类及其相应的营销策略.......................................................................28(二)CART算法的不足与改进................................................................................30结论.....................................................................................................................................32参考文献.............................................................................................................................33致谢.....................................................................................................................................34济南大学毕业论文-1-一、前言由于通讯技术迅猛发展,中国网络发生了根本性地改变,与国外相比,国内的交流平台面对着一个全新的,全球化的,竞争更加激烈的市场环境。在这样一个商业时代,资源占有率成为一个企业生死存亡的关键点,客户才是企业生存与发展的根本,而对于如何改善客户服务,增加客户满意度和忠诚度,提升客户价值来扩大自身的收入和利润,如何用信息化管理来替代原有的传统管理手段等方法,是新浪门户当前解决的重要问题之一。因此,企业必须从“产品”导向向“客户”导向转变,从而对客户进行有效管理,深层分析存储大量客户信息的数据仓库,提高企业市场竞争力,获得有利于商业运作,有效信息从而创造更多的价值。而当前的数据库技术虽可以对数据高效查询、分析及统计,但是仍无法发现潜在的规律和联系,因此便无法对未来发展的趋势进行更好地预测,导致了一种“数据膨胀但是知识贫乏”的现象[1],这样的需求便使数据挖掘这门技术孕育而生。数据挖掘技术是从先前不知的、大量的、模糊的、不完整的随机的数据中提取潜在的有用的知识及信息的一个过程。正是有了这种技术的支持,才使得客户分类的理念及目标得以完成,满足当前时代激烈竞争的需求。(一)研究背景根据CNZZ权威发布的第31次中国互联网统计报告,截止到2012年12月底,我国微博用户持续增长,规模达到3.09亿,比较2011年增长5873亿,网民中的微博用户较去年相比提升6个百分比,达到了54.7
本文标题:CART算法在新浪微博客户分类中的应用研究
链接地址:https://www.777doc.com/doc-1524788 .html