您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > Clementine12.0操作
©2011MERIT.AllRightsReserved.MERIT&itslogo,aretrademarksofMERIT.西安交大-美林数据挖掘研究中心智慧数据财富未来目录2019/11/42Clementine建模指导二总体介绍一智慧数据财富未来公司在大数据领域业务方向2019/11/43总体介绍Clementine的操作与数据分析的一般流程相吻合,包括数据收集,数据展示和预处理、模型建立、模型评价等环节,Clementine形象地将这些环节表示成若干节点,将数据分析过程看成数据在各个节点之间的流动,并通过一个图形化的“数据流”直观表示整个数据分析过程。成功安装并启动Clementine后会出现主窗口,Clementine主窗口由数据流编辑区和三个窗口组成。数据流编辑区域流管理窗口节点工具箱窗口项目管理窗口智慧数据财富未来公司在大数据领域业务方向2019/11/44总体介绍1.数据流编辑区域:建立和编辑Clementine数据流的区域。2.节点工具箱窗口:数据流是由多个节点组成,工具箱中分类存放Clementine的所有节点工具。这些节点均以图标形式显示,可实现数据采集、数据展示、数据(包括变量和样本)预处理、数据建模以及模型评价等功能。它们被分别放置在Source、RecordOps、FieldOps、Graphs、Modeling、Output和Export选项中,其中常用节点集中放置在Favorites选项卡中。呈黄色背景显示的选项卡为当前选项卡。3.流管理窗口:由Streams、Outputs、Model三张选项卡组成。可在Streams选项卡中新建、打开、关闭、保存数据流。Outputs选项卡中存放着执行数据流后生成的各种数据表,Models选项卡中存放着执行数据流后生成的各种模型计算结果。4.项目管理窗口:多条数据流可组成一个数据挖掘项目。当数据挖掘任务较庞大而建立了很多数据流时,可自行将流管理窗口中的服务于不同目标的数据流,分别存放到不同目录中。智慧数据财富未来公司在大数据领域业务方向2019/11/45总体介绍数据流的操作主要包括以下四个方面:1)选择和管理节点。2)节点连接和连接调整。3)设置节点参数。4)执行数据流。下图为一个简单的数据流,有向线段表示数据的流动方向。智慧数据财富未来公司在大数据领域业务方向2019/11/46总体介绍1.选择和管理节点。由于节点所实现的功能不同,因此被放置在不同的选项卡中。建立数据流时,根据实际需要,首先通过鼠标单击选择相应的选项卡,然后再通过鼠标双击或鼠标拖动操作,将某个节点工具选中并添加到数据流编辑区域中。包含如下选项卡:收藏(Favorites)选项卡:存放数据流建立过程工程中最常用的节点工具。数据源(Sources)选项卡:存放将各种外部数据读到Clementine中的节点工具。记录(RecordOps)选项卡:存放针对记录操作的节点工具。通常,数据以行为单位组织,每一行为一条数据。数据库中称为记录,统计上称为样本。智慧数据财富未来公司在大数据领域业务方向2019/11/47总体介绍字段(FieldOps)选项卡:存放针对字段操作的节点工具。数据库中称列为字段,统计上称为变量。图形(Graphs)选项卡:存放展示数据分布特征和变量关系规律的可视化图形节点工具。建模(Modeling)选项卡:存放建立各种数据模型的节点工具。输出(Outputs)选项卡:存放展示数据和数据基本统计特征的节点工具。导出(Export)选项卡:存放将数据转换成其他格式的节点工具。智慧数据财富未来公司在大数据领域业务方向2019/11/48总体介绍2.节点连接和连接调整。当数据流编辑区域中有两个节点A、B时,可通过有向线段实现A、B的连接。最方便的方法是鼠标右击节点A,按快捷键F2,指定将第一节点A和第二节点B相连。删除节点A、B之间的连接。鼠标右击相应的有向线段,选择弹出菜单中的DeleteConnection选项。3.设置节点参数。节点是用来处理数据的,需要对某些节点针对数据处理的方式设置参数。双击相应节点,或者右击相应节点,选择弹出菜单中的Edit即可。4.执行数据流。当数据流建立完成后,若要得到数据分析结果,则需要执行数据流。选择主菜单Tools-Execute,或右击会得结果的节点,选择弹出菜单中的Execute。智慧数据财富未来公司在大数据领域业务方向2019/11/49总体介绍常用节点工具数据源(Sources)选项卡中的Var.File节点、Excel节点。Var.File节点可读入自由格式的文本文件,最常见的为”.csv”和“txt”文件;Excel节点读入的数据格式为“.xls”。记录(RecordOps)选项卡中的Select节点、Merge节点、Append节点。Select节点通过表达式设置筛选条件;Merge节点和Append节点对多个数据源进行合并。字段(FieldOps)选项卡中的Type节点、Filter节点、Derive节点、Partition节点。Type节点可指定变量的角色(输入、输出等);Filter节点过滤掉一些后续分析不需要的变量;Derive节点对已经存在的变量,通过给定一些计算公式等生成新的变量;Partition节点对样本进行分割,如将样本分为训练集合测试集。图形(Graphs)选项卡中的Plot节点和Multiplot节点。Plot节点指定X和Y轴的变量(每个坐标轴只能指定一个变量),描画相应的散点图;Multiplot节点指定X和Y轴的变量,Y轴变量可以是多个,描画相应的折线图。智慧数据财富未来公司在大数据领域业务方向2019/11/410总体介绍建模(Modeling)选项卡中比较常用的节点如下:聚类:分类:回归:关联:时间序列:输出(Outputs)选项卡中的Table节点、Analysis节点。Table节点以表格的形式展示数据分析的结果、Analysis节点对模型性能进行分析。智慧数据财富未来目录2019/11/411Clementine建模指导二总体介绍一智慧数据财富未来公司在大数据领域业务方向2019/11/412建模指导-分类Clementine应用:分类案例根据汽车的购买量、保养情况、车门数、座位数、底盘和安全性对汽车进行分类智慧数据财富未来公司在大数据领域业务方向2019/11/413建模指导-分类样本数据智慧数据财富未来公司在大数据领域业务方向2019/11/414建模指导-分类输入项:购买量、保养情况、车门数、座位数、底盘、安全性输出项:汽车类别智慧数据财富未来公司在大数据领域业务方向2019/11/415建模指导-分类第一步:导入数据智慧数据财富未来公司在大数据领域业务方向2019/11/416建模指导-分类第二步:创建流智慧数据财富未来公司在大数据领域业务方向2019/11/417建模指导-分类第三步:设置参数智慧数据财富未来公司在大数据领域业务方向2019/11/418建模指导-分类第四步:生成模型智慧数据财富未来公司在大数据领域业务方向2019/11/419建模指导-分类智慧数据财富未来公司在大数据领域业务方向2019/11/420建模指导-分类第五步:查看结果智慧数据财富未来公司在大数据领域业务方向2019/11/421建模指导-分类智慧数据财富未来公司在大数据领域业务方向2019/11/422建模指导-分类智慧数据财富未来公司在大数据领域业务方向2019/11/423建模指导-分类智慧数据财富未来公司在大数据领域业务方向2019/11/424建模指导-分类累计收益图。智慧数据财富未来公司在大数据领域业务方向2019/11/425建模指导-聚类Clementine应用:聚类案例根据花萼和花瓣的长度、宽度来对花进行聚类智慧数据财富未来公司在大数据领域业务方向2019/11/426建模指导-聚类样本数据智慧数据财富未来公司在大数据领域业务方向2019/11/427建模指导-聚类输入项:花萼长度、花萼宽度、花瓣长度、花瓣宽度智慧数据财富未来公司在大数据领域业务方向2019/11/428建模指导-聚类第一步:导入数据智慧数据财富未来公司在大数据领域业务方向2019/11/429建模指导-聚类第二步:创建流智慧数据财富未来公司在大数据领域业务方向2019/11/430建模指导-聚类第三步:设置参数智慧数据财富未来公司在大数据领域业务方向2019/11/431建模指导-聚类智慧数据财富未来公司在大数据领域业务方向2019/11/432建模指导-聚类第四步:生成模型智慧数据财富未来公司在大数据领域业务方向2019/11/433建模指导-聚类智慧数据财富未来公司在大数据领域业务方向2019/11/434建模指导-聚类第五步:查看结果智慧数据财富未来公司在大数据领域业务方向2019/11/435建模指导-聚类智慧数据财富未来公司在大数据领域业务方向2019/11/436建模指导-聚类智慧数据财富未来公司在大数据领域业务方向2019/11/437建模指导-聚类智慧数据财富未来公司在大数据领域业务方向2019/11/438建模指导-回归Clementine应用:回归案例评估CPU性能指标,抽取了最小主内存,缓存大小等与cpu性能相关的7个指标智慧数据财富未来公司在大数据领域业务方向2019/11/439建模指导-回归样本数据智慧数据财富未来公司在大数据领域业务方向2019/11/440建模指导-回归输入指标:MYCT、MMIN、MMAX、CACH、CHMIN、CHMAX输出指标:Class智慧数据财富未来公司在大数据领域业务方向2019/11/441建模指导-回归第一步:导入数据智慧数据财富未来公司在大数据领域业务方向2019/11/442建模指导-回归第二步:创建流智慧数据财富未来公司在大数据领域业务方向2019/11/443建模指导-回归第三步:设置参数智慧数据财富未来公司在大数据领域业务方向2019/11/444建模指导-回归智慧数据财富未来公司在大数据领域业务方向2019/11/445建模指导-回归第四步:生成模型智慧数据财富未来公司在大数据领域业务方向2019/11/446建模指导-回归智慧数据财富未来公司在大数据领域业务方向2019/11/447建模指导-回归第五步:查看结果智慧数据财富未来公司在大数据领域业务方向2019/11/448建模指导-回归智慧数据财富未来公司在大数据领域业务方向2019/11/449建模指导-回归智慧数据财富未来公司在大数据领域业务方向2019/11/450建模指导-回归智慧数据财富未来公司在大数据领域业务方向2019/11/451建模指导-关联Clementine应用:关联案例对某超市顾客购买商品之间的关联性进行分析智慧数据财富未来公司在大数据领域业务方向2019/11/452建模指导-关联样本数据智慧数据财富未来公司在大数据领域业务方向2019/11/453建模指导-关联输入和输出变量:fruitveg、freshmeat、dairy、cannedveg、cannedmeat、frozenmeal、beer、wine、softdrink、fishconfectionery智慧数据财富未来公司在大数据领域业务方向2019/11/454建模指导-关联第一步:导入数据智慧数据财富未来公司在大数据领域业务方向2019/11/455建模指导-关联第二步:创建流智慧数据财富未来公司在大数据领域业务方向2019/11/456建模指导-关联第三步:设置参数智慧数据财富未来公司在大数据领域业务方向2019/11/457建模指导-关联第四步:生成模型智慧数据财富未来公司在大数据领域业务方向2019/11/458建模指导-关联智慧数据财富未来公司在大数据领域业务方向2019/11/459建模指导-关联第五步:查看结果智慧数据财富未来公司在大数据领域业务方向2019/11/460建模指导-时间序列Clementine应用:时间序列案例现有某企业151个
本文标题:Clementine12.0操作
链接地址:https://www.777doc.com/doc-1770513 .html