您好,欢迎访问三七文档
数据挖掘建模数据集——不同数据挖掘模式下的各种数据集引例统计学奥卡姆剃刀以尽量少的因子去解释现象,减少中间过程。•误差会以乘积的方式扩大•引入因子会使主题偏移辛普森悖论分组中具有优势,总评中却是劣势。爱荷华州的一位居民移居到阿拉巴马州,结果提高了这两个州的平均智商。•分组兼顾权重•定量因子细化分析数据挖掘的三种基本数据集数据集事物数据集时序/序列数据集多维属性数据集5事物数据集ID——WORKID——TIME——WORK描述性结果模式以描述性语言及规则等展现形式关联规则序列规则If-then规则集……时序数据集值时间序列数据集值值预测性结果模式以各种回归式、方程式、检验结果等无偏预测值展现线性、多项式、泊松、岭脊等回归类ARIMA、X-11、WOLD分解等时间序列模式嵌入式网状结构、过拟合网状神经等学习模式ARIMA平稳时间序列预测-举例某地年最低气温时序数据绘制时序图平稳性和纯随机性检验定阶参数估计模式化及预测ARIMA时间序列预测-举例预测效果图多维属性数据集属性/值目标有目标值则是有监督性分类性结果模式各种机器学习K中心、两阶段、邻近、系统等无监督聚类分类树、逻辑回归、神经网等监督性分类模式监督性分类性-举例信贷风险预测数据来源于银行信贷部门对用户贷款信息的记录,包括客户基本信息、信用信息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。待分析数据数据仓库处理后数据模式变换后数据知识数据抽取数据预处理数据挖掘数据变换解释评价建模数据集2020/2/10监督性分类性-举例界面化流程图2020/2/10监督性分类性-举例结果输出—模型比较预测的0/实际所有的02020/2/10监督性分类性-举例结果输出—最优模型—树2020/2/10监督性分类性-举例结果输出—分类将打分文件输入待预测数据集,对新数据产生分类。文本数据集文本只有单列文本?企业决策支持信息系统ODS数据仓库统计分析数据挖掘决策支持1stQtr2ndQtr3rdQtr4thQtrPowerPlayFileEditDataValuesDisplayTextLegendLocation1992AllProductsAgegroupsRevenue($000)OLAP查询报表产品服务DB谢谢
本文标题:数据挖掘数据集
链接地址:https://www.777doc.com/doc-3629413 .html