您好,欢迎访问三七文档
《物联网智能信息处理》实验报告学院:计算机科学技术学院专业班级:物联网工程1101学号:2011001557姓名:孙泽东日期:2014年11月25日实验一数据预处理实验(2个学时)一、实验目的:熟悉数据预处理的一般流程,重点掌握异常点检测算法,为进一步挖掘数据做准备。二、实验内容:1.了解数据特点,熟悉2-3种数据集数据格式;2.掌握1种以上异常点检测原理;3.验证某种异常点检测算法;4.分析异常点检测算法检测结果。三、实验要求:在熟悉2-3种数据集数据格式的基础上,选择Dev-C++等开发环境打开异常点检测算法源代码,搞清算法基本原理,接着修改其数据源(数据文件路径及文件名等)、常量大小等,调试程序并试运行,在此基础上修改数据输出方式,统计异常点个数等,完成实验报告。四、实验环境:软件环境:Windows/Linux,C++(Dev-C++);硬件环境:P42.4G/80G/1G/64M及较高配置的PC机。五、实验步骤:1.安装和配置Dev-C++开发环境;2.通过查阅课本、网络资料和研读教师提高的材料,了解相关知识;3.按照实验要求,逐步完成实验内容;4.调试程序,输出结果,并进行记录。结果六、思考题:1.为什么要对数据进行预处理?数据预处理是非常重要的一环,且必不可少,要获得满意的处理效果(挖掘出有用的知识),必须提供干净,准确,简洁的数据,而实际系统中有很多“脏数据”,必须处理掉。2.什么样的数据点算异常点?异常点是在数据集中与众不同的数据,使人怀疑这些数据并非书记偏离,而是产生于完全不同的机制。
本文标题:数据挖掘实验1
链接地址:https://www.777doc.com/doc-7218555 .html