您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 《数据挖掘》练习题(第1章)
一、选择题1、从海量数据中提取有用的信息,所面临的困难有()A、数据量太大,无法使用传统的数据分析工具和技术处理它们;B、数据本身不是非传统数据,不能使用传统的数据处理方法进行处理;C、在某些情况下,面临的问题不能使用己有的数据分析技术来解决;D、数据量太大,没有足够的存储空间。2、下列任务中,属于数据挖掘技术在商务智能方面应用的是()A、顾客分析B、定向营销C、商店分布D、欺诈检测3、在地球的气候领域,数据挖掘开发的技术可以帮助地球科学家解决以下问题A、干旱和飓风等生态系统扰动的频度和强度与全球变暖之间有何联系?B、海洋表面温度对地表降水量和温度有何影响?C、如何准确地预测一个地区的生长季节的开始和结束?D、4、下列任务中,属于数据挖掘范畴的是A、预测一位新的顾客是否会在一家百货公司消费100美元以上。B、使用数据库管理系统查找个别的记录C、通过因特网的搜索引擎查找特定的Web页面D、根据性别划分公司的顾客。5、下列任务中,属于数据挖掘范畴的是A、根据可赢利性划分公司的顾客。B、计算公司的总销售额。C、按学生的标识号对学生数据库排序。D、监视病人心率的异常变化。6、数据预处理涉及的步骤包括A、融合来自多个数据源的数据,B、清洗数据以消除噪声和重复的观测值,C、选择与当前数据挖掘任务相关的记录和特征。D、7、下列数据挖掘任务中,属于分类任务的是A、预测一个Web用户是否会在网上书店买书B、预测某股票的未来价格C、根据检查结果判断病人是否患有某种疾病。D、8、异常检测的应用包括A、检测欺诈B、网络攻击C、疾病的不寻常模式D、生态系统扰动二、名词解释1、交叉销售:指根据顾客的兴趣推荐或显示相关商品以增加销售机会。2、提升销售:指尝试向曾经购买的顾客销售价格更高的商品。3、数据挖掘:是在大型数据存储库中,自动地发现有用信息的过程。4、数据挖掘技术:用来探查大型数据库,发现先前未知的有用模式。5、数据预处理:将未加工的输入数据转换成适合分析的形式。6、关联分析:用来发现描述数据中强关联特征的模式。7、聚类分析:用来发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。三、简答题1、简述数据库中知识发现的过程。数据库中知识发现的过程是将未加工的数据转换为有用信息的整个过程,如下图所示。该过程包括一系列转换步骤,从数据的预处理到数据挖掘结果的后处理。2、数据挖掘算法要解决的问题(1)算法的可伸缩性(2)高维性(3)异种数据和复杂数据(4)数据的所有权与分布(5)非传统的分析3、分布式数据挖掘算法面临的主要挑战包括:(1)如何降低执行分布式计算所需的通信量?(2)如何有效地统一从多个资源得到的数据挖掘结果?(3)如何处理数据安全性问题?4、数据挖掘任务分为哪两类?数据挖掘任务分为下面两大类:(1)预测任务。其目标是根据其他属性的值,预测特定属性的值。(2)描述任务。其目标是导出概括数据中潜在联系的模式(相关、趋势、聚类、轨迹和异常)。5、预测建模任务有哪两类?它们的区别是什么?预测建模任务分为分类和回归两类。它们的区别在于分类用于预测离散的目标变量;而回归用于预测连续的目标变量。
本文标题:《数据挖掘》练习题(第1章)
链接地址:https://www.777doc.com/doc-2846308 .html