您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 7563《数据挖掘与客户管理》期末考试卷A卷及答案
共4页,第页1试卷代号:7563A卷浙江广播电视大学2006年1月期末考试试题《数据挖掘与客户管理》期末考试试卷(试卷总分:100分,考试时间:120分钟)题号一二三四总分分数一、名词解释(每题4分,共20分)1.数据挖掘:2.过度拟合:3.过抽样:4.辛普森差异系数(基尼系数):5.数据仓库:共4页,第页2二、填空题(每空2分,共30分)1.数据挖掘的三大支柱分别是、和。2.互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据转换成可执行的决策、和。3.预测模型成功应用的三个假定分别是、和。4.数据仓库的优点是和。5.数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑战是要建立合适的。6.使用无监督的数据挖掘方法必须。7.为了确保输入数据早于输出结果,可以用方法对数据时间元素进行处理。8.分段输入组合模型和模型分段组合模型的最大区别在于。9.客户流失的原因,大致可以分为两类:自愿流失和。三、单项选择题(每题2分,共20分)1.企业所建立的预测模型的好坏取决于模型在()上的表现效果。A得分集B训练集C测试集D评价集2.客户在经济活动中具有多重身份,下面哪一种不是其身份之一()。A行为身份B所有权身份C学习身份D决策身份3.下列四条描述中,正确的一条是()。A企业实施数据挖掘,必须要有数据仓库。B企业要实施数据挖掘最好的方式是请编外专家。C企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。D在建模的时侯,增益最高的模型就是最好的模型。共4页,第页34.数据挖掘算法以()形式来组织数据。A行B列C记录D表格5.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()。A数据越多越好。B尽可能多的适合的数据。C得分集数据是建模集数据的一部分。D以上三条都正确。6.K—均值类别侦测要求输入的数据类型必须是()。A整型B数值型C字符型D逻辑型7.在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的()相对应。A线段长度B线段斜率C相对应的线段长度D相对应的线段斜率8.企业为提升每个客户的价值,应实现()最优化。A促销活动B预算最优化C客户最优化D三者都不是9.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了()数据挖掘方法。A分类B预测C组合或关联法则D聚类10.企业成功实施数据挖掘,需要以下()知识或技术A预先的规划B对商业文体的理解C综合商业知识和技能D都需要四、简答题(每题6分,共30分)1.数据挖掘的六种常用算法和技术分别是什么?2.实现数据挖掘技术在企业中专业化应用的四种有效途径?共4页,第页43.一般认为有哪几种方法可以提升客户的价值?4.数据挖掘中的数据需要采用哪些格式?5.预测模型的建立过程有哪些?《数据挖掘与客户管理》期末考试试卷答案(试卷总分:100分,考试时间:120分钟)共4页,第页5一、名词解释(每题4分,共20分)1.数据挖掘:是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。2.过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地对未来数据进行预测。3.过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模型集中稀疏数据与一般数据间的比例关系,使之保持在15%-30%.4.辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回地随机取得两个样品属于不同类别的概率。公式为:2×P1×(1-P1),其中P1是属于第一类的概率。5.数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、反映历史变化的和相对稳定的数据集合。二、填空题(每空2分,共30分)1.数据挖掘技术与算法、无所不在的数据、建立有效的预测模型2.决策实施、评价决策模型3.过去是将来的预言家、数据是可以获得的、数据中应包括我们的预期目标4.数据仓库是从一个点上观察整个企业,而不是许多小定义的“地下仓库”的拼凑集合、数据挖掘记录的是最令人感兴趣的详细的数据5.纬度和事实6.人机交互7.将时间范围附加到时间字段上8.数据的分段是预先知道的还是模型决定的9.非自愿流失三、单项选择题(每题2分,共20分)1.A2.C3.B4.D5.B6.B7.D8.C9.C10.B四、简答题(每题6分,共30分)1.数据挖掘的六种常用算法和技术分别是什么?①分类:处理结果是离散的②估计:处理的是连续的结果共4页,第页6③预测:任何的预测都可以被认为是分类或估计。不同之处在于你强调的是什么:可以对分类后的结果加以检验;但在预测中,检验只能等待事物发生后才能确定。④组合或关联分析⑤聚类:其与分类的区别是聚类不依赖于事先确定好的组别。⑥描述与可视化:“女性比男性更支持民主党”。2.实现数据挖掘技术在企业中专业化应用的四种有效途径?①购买与企业的商业问题配套的评分机制②购买数据挖掘软件这类整体解决方案③聘请外部专家完成预测模型的建立④组织内部掌握数据挖掘技能3.一般认为有哪几种方法可以提升客户的价值?一般认为,有如下三种方法可以提升客户的价值:①对客户已有产品,增添新功能,或者说提升产品的购买价值。②向客户出售更多、更容易升级的产品。③使客户能长期购买本公司的产品。4.数据挖掘中的数据需要采用哪些格式?数据挖掘中的数据需要采用以下格式:①所有数据应该在一个表格/数据库视图中②每一行对应于与业务问题相关的一个案例③忽略具有单一值/几乎单一值的列④忽略所有行的值都不同的列⑤删除所有同义列⑥对于预测模型,目标列必须是可识别的5.预测模型的建立过程有哪些?①搜集建模所需的尽可能多的适合的数据,即搜集模型集数据;②建立训练集数据,用于建立预测模型;③建立测试集数据,用于预测模型的修正;④建立评价集数据,用于估计模型的效果,或不同模型的效果比较;⑤建立得分集数据,该数据不属于模型集的一部分,不知道这部分数据会产生什么样的结果。
本文标题:7563《数据挖掘与客户管理》期末考试卷A卷及答案
链接地址:https://www.777doc.com/doc-1524420 .html