您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 数据挖掘技术在房地产户型选择分析中的应用
数据挖掘技术在房地产户型选择分析中的应用作者:卫易辰作者单位:首都经济贸易大学信息学院,北京刊名:电子测试英文刊名:ELECTRONICTEST年,卷(期):2009,(11)被引用次数:0次参考文献(3条)1.李志刚,马刚.数据仓库与数据挖掘的原理及应用[M].北京:高等教育出版社,2008.2.阮敬.SAS统计分析从入门到精通[M].北京:人民邮电出版社,2009.3.MICHAELJA,BERRYGS.数据挖掘技术:市场营销、销售与客户关系管理领域应用[M].影印版.北京:机械工业出版社,2006.相似文献(10条)1.学位论文王艳数据挖掘中关联规则算法的研究2004数据挖掘利用分类、关联性、序列分析、群集分析、机器自我学习及其他统计方法,从数据库庞大的数据中,找出隐含的、未知的、但却十分有用的信息.它是一个涉及多学科领域的新兴学科,并伴随着这些学科的发展而不断发展.数据挖掘系统可以挖掘出多种类型的模式,而其中描述给定数据集的项之间有趣联系的关联分析模式就是一个非常重要的研究方向.该文主要从事的是数据挖掘中关联规则的研究.在整个数据挖掘的研究中,算法的研究占有特别重要的地位.一方面,数据挖掘面对的是大量数据集,因此算法的效率将对其应用起关键的作用;另一方面,我们面对的计算机系统在其性能上远远不能满足对大量数据集进行处理的要求.因此,我们必须研究和改进现有的算法,使其有更广泛的应用前景.鉴于此,该文着重对关联规则挖掘算法进行了研究.该文首先对数据挖掘作了一般性讨论,包括数据挖掘的概念、模式、挖掘的主要问题、系统的分类以及数据挖掘的应用和发展趋势.然后,该文对数据挖掘中重要的关联规则挖掘算法做了深入的研究,分析了关联规则中经典的Apriori算法及其他学者对Apriori算法的改进算法,总结了算法中存在的问题;接着,详细介绍了DHP(DirectHashingandPruning)算法及在Apriori算法和DHP算法基础上的快速挖掘算法FARM(FasrAssociationRuleMining);最后,在分析FARM算法的特点和性能的基础上提出了改进算法FARM2,并将FARM2算法与Apriori算法、DHP算法以及FARM算法进行了比较分析,得出了FARM2算法在效率上优于上述几种算法的结论.2.期刊论文曾莹.陈晓柱数据挖掘及算法浅谈-中国科技信息2005,(14)数据挖掘是随着信息技术发展而产生的事物.本文主要针对数据挖掘的基本概念、过程以及数据挖掘算法的介绍.本文也会对数据挖掘的应用进行描述.3.学位论文马双翼关于数据挖掘算法库的设计与实现2006数据挖掘可以帮助企业从大量历史数据中找出那些内在的规则或知识,因此,中国石化决定在原有的中国石化全面预算和生产经营监控系统中,进一步开发数据挖掘子系统。该数据挖掘子系统的核心就是数据挖掘算法库。本文的内容是关于如何设计和实现一个高效的数据挖掘算法库。本文所设计的数据挖掘算法库以机器学习和数据挖掘理论为基础,以合理的管理机制为前提,成功地以组件的方式封装了数据挖掘领域的多种算法,并集成了它们,为高效地完成相关数据挖掘任务提供了保障。本文的关注点在于数据挖掘算法库的设计过程中涉及到的两个主要问题。第一,如何对数据挖掘算法库中涉及到的组件进行合理的划分和封装;第二,采用何种机制管理数据挖掘算法库中的组件,以提高算法库的可扩展性。本文的主要内容包括以下几个方面:首先,给出了一个数据挖掘算法库的合理的体系结构。在此基础上,以面向对象的思想为依据,对各个组件类别进行了划分,并分别对它们进行了封装。其次,阐述了数据挖掘算法库组件组配方案的设计与实现。本文结合数据挖掘过程的特点,提出了一个高效的组件组配方案,该方案以组件间交互的数据对象为核心,以事件机制为实现手段,通过设计一组相关接口以确保组件间相应事件的发送与监听,使得一个数据挖掘任务可以通过组件组配的方式来完成。不仅使得组件间的关系变得更加清晰,而且整个挖掘过程中各组件间交互的数据对象的状态和变化也得到了直观的体现。最后,本文阐述了新组件的添加方案,给出了与组件添加相关的一整套组件开发规范,包括统一接口的设计,以及新组件开发过程中的相关编程规则。这些内容作为一整套机制保证了组件添加可以方便顺利地进行。综上所述,本文不但成功的解决了数据挖掘算法库中组件的划分和封装问题,而且通过提出高效的组件组配和组件添加方案,也成功地解决了数据挖掘算法库的可扩展性问题。4.期刊论文王洪立.吴继娟.WANGHong-li.WUJi-juan基于SQLServer2000下数据挖掘算法的研究-计算机工程与设计2008,29(3)微软的SQLServer2000是当今最流行的数据库管理软件之一,研究了在SQLServer2000上数据挖掘实现方面的决策树算法.决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识.SQLServer2000/AnalysisService两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件.并讨论了通过使用像SQLServer2000AnalysisService这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据.5.学位论文张兆功海量数据挖掘算法的研究2003并行海量数据挖掘技术利用并行计算(ParallelComputing)技术,针对海量数据特点,研究数据挖掘的新理论和新方法.关联规则、分类、聚类、相似性搜索和时间序列模式是挖掘算法的研究核心.为此我们以抽样方法和并行技术为重点,研究了关联规则、相似性搜索、分类、聚类和时间序列模式的串行抽样挖掘算法和并行挖掘算法.研究工作的创新之处主要表现在如下五个方面:(1)针对已有关联规则算法存在多遍扫描数据库的缺点,我们提出了一个至多扫描数据库两遍的新抽样算法,还提出了相对支持度概念和叠加原理.(2)提出了用于相似性搜索的两个新的索引结构:rgh-tree和pgh-tree.(3)针对已有聚类算法出现的各种问题,该文提出了一个新的聚类模型和算法.(4)由于决策树分类模型建立过程的计算时间主要消耗在最优分割点的选取上,传统方法需要对全体数据的所有可能的分割点逐个计算,计算量很大.该文采用了两次抽样的方法,首先对数据集合进行抽样,选取一部分数据用于建立初步模型.其次对分割点进行抽样,可以有效的减小分割点选取的计算量.(5)提出了一个用于时间序列分析上的新的概念—波动率,它是一个相似变换下的不变量,它不同于传统的时间序列相似性度量—欧几里得距离.它基于波动率进行相似性比较,同人的直觉相一致,在4种相似性变换下该度量保持不变.提出了一个计算和标记这种不变量的方法,我们的实验结果表明基于波动率的时间序列相似性分析精度更高.该文利用抽样方法和并行计算技术对海量数据情况下的数据挖掘问题进行了探索,部分解决了海量数据情况下的数据挖掘问题.6.期刊论文文俊浩.胡显芝.何光辉.徐玲小波在数据挖掘算法中的运用-重庆大学学报(自然科学版)2004,27(12)由于小波理论具有良好的构造性和实际应用性,近年来被广泛地应用于诸如图像处理、计算机可视化、网络管理和数据挖掘等计算机科学研究领域.小波有很多良好的性质,如多分辨的分解结构、变换的时空线性复杂性等特性,从而可以为数据挖掘提供更加有效的算法.给出了小波在聚类、分类、分布式数据挖掘、相似性搜索、近似查询处理、可视化等算法中的运用,讨论了小波在数据挖掘研究中的影响,并简述了有潜力的未来研究方向.7.学位论文王华秋并行数据挖掘理论研究与应用2006通过数据挖掘进行知识发现是对大型数据库或数据仓库的一种分析,用于发现隐藏在数据仓库中的关系和知识,这些知识会影响管理者的决策和实施。数据仓库上的数据挖掘能够从利用机群并行计算中获利,从而提高其性能和数据分析质量。实际上,挖掘大量数据集会消耗巨大的计算资源,因为在传统的计算机上,对海量数据集进行数据挖掘得到结果是要花费非常多的时间的。一种减少响应时间的方法就是采样,但是在一些情况下,减少训练数据会导致计算模型不准确,甚至不可用。另外一种方法就是并行计算了。高性能计算机和并行数据挖掘结合在一起,就能为挖掘巨型数据集提供一个最佳方案,更快的处理速度意味着用户能够试验更多的模型以更好地理解复杂数据。高性能计算让用户能够分析更多的数据变成现实。这样并行数据挖掘为数据分析和知识提取发挥了越来越重要的作用,在诸如商业和工业领域的数据提取和决策支持中得到应用。虽然目前已提出过一些并行数据挖掘算法,但是存在着通信量过大、可扩展性差、数据分布不合理等问题,出现算法性能随数据量递增效率下降的情况,具有理论或应用局限性。因此本文研究和提出具有新颖的适应性强的高效并行挖掘算法并将其用于商业和工业领域,具有其创新性和必要性。本文在研究并行数据挖掘算法前,搭建了并行计算环境、设计了大型商业数据仓库和使用了工业生产数据库作为研究和应用平台,在构建的数据仓库上利用PC机群进行并行数据挖掘。本文分析了能用于数据挖掘技术的几种不同并行形式,阐述了如何用机群执行并行数据挖掘,提出了几种可用于数据挖掘算法的并行化方法,这些算法有:(1)并行关联规则。本文在比较了当前几种并行关联规则挖掘算法的基础上,为了解决这些算法在候选集和执行时间方面存在的问题,结合关联规则的性质定理,提出了一种快速并行关联规则算法FPARM,改进了全局和局部剪枝策略以及候选集的约简方法。在无共享的工作站机群上进行性能测试,采用改进并行算法的执行效率提高了,达到了算法优化的目的,并将该算法用于商品之间的购物序列模式分析。在实际的关联规则挖掘应用中,多层概念关联规则是用户经常考虑的问题,本文在分析了单数据库多层关联规则算法SMAM算法的基础上,为了提高算法的效率,提出了两种并行多层关联规则算法PMAM-L和PMAM-LG。试验证明PMAM算法是有效的。(2)并行聚类。本文提出了基于并行退火粒子群优化的并行聚类算法,采用了任务分布方案和部分异步并行通信,降低了计算时间。这种模拟退火并行粒子群算法结合了并行粒子群算法的快速寻优能力和模拟退火的概率突跳特性,保持了群体多样性从而了避免种群退化。实验证明该算法在并行机群上具有了较好的准确性、加速性和可扩展性。最后将该算法应用于客户购物时段分析中进行商业决策支持。(3)并行神经网络。建立在密度估计基础上的核回归径向基神经网络经常用于模型预测,但是高维的核函数矩阵运算需要花费巨大计算资源。为了缩短计算时间,本文设计了以异步方式执行的并行算法用于计算核回归径向基网络核函数矩阵,并提出自适应距离优化核函数的窗宽参数。本文将该算法用于钢铁冶炼中的转炉提钒过程中,建立了预测模型,在工作站机群上执行该算法,利用实际数据验证了该算法的加速性和准确性。本文进行了上述并行数据挖掘算法性能的详细研究和讨论。主要目的是研究在机群并行结构下的数据挖掘算法,及其通过对比关于通信比、可伸缩性和加速性的实验效果,从理论和实验两方面证明这些并行挖掘算法的高效性。8.期刊论文项响琴.汪彩梅.XIANGXiang-qin.WANGCai-mei基于聚类高维空间算法的离群数据挖掘技术研究-计算机技术与发展2010,20(1)离群数据挖掘是数据挖掘领域的一个研究分支,而聚类算法分析则是进行离群数据挖掘的重要研究方法之一.文中首先分析研究离群数据挖掘方法,对多个离群数据挖掘算法进行分析比较,讨论各自的优点和不足,同时针对高维空间数据的特点,分析挖掘高维空间数据中的离群点方法.其次对聚类分析算法进行讨论,分析一种基于网格和基于密度的聚类方法——聚类高维空间算法(CLIQUE算法),运用它可以更好地挖掘高维空间中的离群数据.提出了CLIQUE算法的有待改进的思想,为以后的研究指明方向.9.学位论文郭秀娟基于关联规则数据挖掘算法的研究2004数据挖掘技术是伴随信息量的迅速增长而诞生的,如何满足人们对知识与信息的渴求,以快速地获取知识以及应用于决策领域,已经成为当前信息处理中的热门课题之一。本文是建立在从
本文标题:数据挖掘技术在房地产户型选择分析中的应用
链接地址:https://www.777doc.com/doc-92478 .html