您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 基于Web数据挖掘的信息智能过滤技术研究
西北工业大学硕士学位论文基于Web数据挖掘的信息智能过滤技术研究姓名:史豪斌申请学位级别:硕士专业:计算机应用技术指导教师:李伟华20040301基于Web数据挖掘的信息智能过滤技术研究作者:史豪斌学位授予单位:西北工业大学相似文献(10条)1.期刊论文伍粤山.WUYue-shanWeb数据挖掘初探-电脑知识与技术(学术交流)2006,(6)Web上有海量的数据信息,对这些数据进行复杂的应用成了现今数据库技术的研究热点.这里对数据挖掘的基本概念、Web数据挖掘步骤、Web数据挖掘在三个研究领域的研究现状、发展及常用Web数据挖掘工具做了简单介绍,希望起到抛砖引玉作用.2.学位论文罗巨波基于xml的web数据挖掘中内容挖掘的研究及应用2004Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点.数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题.面向Web的数据挖掘是一项复杂的技术,由于Web数据挖掘比单个数据仓库的挖掘要复杂的多,因而面向Web的数据挖掘成了一个难以解决的问题.而XML的出现为解决Web数据挖掘的难题带来了机会,因为XML具有以下优点:1.方便、灵活2.易理解3.特定领域、行业的扩展4.结构化的数据5.XML补HTML之不足6.可表达丰富的结构7.可验证8.内容与表达的分离.本文首先简要论述了数据挖掘发展的基本情况以及当前存在的一些问题.随后,论述了数据挖掘技术的基本概念、原理.在论述了数据挖掘技术理论之后,详细论述了Web内容挖掘内容、特点、存在的问题.接着,重点讨论xml与数据库和数据转换.在研究的基础上,本文提出了一种基于xml的web数据挖掘体中内容挖掘的体系结构模型,并就此体系结构的部分进行了实验.本文最后总结了工作尚存的不足,并指出了基于xml的web数据挖掘中内容挖掘的研究及应用研究的方向、应用前景和它所面临的挑战.3.期刊论文黄雄伟.陈定方.祖巧巧.HUANGXiong-wei.CHENDing-fang.ZUQiao-hongWeb数据挖掘可视化研究与应用-湖北工业大学学报2009,24(4)通过Web数据挖掘算法研究Web服务器日志,阐述Web数据挖掘基本流程,利用(.NET)开发组件可视化展示Web数据挖掘信息,以提供决策支持.4.期刊论文王焱梁Web数据挖掘技术应用-职业时空(综合版)2007,3(4)Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透融合的必然结果.文章首先介绍了web数据挖掘的含义,重点讨论了web数据挖掘的类型以各种类型的web数据挖掘的基本过程以及它们所使用的一些相关技术及应用,并对数据挖掘的发展前景和方向进行了展望.5.学位论文任新Web数据挖掘及其在电子商务中的应用研究2008随着Internet的日益普及,电子商务蓬勃发展,基于互联网的商业Web站点面临越来越激烈的竞争。商务网站从“以站点为中心”向“以用户为中心”发展成为必然。如何对大量的电子商务信息进行有效的组织利用,从中抽取感兴趣的模式,以便理解客户的行为,从而改进站点的结构或为客户提供个性化的服务成为电子商务发展必须要解决的问题。Web数据挖掘是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和用户浏览网站的数据中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式的过程。Web数据挖掘可以在许多领域发挥作用,而电子商务为数据挖掘提供了丰富的数据源和新的研究课题。本文对Web数据挖掘在电子商务中的应用进行了研究,主要做了以下工作:1.综述了数据挖掘国内外研究现状。分析了数据挖掘逻辑模型及存在的一些问题。2.阐述了Web数据挖掘技术,Web数据挖掘的用途,以及XML在数据挖掘中的应用。3.讨论了在电子商务中如何有效地利用几种可行的数据挖掘技术,如路径分析、关联规则分析、序列模式分析、分类分析和聚类分析等挖掘出用户的购买模式及浏览模式,并就其中的路径分析和序列模式分析提出了实现的方法。4.构建了一个电子商务网站系统模型,并且将上述数据挖掘技术有机地集成到其中,以实现电子商务的个性化服务;并就电子商务网站的Web挖掘具体实施过程进行了分析。6.期刊论文郑泠Web数据挖掘技术应用-科技经济市场2006,(12)Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透融合的必然结果.文章首先介绍了web数据挖掘的含义,重点讨论了web数据挖掘的类型以各种类型的web数据挖掘的基本过程以及它们所使用的一些相关技术及应用,并对数据挖掘的发展前景和方向进行了展望.7.学位论文乔智勇Web数据挖掘系统的设计及关键技术研究2002Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。应用Web数据挖掘可以改善人们获取信息的速度和准确度。本文在对国内外Web数据挖掘技术进行研究的基础上提出了一个Web数据挖掘系统的框架模型并根据Web的自身特点实现了一个智能网页收集器,它采用了既考虑Web内容又考虑Web结构的URL排序策略,从而使获取的页面是理想的页面。此外在对查询结果的评价上,本文在对其他方法分析的基础上提出了一种新的查询结果评价方法,它充分考虑了Web以及文本自身的特性,取得了较为理想的效果。最后本文对多媒体数据挖掘技术进行了探讨。8.期刊论文方少卿.FangShaoqingXML在Web数据挖掘中的应用研究-铜陵职业技术学院学报2010,9(1)文章讨论了XML在Web数据挖掘中的应用,解决了Web数据的非结构化甚至是无结构、Web数据复杂而导致的Web数据挖掘困难的问题,提出了将HTML转化为XML文档以实现web数据挖掘的一个模型.9.期刊论文张晓艳.方逵.朱幸辉.ZhangXiaoyan.FangKui.ZhuXinghui农业信息网站中的Web数据挖掘研究-农业网络信息2009,(7)介绍了Web数据挖掘的特点、挖掘对象、挖掘过程和涉及到的关键技术,分析了Web数据挖掘在农业信息网站中的典型应用,指出Web数据挖掘在农业网站中的应用前景.10.学位论文刘江宏基于XML的Web数据挖掘技术研究2009近年来许多传统数据挖掘研究者,已逐步从传统数据挖掘领域过渡到Web数据挖掘领域。随着Web上XML数据量爆炸式的增长,XML已成为Internet上数据交换和数据表示的事实标准,并且在将来XML将代替HTML而成为Web上驻留数据的主要格式,于是,基于XML的数据挖掘方法已经成为Web数据挖掘领域和XML技术领域的一个研究热点。面向Web的数据挖掘技术与面向传统数据库的挖掘技术不同,基于XML的Web数据挖掘过程中,一般要将HTML数据格式转换成XML格式,再对XML数据进行相关挖掘操作。目前,多数基于XML数据的挖掘算法是用半结构化数据模型来描述XML数据的,并在此基础上进行频繁模式发现,而用半结构化数据模型描述XML数据时具有一定的缺陷,因此影响了挖掘算法的性能。针对上述问题,论文做了如下工作:1.描述了一个基于XML的Web数据频繁模式挖掘框架结构,它在原有半结构化数据模式挖掘算法的基础上,根据XML数据的模型特点,对频繁模式挖掘算法进行了归类;依照半结构化数据的产生方式、组织形式、存储结构,抽象和总结了原有的XML数据挖掘算法。2.分析了半结构化数据模型描述XML数据时存在的一些缺陷,针对这些缺陷,研究了一种面向XML的扩展标记树模型ETM,作为XML数据挖掘任务使用的数据模型。3.使用ETM有序树作为数据模型,给出了XMLFPTMiner算法来挖掘XML中的频繁模式树,并研究了一种修剪策略对XMLFPTMiner算法进行改进。根据修剪策略,可以直接从某些已知频繁子树中产生某些未知频繁子树,因此减少了算法在候选子树的产生和支持度计算上的开销,从而提高了算法的效率。引证文献(1条)1.孙吉红.刘伟成基于语义网的信息过滤模型与算法[期刊论文]-情报杂志2007(1)本文链接::上海海事大学(wflshyxy),授权号:ec9ecd02-e256-4467-803c-9e4600d28547下载时间:2010年12月8日
本文标题:基于Web数据挖掘的信息智能过滤技术研究
链接地址:https://www.777doc.com/doc-46760 .html