您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 38基于WEB挖掘的站点设计的研究
基于WEB挖掘的站点设计的研究作者:周琪锋学位授予单位:广东工业大学相似文献(10条)1.学位论文赵震基于邻接网络的Web日志数据挖掘方法研究2001该文针对WEB日志数据挖掘问题进行了深入的研究和分析,并实地的对微软官方网站日志文件进行了数据挖掘试验,所做的工作主要包括以下几个方面:1.该文分析了数据挖掘技术的产生原因和发展背景.2.对Web数据挖掘的体系结构进行了深入的分析和研究.3.该文分析了Web日志的格式和内容,阐明了Web日志挖掘的数据预处理的必要性和困难.4.该文阐述了关联规则发现的基本概念,阐述和分析了频繁项目集发现经典算法及各种频集优化算法.5.该文在发现的频繁项目集基础上,对关联规则的生成进行了详细的研究和分析,特别针对发现的规则的冗余性问题,给出切实可行的解决方法和核心算法.6.Web日志数据挖掘实验.2.期刊论文张治斌.姜亚南.ZHANGZhi-bin.JIANGYa-nan基于WEB日志的数据挖掘研究-电脑与信息技术2009,17(6)随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘.3.学位论文朱红祥基于Web日志数据挖掘的电子商务推荐系统实现2008进入21世纪以来,计算机技术和计算机网络技术得到了突飞猛进的发展。同时电子商务作为一种新的商务模式也随之快速发展起来。Web日志数据挖掘旨在通过对Web日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和模式。通过对Web日志的挖掘和对用户访问行为、频度、内容等分析,我们可以从大量的Web日志信息提取出我们需要的有用知识,并且由此可以得到用户的访问模式,通过对这些用户特征的理解和分析,可以向用户提供个性化的服务。电子商务因其成本低廉、快捷、不受时空限制等优点在全球范围内得到普及和发展,它的规模也在进一步扩大。同时,它的发展面临这样一个新问题--一方面,用户对网络上提供的众多商品信息并非完全感兴趣,通常要通过多次浏览才能找到满足自己需求的商品;另一方面商家也不能全面了解用户的个人需求,缺乏个性化服务成为制约电子商务发展的关键问题。这就要求有一个能够分析用户偏好、行为等信息,并且自动根据这些信息向用户提供推荐服务的推荐系统,实现个性化的网络营销。Web日志数据挖掘就是在这样的背景下与电子商务结合在一起。Web数据挖掘是从Web文档和Web活动中发现并抽取感兴趣的、潜在的有用模式和隐藏的信息。它将传统的数据挖掘技术和web结合起来,可以在多方面发挥作用,是数据挖掘领域的一个新的研究方向。基于Web数据挖掘的电子商务推荐系统可以满足电子商务未来发展趋势的需要。在本文中依据效率和准确性,建立了一个推荐系统模型,并对系统中各个模块功能及它们之间相互协调工作做了详细的描述;深入研究了电子商务推荐系统所使用的推荐算法,重点讨论了目前使用最为广泛的协同过滤推荐算法;在上述研究的基础上设计了基于聚类的协同过滤推荐系统,并对k-means聚类算法进行了改进;最后利用实际网站数据对基于聚类的协同过滤推荐系统的聚类算法进行了实现,给出了系统试验结果,并对结果做出解释和评价。4.期刊论文朱红祥基于Web日志数据挖掘的电子商务推荐系统-商场现代化2008,(28)Web数据挖掘是从Web文档和Web活动中发现并抽取感兴趣的、潜在的有用模式和隐藏的信息.基于Web数据挖掘的电子商务推荐系统可以满足电子商务未来发展趋势的需要.在本文中依据效率和准确性,建立了一个推荐系统模型,并对系统中各个模块功能及它们之间相互协调工作做了详细的描述;深入研究了电子商务推荐系统所使用的推荐算法,重点讨论了目前使用最为广泛的协同过滤推荐算法;在上述研究的基础上设计了基于聚类的协同过滤推荐系统,并对k-means聚类算法进行了改进;给出了系统试验结果,并对结果做出解释和评价.5.学位论文任晓霞一种WEB日志数据挖掘系统的设计与实现2008随着Internet技术的不断发展和应用,Web站点产生的信息也随之飞速增长,如何开发和利用Web站点提供的丰富信息资源成为人们普遍关注的问题。Web站点提供的丰富信息资源体现在两个层面:一方面,Web站点自身提供了丰富的信息内容;另一方面,人们对Web站点所带来的庞大的访问数据资源、复杂的数据结构和使用者的行为目的产生了更多的构想。如何利用Web站点的现有访问信息提高站点的性能和更好地为用户服务,成为计算机应用领域的热门话题之一。本文以Web日志为特征展开研究,在分析Web访问数据结构的基础上,引入Web数据挖掘方法,针对计算机科学与技术学院的Web站点,设计并实现了一个特定的分析系统,获得了一些有价值的分析结论。Web数据挖掘是将数据挖掘方法运用于Web数据,提取隐藏其中的、有用的、新颖的模式或知识发现的过程。其中一个主要分支是Web日志挖掘,它旨在从大量访问者的访问历史记录中,挖掘网站的频繁使用模式、用户访问行为模式、具有相似行为的用户群等信息,使人们能够充分了解Web站点的使用情况和使用Web站点的用户行为模式,从而对Web站点优化组织,更好地为用户提供服务,提高Web站点的访问量和性能。基于以上背景介绍,本文以学院网站Web服务器日志为研究素材,给出了一个Web日志数据挖掘系统的解决方案。通过本系统,不仅可以获得学院网站的基本统计信息,如站点的使用情况和服务器的响应情况,而且可以获得网站用户的访问模式和用户的聚类群信息。本文采用的聚类算法,在总结已有系统开发经验的基础上,从简洁、效率、实用的角度出发,对算法提出了改进的思路,使用会话访问顺序相似度作为聚类度量标准和字典向量存储,保证了聚类的准确度和存储效率。本文首先介绍了课题产生的背景和国内外研究现状。其次介绍了Web日志挖掘的处理模型和数据预处理各阶段的过程。再次介绍了本课题相关的算法。最后结合本课题的算法,给出了系统的详细设计。并在.NET平台上实现了本系统。6.期刊论文欧阳利军.龚成.OUYANGLi-jun.GONGCheng一种基于关联规则的Web日志数据挖掘的实现方法-现代计算机(专业版)2006,(2)介绍一个基于关联规则数据挖掘Web日志分析的实现方法,提出通过对Apriori算法的改进,提高其挖掘效率,根据其结果,达到理解用户行为和改善Web结构的目的.7.学位论文林聪基于Web日志的数据挖掘研究2008近十年来,随着Internet的迅速发展,大量的信息涌现在人们面前,这些Web上的数据是大量的,不完全的,有噪音的,模糊的,随机的。虽然这些数据很多,但实际属于用户需要的数据或信息却不多。据说99%的Web信息对于99%的用户是无用的,至少我们知道每个人只是关心Web上很少一部分信息。因此从大量的用户访问信息中,如何自动地、高效地提取这些知识,即Web日志挖掘,具有十分重要的现实意义,这也成为当前国际上受到广泛关注的,新兴的研究领域。Web日志挖掘是对用户与Web服务器在交互时产生的数据使用数据挖掘技术发现隐含的规律性知识,得到用户访问站点的频繁程度和行为模式,从而改善Web站点结构及页面间的超链接结构,提高站点的服务质量,改进站点性能。本文主要从以下几个方面对Web日志挖掘进行研究。首先阐述本课题的研究背景及Web日志挖掘的国内外研究现状,然后对数据挖掘、Web数据挖掘和Web日志挖掘进行了概述,并给出他们之间的关系。其次在Web日志挖掘预处理上将统一建模语言引入到对Web日志预处理的研究上,并对Web日志预处理的整个过程进行建模,在此基础上给出了算法。接着在Web日志访问模式挖掘研究方面,重点研究了关联规则及其经典算法Apriori算法,提出基于深度的改进算法DP-Apriori算法,并通过理论评估和实验来证明DP-Apriori算法的挖掘效率比Apriori算法有明显的提高。紧接着通过挖掘校园网络日志的实例来贯穿Web日志挖掘的整个过程,在实例中我们分别利用Apriori算法和DP-Apriori算法进行挖掘,挖掘结果证明了改进算法的有效性。最后分析挖掘的结果,提出优化网站结构的建议,为用户访问网站提供优质的服务。8.学位论文蔡立基于Web日志的数据挖掘2001该文以Web日志为研究对象,在挖掘算法的研究与实现、Web挖掘工具以及数据挖掘过程模型等方面作了一定工作.在挖掘算法的研究和实现方面:针对关联规则挖掘,提出了新的挖掘算法——纯SOL的动态数据库迭代算法.该算法利用关联规则的基本原理和关系数据库的SQL查询语法,通过不断产生动态临时表的方法来层层缩小挖掘的范围,大大提高了挖掘效率;针对路径模式挖掘,改进了用户浏览路径挖掘算法,提出了用户浏览兴趣的聚类挖掘问题,并利用基于非监督学习的动态聚类方法解决了该问题.在Web挖掘工具方面,设计并实现了关联规则挖掘的自动化工具—Web日志关联规则生成器(WLRM).该工具的核心采用了关联规则的纯SQL动态数据库迭代算法,实现了可视化挖掘以及挖掘过程的人机交互.最后针对Web挖掘的整个生命周期过程,该文提出了一个普遍适用的Web数据挖掘的多阶段处理过程模型,并针对每一阶段提出了研究的内容和方法.9.期刊论文李万新Web日志数据挖掘在服务器安全方面的应用-中山大学学报论丛2007,27(5)目前服务器的安全成为人们关注的问题,而分析web服务器的日志记录是最直接、最常用,而且是一种比较有效的方法.文章对提出了一种通过对web日志进行数据挖掘技术来检测服务器面临的攻击和潜在的威胁,从而加固系统,保护系统数据免受修改和破坏.10.学位论文蒋英华基于Web日志的数据挖掘2005万维网是到目前为止世界上最丰富和最密集的信息来源.如何开发和利用这些丰富的资源就成了人们普遍关注的问题.于是,数据挖掘技术和网络应用研究的结合--Web数据挖掘技术(WebMining)构成了当今比较活跃的一个研究领域.Web日志挖掘是Web使用挖掘的一个分支,它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程,重点讨论Web日志挖掘.Web日志挖掘通过对日志记录的挖掘,发现用户访问页面的模式,从而进一步分析和研究日志记录中的规律,以期改进站点的性能和组织结构,提高用户查找信息的质量和效率,并通过统计和关联的分析找出特定用户与特定地域、特定时间、特定页面等要素之间的内在联系.Web日志挖掘预处理对象是原始日志文件中包含的数据,其中不完整的、冗余的、错误的数据需要进行处理.本文针对数据预处理过程中涉及到的关键问题和技术进行详细的剖析和论述.Web日志挖掘中模式分析与模式表达通过发现的模式研究用户Web浏览行为,理解访问者的浏览兴趣,这些都是提高Web质量和改善站点结构设计的重要环节.本文研究了规则归纳的模式挖掘方法,探讨了关联规则和序列模式的挖掘算法,比较各算法优劣,提出使用fp_tree和prefixspan应用于关联规则和序列模式的挖掘.最后将Web日志挖掘技术应用到天津铁路工程学校网站,对其Web服务器的日志记录进行挖掘,建立一个Web日志挖掘系统.网络管理人员可以根据Web日志的分析结果改进网站的设计,实现网站的有效管理.本文链接:授权使用:华中科技大学(wfhzkjd),授权号:8a358ad3-4a19-4c6f-bc8b-9e32015f78c0下载时间:2010年11月18日
本文标题:38基于WEB挖掘的站点设计的研究
链接地址:https://www.777doc.com/doc-4238390 .html