您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 电子商务 > 基于数据挖掘的旅游电子商务个性~
1基于数据挖掘的旅游电子商务个性化服务研究——以携程旅行网为例一、概述(一)选题意义随着我国旅游产业的不断发展、旅游产品的更新升级,以及游客资源市场的不断变化,个性化的旅游方式越来越受到青睐。而在我国现有的旅游客户资源中,80后和90后的客户群体占了很大的比例,对于这些逐渐年轻化的消费群体来说,他们不再满足于观光、合影、购物等过时的旅游方式,而是开始关注旅游背后的文化、历史,追逐更加注重自我、个性化、深度化的旅游体验,根据网络数据显示,78%的年轻旅行者愿意进行个性化的旅行,70%的旅行者则表示希望在线旅行公司能提供个性化的服务。本论文基于数据挖掘技术并结合近些年电子商务个性化服务研究成果,在深入研究携程旅行网具体案例的基础上,分析了旅游电子商务个性化服务的现实状况和建设中的不足,为我国旅游电子商务个性化服务的建设提供相关策略与解决方案。(二)相关理论1、个性化和电子商务个性化个性化,常用来指具有个体特性的需求和服务。国际数据公司2014年年初发布报告称,全世界数字化信息的数量4.4ZB,而且这个数量还在飞速增长,因此,互联网用户如何从浩如烟海的信息中挖掘到自己需要的数据成为一大难题。在20世纪90年代中期,卡内基•梅隆大学的RobertArmstrong等人提出的WebWatcher个性化导航系统、斯坦福大学的MarkoBalabanovic等人推出的LIRA个性化推荐系统和麻省理工学院的HenryLieberman在国际人工智能联合大会上提出的Letizia个性化导航智能体这三个系统被公认为是个性化服务发展初期最经典的系统,它们的产生标志着个性化服务研究的开始。①电子商务个性化是个性化在电子商务中的拓展和的应用和发展领域。电子商务个性化服务的内容主要包括:(1)、消费者的需求个性化,消费者对商品和服务的不同类型的需求成为企业发展创新的巨大推动力。(2)、信息的个性化定制,例如,随着旅游业的发展,游客不但可以在线订购旅游服务,还可以参与到定制旅游的活动中。(3)、对个性化商品的需求,消费者可以将个人的偏好参与到消费品的设计和制造过程中。①余力.电子商务个性化——理论、方法与应用[M].清华大学出版社,2007.22、数据挖掘的概念及方法数据挖掘(DataMining)旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的而又潜在有用的信息和知识。数据挖掘涉及机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。①数据挖掘具有以下几个常用方法:聚类分析(clusteringanalysis),源于统计学、生物学以及机器学习等。决策树(decisiontree),主要用于分类和预测,是最受欢迎的数据挖掘方法之一,核心思想是在一定的约束条件下会得到特定的值。人工神经网络(ANN),是模仿人脑神经网络的结构和某些工作机制而建立的一种计算模型。粗糙集(roughset),是一种处理不确定、不完备数据和不精确问题的数学理论。关联规则挖掘(associationrulemining),是数据挖掘中最活跃的研究方法之一。统计分析(statisticsanalysis),是从事务的外在数量上的表现去推断该事务可能的规律。3、数据挖掘在电子商务中的应用(1)、基于Web数据挖掘的智能化搜索引擎但是目前信息技术环境下,由于技术限制等因素使得没有优秀的搜索引擎来保证用户所获得数据的精准度,要解决这些没问题就要在搜索引擎中使用Web数据挖掘技术,使其朝着智能化方向发展,帮助搜索引擎使用者获得更多具有高精度的、潜在价值高的更加全面的数据信息,从而提高搜索效率和结果的精准度。将数据挖掘应用于搜索引擎首先需要进行大量的样本学习,在此基础上归纳分析数据之间的规律,并进行相关信息提取,根据提取信息建立用户的兴趣偏好,根据用户兴趣偏好将用户搜索的关键词进行扩充,使用户搜索结果更接近其所需信息。另一种方法是通过分析用户的历史浏览记录数据来获得客户的兴趣偏好,然后调用个性化推荐系统来推荐相符合的搜索结果。智能化搜索引擎的处理流程如图1:图1智能化搜索引擎的处理流程(2)、数据挖掘在客户关系管理中的应用在客户关系管理中运用数据挖掘有利于促使企业准确定位客户的特点,帮助企业实施客户满意度分析、忠诚度分析、产品设计分析、市场影响活动分析、客户联系时机优化分①高丽,遗传算法与关联规则挖掘算法研究与应用[D],华中师范大学,20073析和增量销售分析等活动,以便促使企业更好的根据分析数据提供更好的个性化服务。通过挖掘分析与客户行为相关的数据信息包括客户的点击习惯和客户的兴趣偏好,对客户进行聚类分析,预测客户消费倾向,以此来挖掘发现潜在客户群体;针对不同兴趣偏好的用户进行不同的个性化内容推荐和新产品推荐,以此来最大程度的保持客户的产品忠诚度,减少客户流失;同时可以利用大数据分析得出客户的最佳联系时机,通过间隔性的联络客户获取客户的最新消费偏好数据,并且保持不间断的客户关怀活动,以此来减少因企业关怀度降低造成的客户损失。(3)、数据挖掘在个性化服务推荐系统中的应用电子商务个性化服务推荐系统能够帮助企业在原有客户数据库的基础上使用个性化推荐,深入挖掘客户数据库中潜藏是数据价值,有利于企业实施交叉销售的方案,更好的执行“以用户为中心”的销售策略。该系统主要是采用类似于智能化搜索引擎的数据处理思想。首先将企业通过各种途径收集的客户行为数据采用数据挖掘的各种方法分析,得出客户的访问规律并进行总结归纳,然后对使用关联规则和统计方法对实时访问客户进行分类,最后根据分类结果对访问的客户进行个性化推荐。同时该类系统还可以根据用户当前的访问规律进行客户识别,实时调整推荐内容,更好的做到个性化。(三)旅游个性化的发展前景1、中国在线旅游市场交易规模持续增长根据艾瑞咨询数据(见图2),中国在线旅游市场2014全年交易规模达2772.9亿元,比上一年增长27.1%,继续保持高速增长。而到2016年,预计中国整体休闲旅游市场将达到4500亿元人民币的巨大规模,在线休闲旅游也将以更高的增长速度增长。图22011—2018年中国在线旅游市场交易规模及增速(含预测数据)42、移动端OTA市场的迅速发展中国移动端在线旅行业务迅速增长,以2013年12月为例,移动端访问人数已覆盖进一亿人,同比上一个月增长近一倍。移动互联网与旅游产品的结合具有绝大的优势,尤其是在当年4G时代的到来,移动网络已经完全能够满足旅游业务发展的需要,在线旅游业务也将更多的转向旅游产品消费、消费品预定和个性化服务组合发展的方向,因此,在线旅游产品的在移动端的发展将迎来巨大机遇。以携程为例,利用丰富的旅游产品组合、先进的技术系统、完善的后台服务和强大的呼叫中心服务系统,携程的移动平台能够提供优越的个性化服务。根据网络数据显示,截至2014年年底,携程旅行移动客户端的下载量已经超过六亿次,环比增长70%。尤其是在2015年春节期间,移动平台的交易量更是超过总交易规模的70%,成为在线旅游业交易规模与盈利能力最强的应用平台。①3、自助游持续升温虽然跟团游这一传统模式在一部分细分类型客户中依然具有很强的不可替代性,但是随着生活水平的提高,跟团游越来越无法满足人们对于旅游的期待心理,而且更多的跟团游则是广受诟病的变相“购物游”。而且2012年度的中国在线旅游市场结构中,跟团游规模只占有约45%的市场份额,二者的年度增长率分别约为30%和85%。可以看出,跟团游虽然看似生命力顽强,但是在自助游持续升温的背景下,则成了实际中的“夕阳产业”。(四)创新点和写作框架1、本文的创新点首先,本文以旅游电子商务个性化服务为研究对象,结合大数据时代的数据挖掘理念及技术,提出了适合旅游电子商务个性化服务的建设方案。其次,利用学科知识的融合,基于数据挖掘的信息处理理念,系统的分析了旅游电子商务个性化服务中存在的问题。最后,本文将理论与实践结合,针对我国旅游电子商务个性化服务的建设提出具体措施,分析了个性化服务在我国旅游类电子商务个性化服务中的应用方法。2、本文的写作框架①数据来自艾瑞咨询:二、旅游电子商务个性化服务面临的主要问题(一)数据采集过程中存在的问题数据采集渠道中存在的问题是大多数使用大数据业务企业中共同存在的问题,由于数据采集渠道非常多,因此面临的问题也非常复杂,从数据采集渠道的选择到网络技术因素的限制等问题都是非常难以解决的。下面对数据采集渠道中存在的主要问题进行介绍:1、Web服务器端存在的错误。主要包括多服务器日志问题和服务器日志难以识别的问题。多服务器日志问题主要是指多台服务器的分布使得服务器日志记录的访问者数据可能发生重复等混乱状况,从而可能会影响到数据分析结果的准确度。而服务器日志难以识别的问题主要是指由于本地缓存、代理服务器IP转换、防火墙拦截等因素造成的用户发送请求时服务器没有记录。这里还涉及到局域网络的IP设置问题,由于以上这些设备的使用,有可能造成IP冲突,在用户使用设备网络时,有可能数据库将设备发送的多条信息记录为来自同一个IP,也可能将同一个用户发送的信息记录为不同的IP,这就导致了Web服务器日志数据难以分析的问题。2、获取客户端数据过程中存在的问题。由于企业本身的技术实力和程序漏洞等因素,一些旅游电子商务企业开发的客户端不能准确记载用户访问网站的时间,其系统JavaScripts功能无法获取用户的点击信息,即使能够识别点击流数据也会有捕获事件层次低、语义简单、难以关联分析等问题。也可以采用获取客户端宏记录文件扫描的方法,但是这样又会造成点击流信息无法获取的困境。此外,大多数用户难以接受企业网站收集其数据的行为。3、Cookie存在的问题。Cookie文件是网站服务器在本地计算机设备上留下的网站已访问页面的缓存文件,因其可以快速打开浏览过的网页却不用重新访问网站服务器这一功能而被广泛利用。但是,这一优点却也是数据收集过程中一个难以克服的缺点。例如,当多个用户同时使用同一设备时,数据收集方无法根据用户留下的Cookie文件来分析出用户的兴趣偏好,即使分析出结果也存在巨大的误差,无法进行个性化的推荐服务。或者部分用户在使用浏览器过程中可能会删除本地存储的Cookie文件,当再次访问该网站时可能会被误认为是新用户而对其重新定义,这样不但造成了数据结果的不准确,而且占用了大量数据库资源。6(二)数据管理过程中存在的问题1、产生的数据类型较多目前的数据类型有结构化数据、半结构化数据和非结构化数据三种。包括文字、音频、视频、图片等等。结构化数据是常用的数据形式,基本上是表格式的数据。每条数据的内容可以不同,但是结构是一样的。一般利用Excel工具就可以对结构化数据进行分析处理,而大型的结构化数据则可以采用一些较为成熟的的商业软件,如SPSS等。非结构化数据是所有数据中占比例最多的数据,包括高清图像、影音文件等多媒体文件都属于非结构化数据类型。其实所谓的非结构化数据就是数据的结构比较复杂而已,虽其处理方式较结构化数据要复杂的多,但是现在也已经找到了合适的处理方式,从数量上看,非结构化数据是结构化数据的5倍以上,所以,对非结构化数据的分析挖掘将是大数据发展的重要方向。半结构化数据在本质上属于结构化的数据,但是其结构变化很大,所以称为是介于结构化数据和非结构化数据之间,由于结构化数据和非结构化数据的处理方式都对它无效,因此在处理这类数据时通常需要一些特殊的方法。在旅游电子商务个性化服务中同样需要收集大量的数据,主要为服务器信息、图像和文字等数据,大多数为结构化数据和非结构化数据,包括用户的注册信息、网站浏览记录、在客户服务系统中的咨询信息、对于个性化的旅游产品的交易信息、消费评价信息、旅游产品点评信息和游记信息等。2、数据的管理成本过高大数据时代的数据采集和数据存储呈指数级增长,在旅游电子商务个性化数据挖掘过程中如果要运用大数据来挖掘游客的行为信息,首先旅游电子商务企业必须具有存储TB甚至PB级的海量
本文标题:基于数据挖掘的旅游电子商务个性~
链接地址:https://www.777doc.com/doc-2536567 .html