您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 分析网站用户行为方法
网站用户行为数据收集和分析方法为改善网站的可用性,一般采用可用性工程方法,其核心是以用户为中心的设计方法论(UCD)。综合介绍了目前国内外对于用户行为数据收集和分析方法所进行的研究,各种方法的特点,并介绍一些利用相应方法所开发出的工具实例,使得建设的网站更加符合用户的需要,以保障用户与网站之间沟通的顺畅。随着Internet的不断发展,各种各样的网站如雨后春笋般成倍增长,各个商业网站之间的竞争越来越激烈,随之而来的是,网站的建设不可避免的出现了很多问题。从最近一次国外对15个大型网站进行统计分析表明,用户在寻找自己所需要的信息时,只有42%的概率可以找到,而在大部分的时间里用户都无法找到自己所需要的信息,这使得用户在浏览网站时经常遭遇挫折,严重影响了用户对网站的兴趣和信任。正如JacobNielsen所指出的“如果你想通过网站找到某些信息,那么在一般情况下很难找到,就算能够找到,也要经过一番周折。从以往的经验可以得知,除非项目管理团队在整个网站设计过程中就特别考虑网站的可用性,否则结果往往令人失望”。针对网站的特点,目前国内外提出了很多依靠计算机辅助来自动收集和分析用户行为数据的方法,本文以下部分将重点介绍基于服务器日志收集和分析用户行为数据的方法和从客户端收集和分析用户行为数据的方法,并对根据不同的方法所开发出的一些工具进行了介绍。1基于服务器日志收集和分析用户行为数据的方法目前,对于网站来说,自动获得用户行为数据最流行的方法之一是基于服务器日志的方法(Serverlog),就是通过从web服务器所产生的日志文件来获取有用的数据。服务器日志文件就是用来记录web服务器的活动,提供了详细的客户和服务器的交互活动日志,其中包括客户的请求和服务器的响应。通过日志文件收集到的数据形式依赖于具体的web服务器类型,不同的web服务器产生的信息是不一样的。1.1基于服务器日志方法的优点通过日志文件可以获得很有价值的网站使用情况的数据。①日志文件是由web服务器自动生成,所以花费比较小。②与人为建造的可用性实验室环境相比,通过日志文件获得的数据更能够反映真实环境下用户的真实情况。③与只对几个用户在几小时内进行的测试所获得的数据相比,通过日志文件获得的是大量的用户在相当长一段时间内的行为数据,这对分析用户的行为是十分有利的,可以利用数据挖掘等技术对用户进行分析。④开发基于日志文件的数据分析工具相对比较容易,花费也不是太大。1.2基于服务器日志方法的缺点基于日志的方法对于网站的可用性研究来说还存在着很多不足之处,由于日志文件就是被设计用来产生站点级的性能统计数据,因此不可避免的是,日志文件所提供的数据与用来分析网站可用性所需的大量数据相比会有所不足,对于研究潜在的可用性问题只能提供少量的数据甚至还可能提供一些误导性的数据。这是因为一旦web服务器把用户请求的页面发送出去之后,如果用户不发出请求,则页面和用户之间发生了什么web服务器并不记录。下面是一些从日志文件中获取的数据不足或有误导性数据的例子。①谁正在访问网站。如果想知道谁正在访问网站,要求日志文件必须包含一个个人ID或者登录到服务器的登录标示,但是目前的网站一般不需要用户登录,大多情况下由日志文件提供的客户端信息是客户的IP地址,而这些IP地址很多情况下是由Internet提供商提供的动态IP。并且有时用通过代理服务器来访问Internet(例如,学校的校园网),这样就不能正确得知是哪个用户在访问网站。②用户访问网站的路径。如果日志文件能够记下用户所浏览的每个页面,那么自然可以清楚的记录用户的访问路径,然而,当把用户的浏览器设置为可使用缓存(cache)时(通常是缺省设置),用户所浏览的一些页面就不能被web服务器所记录,例如,使用Back按钮浏览的页面就不能被记录。而且,如果同一页面中提供了多个选择可链接到同一个页面的话,用户到底是使用哪一个链接过去,这一信息从log文件中也难以获得,但是这一信息对改善网站的可用性也是很重要的。如果是通过图片链接,web服务器可能会记下用户单击的坐标位置,从而可以获得用户的确切信息,如果没有使用这种技术的话,就很难捕获这一信息。而且,当用户通过键入URL地址,或通过书签来访问页面时,web服务器也不能记录这一信息。③用户在每页的停留时间。日志文件记录的是数据开始传输的时间,而不是传输完成的时间。而且也不清楚,在页面下载的过程中,用户到底在什么时间开始浏览页面。除非在页面显示的时候,用户因有事离开了,不然可以通过比较用户的当前请求和下一次请求之间的时间来粗略计算用户在此页面停留的大概时间(通过后一次的请求时间减去第一次的请求时间得到,但对于从cache中获取的页面来说就出现很大偏差)。④用户离开站点的位置。日志文件记录了在用户会话期间所发送的最后一页,但是这可能并不是用户所看到的最后一页。其中有两个原因:第一,用户所看到的最后一页可能是从cache中得到。第二,用户可能已经有事离开了很长时间,而这段时间已经超过了web服务器所定义的用户会话时间。⑤用户是否成功完成自己想要做的事情。这是最根本的可用性问题,只是通过单独的日志文件统计是很难回答的,如果是“用户是否完成了交易?用户是否成功地下载了文件?”之类的问题,答案还是很容易推断。然而,如果要回答“用户是否找到了所需要的信息?”类似这样的问题,仅通过日志文件就很难回答了。1.3基于服务器日志文件方法获取数据的辅助工具ClickTracesAnalyzer是分析网站用户行为的一套工具,为进一步了解用户的浏览行为提供了强大的功能,它把大量的复杂数据用非常简单的方法表达出来,使可用性人员在分析用户行为时一目了然。2客户端收集和分析用户行为数据的方法由于通过日志文件获得的信息会出现失真的情况,而且有很多重要的数据只通过日志文件很难获得,这些信息对研究网站的可用性问题却很重要,因此为了进一步获得更多的有价值的可用性数据,发现更多的网站可用性问题,逐渐产生了很多技术用于从客户端(page-side)直接获得用户与网站的交互情况。由于是直接从客户端获得数据,所以,能够获得大量的难以从服务器端获得的用户行为数据,这对进一步分析用户浏览网站行为,改善潜在的网站可用性问题提供了更大的帮助。2.1客户端收集用户行为数据的优点①由于用户是在真实的环境下所进行的操作(如在家里或办公室),减少了人为地干扰因素,因此获得的数据更加真实。②与基于日志文件的方法相比,从客户端收集到的数据更加精确,能够克服如上描述的很多问题。●不受动态分配IP地址或代理服务器的影响:通过使用客户端跟踪技术(如由web服务器对每个访问站点的客户机自动分配ID并将其记录在客户端的Cookies中,每次用户浏览网站,web服务器可通过访问客户端的Cookies就知道此客户机是否访问过本网站)。●正确的用户浏览路径:由于是在客户端记录用户行为,因此客户端代码可自动跟踪用户的浏览路径,不管是否通过本机缓存或通过代理服务器。例如,用户的实际浏览路径是从A`B,点击Back钮,`A`C,但是从log文件中得到的路径是A`B`C。页面浏览时间:举例如图1(页面是由cgi脚本产生的动态文件)。这是使用Clickstream收集工具与基于服务器的日志文件产生的数据比较,日志文件丢失了很多重要数据。分析网站用户行为5方法站在网站运营角度,不同的网站提供的内容和服务不同,用户行为分析的侧重点也不尽相同。但是,几乎所有的网站用户分析都是基于用户属性和用户具体行为来展开各种关联或逻辑推理分析。以下是网站用户分析的5大常规方法:一、用户轨迹分析法所谓轨迹分析法,就是对用户从网站某页面‘着陆’后的一系列行为轨迹,这个行为轨迹基本上反应了网站用户的核心需求。如果能把握用户的行为数据,就可以了解用户的喜好,以及页面设计对用户关注度的影响,从而为网站调整提供第一手的资料。二、用户基本动作分析法类似广播体操的分解动作一样,网站用户行为也是可以分解的。通过分解用户行为动作,可以提炼出分析单元,从而为进一步的数据分析做好基础性工作。例如,首先对用户按照点击、上传、下载、播放、注册、购买、留言、投票等行为进行分解,然后归类,分为浏览类,互动类等,对基本动作进行数量统计分析,得出每个类型行为的数据总量,并得出用户行为的相关总体数据。三、关联分析法关联分析是把一种用户行为习惯和其他行为习惯进行联系分析,包括用户上网习惯和用户网站行为的关联,用户的基本属性和社会属性与用户网站行为的关联。例如,一个电子商务购物网站,可分析用户的收入水平跟购物频率,购买金额的关联度;主体人群与性别的关联度;购买人群与当地地区经济发展程度的相关度等等。这些数据对网站的营销推广具有重要意义。四、目标向量分析法针对网站日志中的流量来源、跳出率、平均页面停留时间、平均访问页数等等网站目标的向量值,站长能够对网站用户黏度和忠诚度进行具体的分析。五、TOP分析法通过研究最活跃用户的特征,例如其基本属性、上网习惯、网站用户行为等,得出网站活跃用户群体特征,从而为网站推广提供重要数据。抓住了该类用户的需求和心理,网站才能真正具有活力。通过对用户行为的分析推断用户的喜好和目的,提供符合用户喜好和要求的信息,用户分析的最终目的就是为了提升自身的服务质量,把用户留住。简单说明基于日志的用户行为分析日志是记录用户操作流的文件,可以用于验证设计、发现问题和挖掘用户需求。之所以研究用户行为,原因在于:1.设计的优劣最终还是需要从用户行为数据中得到反馈。2.当产品用户达到一定数量级时,可以从用户行为中挖掘需求。3.设计很多经验来源于用户行为规律,前沿的设计必然要研究用户。4.“小步快跑”的敏捷开发依赖行为分析,最具说服力。而传统基于人种志和调查问卷等定性定量方法并不一定能和产品设计紧密结合。先以最常用搜索引擎为例,个人杜撰出一段日志来揣测网页是如何做行为分析:18:23:21直连搜索引擎首页18:23:25输入关键词”拥护日志”,按键盘回车键18:23:29点击智能纠错“用户日志”18:23:34用户点击第二条结果链接18:23:37用户点击第一条结果链接18:23:59用户输入关键词“用户日志分析”,按键盘回车键18:24:03用户点击第一条结果链接从这个过程中可以得出以下结论:1.用户从开始搜索到找到想要的网页,总计用时42秒,而找到网页的时间可以作为衡量搜索引擎设计的重要指标,目标是缩短用户找到网页的时间。2.利用拼音和词语关联性的智能纠错对改进用户搜索发挥了作用。3.搜索“用户日志”第二条结果内容与用户预期相差较大,3秒变跳出网页,没有形成正常的浏览行为,如果多数用户操作如此,说明第二条结果网页内容较差,应该对其重新排序。第一条结果用户花费了22秒浏览,但内容并不是用户最终想要的。4.用户修改了关键词重新搜索,第一条结果满足了用户需求。分析比较简单,但可以从中看到如何利用日志分析,从用户总用时、智能纠错和结果页的点击发现问题。当以时间作为衡量指标时,界面中的各种元素都以此标准为设计依据。比如:1.什么样的按钮最利于用户点击,需要考量到按钮的大小、位置和形状,按钮的颜色、质感和阴影等视觉元素可能偏向主观因素,但同样对用户操作有影响。2.通过统计得知用户使用回车键和点击按钮搜索的比例。3.搜索框有下拉选项的搜索建议。搜索建议可以减少用户输入,有效并且精准的关键词可以减少用户反复搜索。4.服务器搜索时间的时间、网页加载速度、查全率和排序虽然属于技术衡量指标,但设计师需要知道。5.搜索关键词的即时搜索省去从首页跳转结果页的时间。6.从用户输入关键词的统计中可以分析出用户组织关键词的习惯,比如词组,加上限定词和句式等,并对其分类得到总的比例。控制用户反复搜索的次数,比如输入“用户日志”没有找到想要内容,如验证属于普遍问题的话,说明搜索结果页有问题。7.通过A/B和多变量测试得知什么样的结果和广告展示形式最佳,比如链接的颜色、长度、字体和字号等。当找到产品的核心标指标时,设计会变得容易的多,直接可以从用户日志中反馈出设计是否发挥了作用。这种
本文标题:分析网站用户行为方法
链接地址:https://www.777doc.com/doc-1881642 .html