您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 来自网上用户评论的声音基于文本数据的产品评价分析
1来自网上用户评论的声音——基于文本数据的产品评价分析摘要互联网的迅猛发展使得用户生成内容数量呈爆炸性增长,国内利用用户生成内容,分析产品评价的文献如凤毛麟角;国外的相关研究局限于语言差异,无法在中国市场直接推广。本文的贡献在于:首先,基于网上顾客产品评价的文本数据进行产品评价分析,而不是以问卷、深度访谈或焦点小组讨论,较好的削弱了顾客由于记忆偏差产生的调研误差;其次,从顾客对产品的关注点出发,而不是企业的关注点,在产品评价上更具顾客导向;再次,基于计算机切词技术和模糊综合评价法,本方法可对产品进行持续性评价,从而了解产品评价的动态变化。关键词:用户生成内容;产品评价;文本数据;模糊综合评价法2ABSTRACTThenumberofusergeneratedcontenthasanexplosivegrowth,duetotherapiddevelopmentofInternet.Thiskindofphenomenonprovidesrichmaterialsfortheacademicresearch,alsoabetterwayforenterprisestounderstandconsumers’demandandtheirfeelingsofproductperformance.However,thereareonlyafewpaperabouthowtogetproductevaluationfromtheusergeneratedcontentinthedomestic.ManyforeignliteraturesaboutUGCcannotbeuseddirectlytoevaluateproductsinchinaforthelanguagedifferences.Inthestudy,thispaperbuildsaproductevaluationsystemwhichissuitableforonlinecomments.Then,toverifythefeasibilityofthismethod,wecollectedmorethan500onlinecomments,andmakeananalysisofthesedatabyusingwordsegmentationtechnologyandFuzzyComprehensiveEvaluation.Finally,wecompareourresultswiththeproductevaluationindexonTaobaowebsite,findingthatourevaluationmethodismoredetailedandmoretargeted.Wearedifferentwithpreviousproductevaluationmethod.Firstofall,thisarticleisbasedononlinecustomersproductcomments,ratherthanthequestionnaire,in-depthinterviewsorfocusgroupdiscussion;Secondly,weembarksfromthecustomers'productconcerns,ratherthantheconcernsoffirms;thirdly,basedoncomputerwordcuttingtechnologyandfuzzycomprehensiveevaluation,ourmethodcanfocusonconsumers'feelingofproductperformanceovertime,soastounderstandthedynamicchangesoftheproductevaluation.Keywords:Usergeneratedcontent;Productevaluation;textdata;Fuzzycomprehensiveevaluation引言3互联网技术的飞速发展,使得人们的生活习惯也随之改变,用户在web2.0环境下,参与网上购物、网上社区和网上娱乐。UGC——用户生成内容是web2.0时代的产物,互联网用户自发生成文本、图片或者是视频等信息上传到互联网上,并通过用户搜索、传播和再创造的方式不断扩大其影响力。在中国市场上,UGC的产量越来越高,而且大多为免费数据。从学术研究的视角来看,UGC给学术研究带来了丰富的原料。另一方面,从企业的角度来看,与产品相关的UGC蕴含着非常丰厚的商业价值。企业可以从产品相关UGC中通过数据挖掘,分析出顾客对品牌定位的认知、企业产品功能表现、顾客对产品的满意度等等。网上顾客售后评价,是一种产品针对性较强的用户生成内容,它由顾客购物后直接创造,具有较强的持续性和可跟踪性,直接反映了顾客对产品最真实的评价,也向企业展示了顾客的产品关注点。以往对产品满意度或者是评估模型的研究,多基于结构化模式的用户态度调查,获取的都是顾客的事后评论,由于人脑记忆的偏差性[1],顾客对用户产品评价的测量的准确性还存在着很大的提升空间。以问卷调查的方式进行顾客产品评价研究,会因为问卷调查方法自身的局限性,使得最终结果显示的是企业为顾客指定的满意度测评。调查者事先确立一个评估框架,被调查的顾客在一个企业关注点而不是顾客关注点的框架下完成对产品的评价,最后得出的产品评估结果往往缺乏应有的针对性。除此之外,以往产品评估方式数据都是在某一个时点直接获取,连续性不强,测评结果只能反映一时的产品动态,而无法对产品表现进行长期关注,就算调查者愿意定期进行测评,也会花费较大的时间成本和物资成本。基于文本数据进行产品评价,目前还缺乏相应完善的产品评价体系和模型,而且文本数据本身就存在数据庞大、比较难以清理和量化的特点,这使得利用中文文本数据进行产品评价困难重重。本文在广泛阅览国内外文献的基础上,构建了一套适合文本数据的较为全面的产品评价体系,并通过中文分词技术和模糊归类技术,对文本数据进行清理和量化,最终开拓出了一个可以真实的、连续的获得以用户为中心的产品评价方法。最后,本文作者在国内零售网站上,获取了部分产品售后评价的文本数据,结合本文的思路和方法进行了分析,从实证的角度实验了该方法的可行性。41相关文献研究1.1产品满意度与产品评价满意度一直是国内外学术研究的热点,ISO9000《质量管理体系基础和术语》将“顾客满意”定义为“顾客对其要求已被满足的程度的感受”由此可见,顾客满意度是指“顾客接受产品和服务的实际感受与其期望值相比较的程度”[2]。国内对满意度测量的研究可粗略的分为两个方面:宏观层面的全国及行业顾客满意度测评研究和微观层面的产品、服务、企业和品牌满意度测量。刘欣艳(2003)对瑞典顾客满意度晴雨表指数模型(SCSB)、美国顾客满意度指数模型(ACSI)、欧洲顾客满意度指数模型(ECSI)进行详尽了介绍,并逐一分析了各种模型的优缺点,还在此基础上对CSI模型进行了改进。近年来,顾客满意度指数行业化研究趋势逐渐显露,如顾海(2008)从测量分析方法改进的角度,构建基于医疗行业的满意度体系;胡启国等(2009)结合汽车产品,给出顾客满意度测评指标体系建立的具体过程和步骤,最后以该汽车顾客满意度的测评指标体系为汽车行业满意度测评提供具体参考。在微观层面,马义华、叶祥凤(2008)以成都欧尚超市的调查情况为依据,构建了大型超市顾客满意度评价指标体系框架,并通过实证分析找出影响大型超市顾客满意度的关键性因素,提出了大型超市提升顾客满意度的对策建议。但是,国内却很少有开发出具有广泛适用性、并且针对中国国情的单个产品的满意度指标测量体系。在对产品顾客满意度研究中,期望不一致模型应用广泛[3]。比较感知产品绩效和消费者期望水平,能得出消费体验。当感知产品绩效达到或超过期望水平时消费者就会感到满意,反之则感到不满意[4]。目前关于产品满意度测量的研究,大多先建立满意度测评体系,再采用问卷的方式,如康大庆等(2003)关于摩托车产品满意度测量的实证研究正是利用了问卷的方式。不过,李长宏、郭伟等(2003)在“客户价值及其在产品评价中的应用”一文中,细化了基于顾客价值的产品评价模型,从产品功能评价和感知成本核算的角度来对产品进行评价。本文对产品评价,主要是基于用户生成内容文本数据,由于文本数据中顾客期望和顾客感知在现阶段难以系统的进行识别,所以对产品的评价主要从产品自身各属性和维度进行测量,同时也考虑到附加在产品身上的服务和品牌因素。1.2用户生成内容与产品购后评论5用户生成内容(usergeneratedcontent,UGC)是指,在Web2.0网络环境下,网站采用开发、参与的模式,依赖用户参与、主导、建设来生成新的信息,并引起其他用户的参与,从而将用户自己的观点或者是创造内容共享到网上平台[5]。近两年来,国内关于UGC研究的文献逐渐增长,特别是与产品相结合的研究还有很大的发展空间。潘洪涛,王新新等(2011)在其研究中,通过测量用户生成内容中有关品牌的定位,从而了解用户对品牌的感知情况,并证实了在虚拟品牌社群环境中,消费者通过UGC,会对不同品牌产生不同的感知;同时还指出在存在竞争关系的品牌之间,企业可以从对UGC的分析中,了解到自身品牌定位和竞争品牌在消费者心中的定位[6]。随后,又有学者以UGC作为产品,从UGC内容本身和UGC创作者的角度,对用户使用UGC的满意度和决策行为进行了探究:用户生成内容的内部特征正向影响消费者对内容的使用和满足;创作者声誉外部特征正向影响消费者对内容的使用与满足;内容的推荐性未对消费者选择产生作用[7]。以上学者的研究,为后续用户生成内容的营销化应用奠定了坚实的基础。用户购物后评论,也属于用户生成内容的范畴之内。网上顾客的在线评论数量剧增导致消费者在处理网上信息时开始参照其他人的评论。总的来说,这种趋势对顾客的网上购买决策有着决定性的影响[8]。现有研究都侧重于诊断顾客评论信息的时间序列和量化(比如说评级质量[9]数量[10]和评论者的识别信息[11])以及产品方面的品牌知名度与产品价格。基于文本交流的最新研究表明:文本评论的内容和风格元素是消费者决策的前置影响因素[12]。StephanLudwig,KodeRuyter(2013)将UGC的语言内容和风格区分开来:从词性的角度来看,“语言内容一般为名词、普通动词、形容词和副词;语言风格词汇或者说虚词通常由代词、介词、冠词、连词、辅助动词和其他比较晦涩的词类组成。这些词类不仅显示人们传达的是什么(即句子的意义),还显示人们是如何对信息进行组合的(句子的风格)[13]。在以上关于UGC的研究的基础上,本文试图用词语分割的方式,先理清产品评价的各个维度(产品和品牌),建立相应的产品评价模型,继而从用户购物评论中挖掘出顾客对产品的整体评价。1.3产品评价属性和维度产品是指向市场提供的,引起注意、获取、使用或者消费,以满足欲望或需要的任何东西。对产品而言,售后评论是顾客对产品各项属性及功能还有价值的感知,是衡量产品各方面表现的重要参照指标。根据美国消费者满意度评估指数6(ACSI)模型和刘新艳(2003)建立的中国顾客满意度模型,本文从产品感知质量和产品感知价值两个角度去建立产品评价的属性和维度。学术界对产品的分类有多个角度,如有形产品和无形产品、功能型产品和享受型产品[14]。Mittal的研究指出,产品可以分为两种类型:一种强调功能或绩效,可被称作功能性产品,如电饭煲、计算机和刮胡刀等;另一种产品突出个人或自我表现,可被称作享受性产品,如美甲服务、保养品和奢侈包包等[15]。各种类型的产品都可以从属性的角度,大致细分出功能属性和享受性属性。Dhar、Okada和O′Curry等认为,享受性产品主要或相对地更具有享受性属性,功能性产品主要或相对多的具有功能性属性[16]。从本质上讲,顾客对产品的功能性评价更强调认知,而享受性评价则突出情感[17]。随着后现代消费观的崛起,象征性
本文标题:来自网上用户评论的声音基于文本数据的产品评价分析
链接地址:https://www.777doc.com/doc-2383416 .html