您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 工作范文 > 关联规则在化妆品销售分析中的应用
关联规则在化妆品销售分析中的应用陆召连辽宁工程技术大学研究生学院,辽宁兴城(125105)E-mail:luzhaolian2006@sohu.com摘要:首先对关联规则和核心算法Apriori进行了描述,然后通过研究某公司的销售数据的关联度,展示了Apriori算法在商品关联性分析中的具体运用,提出了适用于化妆品零售的相关性分析模型。通过商业检验,该算法可以显著提高相关商品的销售额。关键词:数据挖掘,关联规则,Apriori算法,销售分析1.引言各种大型超市的出现,条形码的使用,生成大量的销售数据,这些数据中蕴含了大量关于客户和商品的知识。在当前竞争激烈的环境下,分析这些数据,可以了解用户的购买习惯,以及所购买物品之间的关联关系。从而商家可以利用这些信息做市场策划,布置商品陈列,开展捆绑销售、打折等促销活动,为客户提供更好的服务。数据挖掘就是这样一种技术:能够从大量的数据中分析出隐藏于其中的一些规律和模式。零售业的销售数据有其自身的特点,是以项目集的形式存在,这就决定了关联规则挖掘必然会广泛应用于此领域。关联规则[1]挖掘就是挖掘所有支持度和置信度分别大于等于预定的最小支持度Min-Support和最小可信度Min-Confidence的规则。本文结合实例运用关联规则挖掘算法对零售店的销售数据进行分析研究,找出了其中的规律和模式。2.关联规则基础知识关联规则表示数据库中一组对象之间某种关联关系的规则。例如,关联规则可以表示为“购买了项目A和B的顾客中有95%的人又买了C和D”。从这些规则可找出顾客购买行为模式,应用于商品货架设计、生产安排、针对性的市场营销活动以及产品的组合销售等。关联规则由R.Agrawal等人于1993年首先提出,随即引起了广泛的关注。许多研究者(包括R.Agrawal本人)对关联规则挖掘问题进行了深入的研究,对最初的关联规则挖掘算法进行了改进和扩展。2.1关联规则的描述设I={i1,i2,…,im}是项的集合,其中的元素称为项(item)。记D为交易T的集合,这里交易T是项的集合,并且TI⊆。对应每一个交易有唯一的标识,如交易号(TID)。设X是一个I中项的一个集合,如果XT⊆,那么称交易T包含X[2]。一个关联规则是形如XY⇒的蕴涵式,这里XI⊆,YI⊂,并且XY=ΦI。规则XY⇒在事物数据库D中的支持度(support)是事物集中包含X和Y的事物数与所有事物数之比,记为()supportXY⇒,即()sup{:,}portXYTXYTTDD⇒=⊆∈U规则X=Y在事物集中的可信度(confidence)是指包含X和Y的事务数与包含X的事物数之比,记为()confidenceXY⇒,即:(){:,}{:,}confidenceXYTXYTTDTXTTD⇒=⊆∈⊆∈U给定一个交易集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度(Min-Support)和最小可信度(Min-Confidence)的关联规则。2.2核心算法AprioriAgrawal等在1993年设计了一个基本算法Apriori提出了挖掘关联规则的一个重要的基于两阶段频集思想的方法,是最典型的层次算法,是布尔关联规则挖掘算法中最成功的一类算法。其核心技术为其它各类布尔关联规则挖掘算法所广泛采用[3]。Apriori算法是将关联规则挖掘算法的设计分解为两个子问题:(1)所有支持度大于最小支持度的项集(Itemset),这些项集被称为频集(FrequentItemset)。(2)使用第1步找到的频集产生期望的规则。Apriori算法是一种宽度优先算法,通过对数据库D的多趟扫描来发现所有的频繁项目集。在每一趟扫描中只考虑具有同一长度k(即项目集中所含项目的个数)的所有项目集。在第1趟扫描中Apriori算法计算D中所有单个项目的支持度,生成所有长度为1的频繁项目集L1。在后续的每一趟k中,首先以前一趟中所发现的所有频繁项目集为基础,生成所有新的候选项目集(CandidateItemsets)即潜在的频繁项目集,然后扫描数据库D,计算这些候选项目集的支持度,最后确定候选项目集中哪一些真正成为频繁项目集Ck。重复上述过程直到再也发现不了新的频繁项目集[4]。关于Apriori的具体算法描述如下:输入:事务数据库D;最小支持度Min-Support;输出:D中的频繁项集L。3.关联规则在零售业中的应用某公司专营化妆品,公司在该市的多处设有销售网点。本文采集的分析数据来自于实际运作数据,为了防止错误数据产生,特意选定了一台POS机在一段时间稳定销售的销售数据。对于实际数据挖掘而言,只有Sales-Item和Goods这两个域有用。限于篇幅,仅列出15个销售单、5种商品。将5种商品标记组成商品库:DA={洗发水A、沐浴露B、防晒品C、面膜D、美容工具E},如表1所示。表1销售数据库Sales-ItemGoods01A,D,E02A,B,C,E03A,C,D,E04A05A,B,C,D,E06A,B,D07A,B,D,E08A,E09A,C10A,B,C11C,E,D13C,D14A,C,E15A,C,D运用Apriori算法,找出最小支持度为25%和长度为3的频繁项目集。过程如图1所示。数据库DASales-ItemGoods01A,D,E02A,B,C,E03A,C,D,E04A05A,B,C,D,E06A,B,D07A,B,D,E08A,E09A,C10A,B,C11C,E12A,D13C,D14A,C,E15A,C,DC2GoodsSupport{A,C}46%{A,D}46%{A,E}46%{C,D}26%{C,E}33%{D,E}26%C3GoodsSupport{A,C,D}20%{A,C,E}26%{A,D,E}26%{C,D,E}13%图1Apriori算法的实例在上例中,销售数据库DA经扫描、筛选、联合、剪枝的过程,最后得到所需的频繁集L3={A,C,E}和L3={A,D,E};在此基础上再给出可信度为76%和约束条件“推导式右边只含一个商品”,则可以得出关联规则如表2。GoodsSupport{A}86%{B}33%{C}60%{D}53%{E}53%GoodsSupport{A}86%{C}60%{D}53%{E}53%GoodsSupport{A,C}46%{A,D}46%{A,E}46%{C,E}33%GoodsSupport{A,C,E}26%{A,D,E}26%联合、剪枝、扫描DA联合、剪枝、扫描DA筛选筛选联合、剪枝、扫描DA筛选C1L1L2L3:C→A76%规则2:D→A86%规则3:E→A86%4.结果和讨论从上述规则可以初步得出结论:(1)首先,从规则2可以看出购买本公司产品的顾客中相当比例的人在购买了面膜或美容工具的情况下几乎肯定要购买洗发水。(2)其次,从规则4可以看出同时购买防晒和美容工具的顾客购买洗发水的概率很高。根据上述规则,与商业伙伴共同制定了如下计划去实施关联规则的实际应用:(1)针对分析中显示关联性很高的商品,该公司单店试行,将{洗发水、面膜、美容工具}3种属于不同小类的商品摆放在一起。(2)针对其他关联性商品,实行促销。在销售促销单明确而且显眼的地方,向顾客推荐关联性的商品。最终通过销售报表可以看出,在不改变商品售价的前提下,试行的单店中的该3种商品的销售额都提高了20%以上。5.结语本文只是对零售业中的化妆品销售进行数据挖掘的研究,就零售行业而言,便利店的数据形态与此有相似之处。在整个零售行业中,便利店所占的销售份额很大,如果能将这种方法有效地推广到便利店,将对零售业的销售业绩的提升产生积极的影响。参考文献[1]AgrawalR,lmielinskiT,SwamiA.MiningAssociationRulesbetweenSetsofItemsinLargeDatabases.ProceedingsofACMSIGMODConferenceonManagementofData,1993:207-216[2]唐敏.关联规则挖掘算法在超市销售分析中的应用,计算机科学,2006,33(2):149-150[3]肖劲松,林子禹,毛超.关联规则在零售商业的应用,计算机工程,2004,30(3):189-190[4]王方华,陈洁.数据库营销.上海:上海交通大学出版社,2006ApplicationofAssociationRulesintheSalesDataAnalysisofCosmeticsLuzhaolianCollegeofgraduate,LiaoningTechnicalUniversity,XingCheng,Liaoning(125105)AbstractThispaperdescribestheconceptofassociationrulesandApriorimethodologyfirstly.AnditshowstheapplicationofApriorimethodologyingoodsAssociation.ItalsogivesoutsalesassociationanalysisdatamodelinCosmeticsretailing.Itprovesthatitcanincreasethesalesdramaticallybyapplyingthismethodologytotherealbusinessenvironment.Keywords:Datamining,Associationrules,Apriorimethodology,SalesanalysisGoodsConfidence规则4:CE→A78%
本文标题:关联规则在化妆品销售分析中的应用
链接地址:https://www.777doc.com/doc-5690499 .html