您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > AI人工智能 > 智能推荐数据评估体系
智能推荐数据评估体系目录CONTENTS1智能推荐什么是智能推荐及目前应用场景。2智能推荐方式目前市场上的智能推荐方式有哪些?3智能推荐的一些坑目前智能推荐的一些坑及其解决方案.4智能推荐系统的评测指标什么是好的智能推荐系统?PART1智能推荐1智能推荐智能推荐系统就是联系用户和内容。一方面帮用户发现自己感兴趣的、对自己有价值的内容。另一方面让内容能够展现在对它感兴趣的用户面前。从而实现内容消费者和内容生产者之间的双赢。智能推荐系统不需要用户提供明确的需求,甚至联用户主动提出需求都不需要。智能推荐系统通过分析用户的历史行为给用户的兴趣建模,从而主动给用户推荐满足他/她们兴趣和需求的内容。什么是智能推荐2智能推荐目前应用场景网易云音乐平台的推荐,分析来看跟我当前主页音乐的风格、以及我的历史浏览相关。2智能推荐目前应用场景这是当当网的书籍推荐,即当你浏览一本书时,下面会给这个推荐列表,从其描述以及个人分析来看,与个人的行为相关性会小一些,应该是基于大盘用户的浏览轨迹做的关联分析,进而进行关联推荐。PART2智能推荐方式2智能推荐方式1.分析用户行为数据2.分析用户标签数据基于用户行为分析的推荐算法是智能推荐系统的重要算法,这种类型的算法称为协同过滤算法。顾名思义,协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求。用户行为分为两种:显性反馈行为:包括用户明确表示对物品喜好的行为;隐性反馈行为:指的是那些不能明确反应用户喜好的行为。通过一些特征标签数据联系用户和物品,给用户推荐具有用户喜欢特征的物品。标签是一种无层次化结构的、用来描述信息的关键词,它可以用来描述物品的语义。标签应用一般分为两种,一种是让作者或者专家给物品打标签;另一种是让普通用户给物品打标签,也就是UGC的标签应用。当一个用户对一个物品打上一个标签,这个标签一方面描述了用户的兴趣,另一方面则表示了物品的语义,从而将用户和物品联系了起来。2智能推荐方式3.分析用户社交网络数据4.分析用户上下文信息基于社交网络数据的推荐可以很好地模拟现实社会。在现实社会中,很多时候我们都是通过朋友获得推荐。调查显示,90%的用户相信朋友对他们的推荐,70%的用户相信网上其他用户对广告商品的评论。从该调查可以看出,好友的推荐对于增加用户对推荐结果的信任度非常重要。获取社交网络数据的途径包括:电子邮件用户注册信息用户的位置数据论坛和讨论组即时聊天工具社交网站用户所处的上下文,包括用户访问系统的时间、地点、心情等,对于提高智能推荐系统是非常重要的。用户的上下文信息包括:时间上下文信息:对用户兴趣的影响表现,其包括:用户兴趣的变化、物品是有生命周期的、以及季节效应;地点上下文信息:不同地区的用户兴趣有所不同,用户到了不同的地方,兴趣也会有所不同。PART3智能推荐的一些坑3智能推荐的一些坑当用户行为数据不够的时候,基于用户行为的分析结论就是个伪命题1好的推荐系统一般情况下很依赖于用户的行为数据,因为从用户行为中自然能一窥用户的一些偏好所在,但实际情况是,用户的行为数据并不是这么容易的,当用户行为数据不够的时候,基于用户行为的分析结论就是个伪命题,甚至会把你带向错误的方向。3智能推荐的一些坑2用户的偏好一定是会时间偏移进行转变的,所以用户行为的有效性又会是一个问题。马太效应或者说长尾效应,即热者愈热,实际举例来说就是,在实际的购买场景中,由于你推荐的次数越多,部分优质的商品购买或者点击的次数就越多,形成的用户购买轨迹就越多,所以得到的推荐机会就越多,进而产生的推荐也越多,变得越热。随着不断迭代,子子孙孙无穷尽也,这样得到推荐的商品就会集中在少部分商品中,而大部分长尾商品是沉寂的,一个推荐系统如果长时间处于长尾效应中,造成推荐疲劳,其推荐效果就会减弱。所以,一个好的推荐系统,要考虑到适当的挖掘长尾商品,通过真的个性化,把适当的长尾商品送到真正需要他们的人手里,在实际的操作过程中,我们可以适当的进行热度降权,从而让一些中下层的商品得到更多的曝光机会,当然前提是保证点击率的情况下。另外一个场景会形成马太效应的是热度模型,即我们的热度榜单,长时间的高居榜首,一定会获得更多的点击,而点击越多其热度越高,但我们的信息是需要保持新鲜度的,不然点击率迟早会下架的。所以,我们使用一些机制让处于头部的商品或者信息降权,时间衰减是一个比较通用的做法,即随着时间的迁移,其整体热度会不断的下降,至于说下降的方式,速率就看模型的设计了。3智能推荐的一些坑假设这个是新用户呢?完全没有轨迹信息,怎么破。3所谓冷启动,即在推荐系统初期时,没有任何用户与物品的交集信息,即无用户的行为轨迹,无法通过类似协同或者用户偏好等方式进行推荐,这种时候,我们就称推荐系统处于冷启动状态。这种情况,我们需要尽快的累积起第一批用户行为轨迹。我们可以通过基于内容的推荐,或者做一些其他类似的操作,快速有效的进行物品推荐。一段时间后,累积到一定的用户行为时,整个系统就能够正常使用协同过滤等方式进行推荐了。但是,针对于新加入的用户,或者新加入的物品,同样也是出于冷启动状态的,这个时候,我们通过需要对这种物品或者用户做特殊的处理。除了基于内容属性的推荐,我们还有其他的一些策略用于弥补这种行为数据不足的情况,比如典型的热度模型,推荐热点信息这种行为虽然low,但是从整体的反馈来看,还是有一定效果的,此外,还可以根据一些统计学上的结论,进行基于统计分析结论的推荐。除此之外,我们也可以通过其他渠道收集用户的数据,比如用户注册的时候所填写的个人资料,这些都是可以作为推荐的原始依赖数据。3智能推荐的一些坑实际影响用户的选择的因素太多,我们容易陷入主观臆断的误区,综合性考虑是一个完善推荐系统的必须思考的地方。45产品层面的逻辑有时候比底层算法更有效,典型如上面阅文的截图例子,“喜欢这本书的人也喜欢”,这就是一种策略,也是一种推荐解释,可解释性会提升推荐的可信度,诸如还有一些交互方式、产品形态都是对推荐转化有影响的。PART4智能推荐系统的评测指标智能推荐系统的评测指标4一个完整的智能推荐系统一般存在三个参与方:用户、物品提供者和智能推荐系统的网站。首先,智能推荐系统需要满足用户的需求,给用户推荐那些令他们感兴趣的物品;其次,智能推荐系统要让物品提供者的物品被推荐给对其感兴趣的用户;最后,好的推荐系统设计,能够让智能推荐系统本身收集到高质量的用户反馈,不断完善推荐的质量,增加用户和网站的交互,提高网站的收入。因此一个好的智能推荐系统是能够令三方共赢的系统。智能推荐系统的评测指标4评价智能推荐系统各方面性能的评测指标:1.用户满意度用户作为推荐系统的重要参与者,其满意度是评测推荐系统的最重要指标。一般的情况下,我们可以用点击率、用户停留时间和转化率等指标度量用户的满意度;2.预测准确度预测准确度度量一个智能推荐系统或者推荐算法预测用户行为的能力。这个指标是最重要的智能推荐系统评测指标,包括被推荐物品的评分预测和给用户个性化推荐物品列表的TOPN推荐;3.覆盖率覆盖率描述一个推荐系统对物品长尾的发掘能力。覆盖率有不同的定义方法,最简单的定义为推荐系统能够推荐出来的物品占总物品集合的比例;4.多样性用户的兴趣是广泛的,为了满足用户广泛的兴趣,推荐列表需要能够覆盖用户不同的兴趣领域,即推荐结果需要具有多样性;智能推荐系统的评测指标4评价智能推荐系统各方面性能的评测指标:5.新颖性新颖的推荐是指给用户推荐那些他们以前没有听说过的物品。在一个网站中实现新颖性的最简单办法是,把那些用户之前在网站中对其有过行为的物品从推荐列表中过滤掉;6.惊喜度令用户惊喜的推荐结果是和用户历史上喜欢的物品不相似,但用户却觉得满意的推荐;7.信任度在智能推荐系统中,也存在着信任度的问题,如果用户信任智能推荐系统,那就会增加用户和智能推荐系统的交互。同样的推荐结果,以让用户信任的方式推荐给用户就更能让用户产生更强的购买欲;8.实时性在很多网站中,因为物品(新闻、微博等)具有很强的时效性,所以需要在物品还具有时效性时就将它们推荐给用户。系统的实时性包括两个方面。首先,推荐系统需要实时地更新推荐列表来满足用户新的行为变化;其次,推荐系统需要能够将新加入系统的物品推荐给用户,这主要考验了推荐系统处理物品冷启动的能力;智能推荐系统的评测指标4评价智能推荐系统各方面性能的评测指标:9.健壮性任何一个能带来利益的算法系统都会被人攻击,这方面最典型的例子就是搜索引擎。这是因为如果能让自己的商品成为热门搜索词的第一个搜索果,会带来极大的商业利益。推荐系统目前也遇到了同样的作弊问题,而健壮性指标衡量了一个智能推荐系统抗击作弊的能力;10.商业目标很多时候,网站评测智能推荐系统时更加注重网站的商业目标是否达成,而商业目标和网站的盈利模式是息息相关的。一般来说,最本质的商业目标就是平均一个用户给公司带来的盈利。智能推荐系统的评测指标4评价智能推荐系统各方面性能的评测维度:除评测指标外,在系统的评测中还需要考虑评测维度。其目的就是知道一个算法在什么情况下性能最好,这样可以为融合不同推荐算法取得最好的整体性能带来参考,从而帮我们全面地了解系统的性能。一般来说,评测维度分为如下3种:THANKS陈许亚
本文标题:智能推荐数据评估体系
链接地址:https://www.777doc.com/doc-7367125 .html