您好,欢迎访问三七文档
推荐算法简介目录1推荐系统的出现2推荐引擎的分类3主流推荐算法4结束语推荐系统的出现随着互联网的发展,人们正处于一个信息爆炸的时代。相比于过去的信息匮乏,面对现阶段海量的信息数据,对信息的筛选和过滤成为了衡量一个系统好坏的重要指标。一个具有良好用户体验的系统,会将海量信息进行筛选、过滤,将用户最关注最感兴趣的信息展现在用户面前,这大大增加了系统工作的效率,也节省了用户筛选信息的时间。推荐系统应运而生…目录1推荐系统的出现2推荐引擎的分类3主流推荐算法4结束语推荐系统的分类根据推荐引擎是不是为不同的用户推荐不同的数据可分为大众行为的推荐引擎:对每个用户都给出同样的推荐,这些推荐可以是静态的由系统管理员人工设定的个性化推荐引擎:对不同的用户,根据他们的口味和喜好给出更加精确的推荐推荐系统的分类根据推荐引擎的数据源可分为基于人口统计学的推荐:根据系统用户的基本信息发现用户的相关程度基于内容的推荐:根据推荐物品或内容的元数据,发现物品或者内容的相关性基于协同过滤的推荐:根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或是发现用户的相关性推荐系统的分类根据推荐模型的建立方式可分为基于物品和用户本身的推荐:以二维矩阵来秒速每个用户对于每个物品的喜好程度基于关联规则的推荐:挖掘一些数据的依赖关系,典型的场景就是“购物篮问题”基于模型的推荐:将已有的用户喜好信息作为训练样本,训练出一个预测用户喜好的模型,并以此来推荐目录1推荐系统的出现2推荐引擎的分类3主流推荐算法4结束语主流推荐算法——基于内容推荐核心思想:根据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。主流推荐算法——基于内容推荐优点:1)不需要其它用户的数据,没有冷开始问题和稀疏问题2)能为具有特殊兴趣爱好的用户进行推荐3)能推荐新的项目4)可列出推荐项目的内容特征5)技术较成熟缺点:1)物品的属性有限,很难有效的得到更多数据2)物品相似度的分析仅仅依赖于物品本身的特征3)需要基于用户以往的喜好历史做出推荐,所以对于新用户有“冷启动”的问题主流推荐算法——基于人口统计学的推荐核心思想:根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。主流推荐算法——基于人口统计学的推荐优点:1)不需要使用当前用户对物品的喜好历史数据,所以对于新用户来讲没有“冷启动”的问题2)不依赖于物品本身的数据,所以这个方法在不同物品的领域都可以使用,它是领域独立的缺点:1)方法过于粗糙,对于品味要求较高的领域无法得到很好的推荐效果2)可能涉及比较敏感的信息,不易获取主流推荐算法——基于关联规则推荐核心思想:主要是挖掘一些数据的依赖关系,典型的场景就是“购物篮问题”,通过关联规则的挖掘,我们可以找到哪些物品经常被同时购买,或者用户购买了一些物品后通常会购买哪些其他的物品,当我们挖掘出这些关联规则之后,我们可以基于这些规则给用户进行推荐。主流推荐算法——基于关联规则推荐优点:1)能发现新兴趣点2)不要领域知识缺点:1)规则抽取难、耗时2)产品名同义性问题3)个性化程度低主流推荐算法——基于效用的推荐核心思想:是建立在对用户使用项目的效用情况上计算的,其核心问题是怎么样为每一个用户去创建一个效用函数,因此,用户资料模型很大程度上是由系统所采用的效用函数决定的。抽取一个物品的N个方面,然后统计用户在这N个方面的喜好偏重,生成喜好向量。主流推荐算法——基于效用的推荐优点:1)无冷开始和稀疏问题2)对用户偏好变化敏感3)能考虑非产品特性缺点:1)用户必须输入效用函数2)推荐是静态的,灵活性差3)属性重叠问题主流推荐算法——基于知识推荐核心思想:在某种程度是可以看成是一种推理技术,它不是建立在用户需要和偏好基础上推荐的。效用知识是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系,所以用户资料可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。主流推荐算法——基于知识推荐优点:1)能把用户需求映射到产品上2)考虑非产品属性缺点:1)知识难获得2)推荐是静态的主流推荐算法——组合推荐核心思想:研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,然后用某方法组合其结果。主流推荐算法——组合推荐比较流行的组合方法:加权:用线性公式将几种不同的推荐按照一定权重组合起来切换:允许在不同的情况下,选择最为合适的推荐机制计算推荐分区:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户分层:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐主流推荐算法——基于协同过滤的推荐实现协同过滤步骤:收集用户偏好找到相似的用户或物品计算推荐基于协同过滤的推荐——收集用户偏好要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。基于协同过滤的推荐——找到相似的用户或物品即是计算两个向量的距离,距离越近相似度越大。在推荐的场景中,在用户-物品偏好的二维矩阵中,我们可以将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,或者将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度。相似度的计算:找到相似的用户或物品——相似度的计算欧几里德空间中两个点的距离欧几里德距离:相似度找到相似的用户或物品——相似度的计算一般用于计算两个定距变量间联系的紧密程度,其取值在[-1,+1]之间。Sx,Sy是x和y的样品标准偏差。皮尔逊相关系数:找到相似的用户或物品——相似度的计算Cosine相似度被广泛应用于计算文档数据的相似度Cosine相似度:找到相似的用户或物品——相似度的计算是Cosine相似度的扩展,也多用于计算文档数据的相似度Tanimoto系数:基于协同过滤的推荐——找到相似的用户或物品固定数量相似邻居的计算:基于相似度门槛基于协同过滤的推荐——基于用户的协同过滤推荐核心思想:基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户基于协同过滤的推荐——基于项目的协同过滤推荐核心思想:在计算邻居时采用物品本身,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。基于协同过滤的推荐——基于模型的协同过滤推荐核心思想:基于模型的协同过滤推荐就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测,计算推荐。基于协同过滤的推荐——基于模型的协同过滤推荐优点:1)不需要对物品或者用户进行严格的建模,且不要求物品的描述是机器可理解的,与领域无关的。2)这种方法计算出来的推荐是开放的,可以共用他人的经验,很好的支持用户发现潜在的兴趣偏好缺点:1)对新物品和新用户都有“冷启动”的问题。2)推荐的效果依赖于用户历史偏好数据的多少和准确性。3)对于一些特殊品味的用户不能给予很好的推荐。4)很难修改,方法不够灵活。目录1推荐系统的出现2推荐引擎的分类3主流推荐算法4结束语结束语推荐系统改变了没有活力的网站与其用户通信的方式。无需提供一种静态体验,让用户搜索并可能购买产品,推荐系统加强了交互,以提供内容更丰富的体验。推荐系统根据用户过去的购买和搜索历史,以及其他用户的行为,自主地为各个用户识别推荐内容。TheEndThanksforlistening
本文标题:推荐算法
链接地址:https://www.777doc.com/doc-3507189 .html