您好,欢迎访问三七文档
推荐算法综述作者:杨博赵鹏飞机构:吉林大学山西大学学报主要推荐算法1、协同过滤推荐算法2、基于内容的推荐5、推荐系统的评价准则3、基于图结构的推荐4、混合推荐&其他推荐算法1协同过滤推荐算法用户-项目评分矩阵User-itemratingmatrix1协同过滤推荐算法2、基于模型的推荐1、基于记忆的推荐基于用户(user-based)的推荐基于项目(item-based)的推荐基于朴素贝叶斯分类的推荐基于线性回归的推荐基于马尔科夫决策过程的推荐1.1基于记忆的推荐1.基于用户(user-based)的推荐根据余弦相似度计算用户间相似度根据计算出来的相似度估计用户评分:(2.5)1.1基于记忆的推荐2.基于项目(item-based)的推荐根据余弦相似度计算项目间相似度根据计算出来的相似度估计评分1.2基于模型的推荐采用统计学、机器学习、数据挖掘等方法,根据用户历史数据建立模型,并产生合理推荐。简单的评分模型:1.2基于模型的推荐基于模型的推荐基于朴素贝叶斯分类的推荐基于线性回归的推荐基于马尔科夫决策过程的推荐1.2基于模型的推荐1.基于朴素贝叶斯分类的推荐朴素贝叶斯分类方法的前提是假设样本的各个属性相互独立由朴素贝叶斯假设可得:=1.2基于模型的推荐2.基于线性回归的推荐线性预测模型:u=(x1,x2,…,xn)表示用户u对n个项目的评分p=(a1,a2,…,an)表示评分系数、m表示偏差1.2基于模型的推荐3.基于马尔科夫决策过程MDP的推荐借鉴强化学习(reinforcementlearning)的思想,把推荐过程建模为MDP最优决策问题,即如何产生一个能最大用户收益的推荐项目列表.将MDP模型定义为一个4元组(S,A,R,Pr)推荐过程对应的MDP过程:121.2基于模型的推荐除以上介绍的方法外,基于模型的协同过滤方法还包括基于聚类的Gibbs抽样方法,概率相关方法和极大熵方法等.基于模型的协同过滤算法能在一定程度上解决基于记忆的推荐算法面临的主要困难,在推荐性能上更优,但通常算法复杂,计算开销大.2基于内容的推荐算法基于内容的推荐算法文本推荐方法基于潜在语义分析的推荐自适应推荐2基于内容的推荐算法1.文本推荐方法采用TF-IDF方法:TermFrequency:词频InverseDocumentFrequency:逆向文件频率相似度计算公式:根据历史信息构造用户偏好文档,计算推荐项目与文档的相似度,将最相似的项目推荐给用户.2基于内容的推荐算法关键词的同义和多义现象导致文档相似度不准确.提出了潜在语义分析方法(LatentSemanticAnalysis,LSA).2.基于潜在语义分析的推荐(LSA和SVD)LSA方法基于SVD分解:然后把Ʃ的r个对角元素的前k个保留(最大的k个),后面最小的r-k个奇异值置0,得到Ʃk;最后计算一个近似的分解矩阵:2基于内容的推荐算法3.自适应推荐偏好文档是基于内容推荐的关键.用户的兴趣会随时间动态变化,因此需要及时更新偏好文档.采用更新用户文档的自适应过滤方法:(1)首先确定用户偏好模型(2)选择合适的阈值进行过滤(3)比较每一次的偏差(4)根据偏差以及阈值调整公式算下一轮的阈值(5)迭代直到取得合适的阈值2基于内容的推荐算法3.自适应推荐主题向量特征向量偏好模板训练集相似度阈值阈值是否成立非正例文本正例文本特征提取阈值调整是否3基于图结构的推荐算法用户项目矩阵可建模为二部图,节点表示拥护和项目,借鉴动态网络资源分配过程。该方法的推荐过程如下:①建立推荐二部图.m个项目X1X2X3X4X5y3y2y1n个用户②计算资源分配矩阵W.a53=13基于图结构的推荐算法③针对指定用户计算各项目的资源分配.fi=(ai1,ai2,…,aim)表示用户i的初始资源分配,由图可知用户y1的初始资源分配:f′i表示用户i的最终资源分配,则有f′i=Wfi.用户1的最终资源分配为:④根据最终资源分配从大到小产生除了用户已经偏好项目外的推荐.对用户1推荐项目的排序是:3142=54混合推荐算法&其他推荐算法协同过滤&基于内容·两种方法单独进行将结果混合·基于内容融合到协同过滤的方法中·协同过滤融合到基于内容方法中·混合到一个框架下产生新的推荐方法混合推荐:为解决以上三种算法各自问题而提出的.其他推荐:基于关联规则(啤酒-尿布)和基于知识的推荐5评价准则1.平均绝对误差(meanabsoluteerror,MAE)用于度量推荐算法的估计评分与真实值之间的差异.2.均方根误差(rootmeansquarederror,RMSE)RMSE是Netflix竞赛(电影推荐)采用的评价准则.RMSE值越小,算法的准确度越高.5评价准则3.查全率(recall)用于度量推荐列表中是否包含了用户偏好的全部项目.4.查准率(precision)用于度量推荐列表中是否都是用户偏好的项目.Li表示推荐算法为用户i产生的推荐列表,Ri表示测试集中用户i偏好的全部项目.总结推荐系统是帮助用户解决信息过载问题的有效工具,已被广泛应用于包括电子商务在内的多个领域.协同过滤、基于内容推荐、基于图结构推荐和混合推荐是目前较为常见的推荐方法.本文综述了相关算法,分析了各自方法的优势与不足,总结了常被采用的推荐算法评价准则.现有的推荐算法仍面临诸多困难,其中数据稀疏、过拟合、可扩展性和多媒体信息特征提取是主要问题。现有的技术和方法都不能从根本上解决这些问题.随着应用领域的不断拓展,推荐系统还会面临新的需求与问题.针对以上问题的推荐方法研究仍是信息检索、数据挖掘和机器学习等智能信息处理领域的研究热点.Thankyouforyourattention!
本文标题:推荐算法综述
链接地址:https://www.777doc.com/doc-4918438 .html