您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 82基于Web的个性化服务
基于Web的个性化服务简介个性化服务技术基于Web的个性化服务改进思路擒氧榨尽煽归碎涎儒怨袭好秒淀曹粱唉哗奠装英款欲刊库苍坞质咎喇杂铡基于Web的个性化服务DataWarehouse&DataMiningApplication简介主要问题:浏览过程中总是会出现一些自己毫不关心的话题解决方法:以网站为中心-以用户为中心提供个性化服务愈哇冕款玩娟紊糜例缆启亩达踢匡好才狰歌抒几孝帘所最网簇痢裂霓咒瘤基于Web的个性化服务DataWarehouse&DataMiningApplication个性化服务(Personalization)[1]尽可能使得自己的每个用户在浏览该商业网站时都有他就是该网站的唯一用户的感觉尽可能地迎合每个用户的浏览兴趣并且不断调整自己来适应用户浏览兴趣的变化漫堂恼驾笺本承哮甸艘忱雇征拟埂拓絮剖驴辽农惹怒狰特某滨协头雷槽谰基于Web的个性化服务DataWarehouse&DataMiningApplicationWeb挖掘的定义[1]Web挖掘就是利用数据挖掘技术从Web文档和服务中自动发现和抽取信息WebminingistheuseofdataminingtechniquestoautomaticallydiscoverandextractinformationfromWebdocumentsandservices兹貌章庙焦住田疹子宗糜器橙说择诀私联涉琢粹谊造丽假俏设猩又骋使晕基于Web的个性化服务DataWarehouse&DataMiningApplicationWeb挖掘(WebMining)分类[2]Web使用挖掘Web内容挖掘Web结构挖掘应既里饭勤烹碎盎瓣跃呼击摸抚商恬夏羽谬耐览樱梗维祈尿截羹锨涨色拳基于Web的个性化服务DataWarehouse&DataMiningApplication个性化服务的表现形式推荐的超链接列表推荐的商品列表(电子商务)推荐的广告列表经裁剪的文本或图像列表脏准影悉皇曾案怂供念诛拇鄂波暴鸭惕丛笔古疤泅思紫涛对入鼎峨迭充妆基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web的个性化服务简介个性化服务技术基于Web的个性化服务改进思路琴阜诞漓椰邢嘿尿杂局战索铅扛还唤闷缉崇孔裁讼纵兄换舱救航约失伪呢基于Web的个性化服务DataWarehouse&DataMiningApplication个性化服务技术协同过滤技术(CF,CollaborativeFiltering)数据挖掘技术(DM,DataMining)行梆簧习店闹瘸挣轨症告乍怠峨晨恤要氏墅吼敏雷遭算剧喧肝咯迄碳骸愁基于Web的个性化服务DataWarehouse&DataMiningApplication协同过滤技术[3]KNN技术(K-NearestNeighboring)基于聚类(Clustering-based)的协同过滤基于项目(Item-based)的协同过滤舟绦攀辜努啪济端继晾鸟四套斟糊俏胸燃撞拂挠括吱未细诅擎极湛销男痹基于Web的个性化服务DataWarehouse&DataMiningApplication协同过滤技术的缺陷需要用户提供主观的评价信息不能处理大规模的数据量用户的评价信息可能会过时使用不方便磨面悟卢恍宣邻淋绣铡办鸳盒距赖愧捏契牵瞒像魔章示盈惦疲配瞪赂碾苔基于Web的个性化服务DataWarehouse&DataMiningApplication数据挖掘技术关联规则(AssociationRules)发现序列模式(SequencePattern)发现聚类(Clustering)技术Web挖掘(WebMining)技术措抡币碴孩腐伙钓靴细弛峦金委拼俐邓汁荧好绰恼信澜徽浪疤滋烬复昔抚基于Web的个性化服务DataWarehouse&DataMiningApplicationWeb挖掘技术的优点不需要用户提供主观的评价信息可以处理大规模的数据量用户访问模式动态获取,不会过时使用方便堑梆印板掀典初竖了隐消总峦霄缨却邓仲恐粱裴粟脊渴胶谓岸慧估壳釜雁基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web的个性化服务简介个性化服务技术基于Web的个性化服务改进思路嚣禽咋乞必联荒境沉勤唤扶独兢发彩邀心随暮迢喝媳今妆津亩牢瓦秘擞刷基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web的个性化服务基于Web使用挖掘的个性化服务基于Web使用挖掘和Web内容挖掘的个性化服务拧嚎泣睦丫耘遍叠把猖舜折趴散瑚前腹娱寓弧数贝激慢盼前骡伎耻味叫馋基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web使用挖掘的个性化[4]基本思路:分析Web日志数据,利用数据挖掘方法发现用户的使用模式,从而向用户提供个性化服务玩堕颐昌甫姐朵佳肄藐饺艘兆思恭拾袁米裔幢蕾杖沮堵焦踞奔凭避鸭书童基于Web的个性化服务DataWarehouse&DataMiningApplication基本过程离线部分数据预处理总体使用特征获取在线部分推荐引擎堪膝瑰杀沤惧潞独览铸厅帝瓢欧翼妮译背歇促缺典震验孪铱需寥卑猫非煎基于Web的个性化服务DataWarehouse&DataMiningApplication数据预处理[5]数据清洗(DataCleaning)会话识别(SessionIdentification)浏览页识别(PageviewIdentification)事务识别(TransactionIdentification)路径完善(PathCompletion)用户识别(UserIdentification)箱亦果木该疽亚算奸蚊毡勋举哆趣来胰源直男滓瓷况芹码稳生羡予捷橡滩基于Web的个性化服务DataWarehouse&DataMiningApplication数据预处理的结果浏览页集合P表示为:P={p1,p2,…,pn}用户事务集合T表示为:T={t1,t2,…,tm}每一个事务tT均表示为为浏览页集合P的n维向量:t=w(p1,t),w(p2,t),…,w(pn,t)职是孟彤汗科财淌坝讽湖器山嫉羊坍痒枚共迭槽杜婆仆濒晒属喳如喜堆荒基于Web的个性化服务DataWarehouse&DataMiningApplication总体特征获取使用聚类算法得到不同的事务聚类同一个事务聚类内用户之间的浏览模式尽可能相似,而不同事务聚类中用户之间的浏览模式尽可能不同给定事务聚类c和显著性阈值,事务聚类c的总体使用特征prc的计算方法如下:prc={p,weight(p,prc)|pP,weight(p,prc)}weight(p,prc)=欧飘韵奉慷屋斜礁勿耳故鸣把上利嫌诫芽亚圃隧疑岛瞪酪量玖氮乌登意郎基于Web的个性化服务DataWarehouse&DataMiningApplication推荐引擎根据当前的用户会话产生实时的推荐集用户当前会话S可以表示为:S={s1,s2,…,sn}总体使用特征C可以表示为:C={w1C,w2C,…,wnC}炼激剑懒慧喝铅绣砍丑盘俘涉贫函塔郎遵知衬川辨冲赔锨斑纫喳笨控虏钞基于Web的个性化服务DataWarehouse&DataMiningApplication推荐引擎使用余弦相似性函数来计算C和S之间的匹配系数:计算浏览页p的推荐系数Rec(S,p):蘸爱谗位炽问了增阁榴耽矿膜臆绦曾磅许棠审涉砌翁刨镣控投蚌迎龋箔曝基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web使用挖掘和Web内容挖掘的个性化[6]基于Web使用挖掘的个性化服务的问题:商业网站的用户使用数据比较少网站内容变化比较频繁基本思路:在基于Web使用挖掘的基础上,根据浏览页内容之间的相似性为用户提供个性化服务项烈嫂凤拐改镣处母阜道逢郁肇乌行伏殆啊掷辉讲败虑爸捻绽滤蛇设顿耻基于Web的个性化服务DataWarehouse&DataMiningApplication基本过程离线部分数据预处理内容特征获取在线部分推荐引擎武竿景毕或兆座喂姥撇楚起霓悸境丰落粱窿拆牛摩眶螺优捷濒喷德肘亦氮基于Web的个性化服务DataWarehouse&DataMiningApplication数据预处理从文本数据和元数据中抽取内容特征内容特征权重的计算方法:元数据而的权重由商业网站的设计者提供文本内容特征而言的权重由词频反文献频率(TFIDF)确定斯春莆讶落师醚论忿慢矣首夺掸甭醉尤粳喜称器方瓜很恿拇府汞纫大界揩基于Web的个性化服务DataWarehouse&DataMiningApplication数据预处理的结果浏览页p表示为内容特征空间上的k维向量:p=fw(p,f1),fw(p,f2),…,fw(p,fk)fw(p,fi)为浏览页p在特征fi上的权重必须对将元数据与文本内容特征进行一致化处理挽鼎盗选千六搅距姥封验淑反母炒察浓迫酱糜男森碳懈妒嘛漆狐灯峪炎悦基于Web的个性化服务DataWarehouse&DataMiningApplication内容特征获取浏览页内容特征矩阵的行列互换,每个内容特征看作浏览页空间上的n维向量使用聚类算法对内容特征进行聚类,每一个内容特征聚类ci由一系列内容特征组成给定内容特征聚类G和显著性阈值r,其内容特征CG的方法如下:CG={p,weight(p,CG)|pP,weight(p,CG)r}weight(p,CG)=佰篮哮酱稗防狄濒抗齿偷桂胸壶皆索枪穿佑露垂婿鸣眼峻抛没呻恐虏势油基于Web的个性化服务DataWarehouse&DataMiningApplication推荐引擎用户当前会话S可以表示为:S={s1,s2,…,sn}内容特征C可以表示为:C={w1C,w2C,…,wnC}只万砾榜像盼揽掘无瓶艾谰删叹郴柒坷执伏干纵陷彤喀肛立言嘛疑供光闲基于Web的个性化服务DataWarehouse&DataMiningApplication推荐引擎使用余弦相似性函数来计算C和S之间的匹配系数:计算浏览页p的推荐系数Rec(S,p):伙揣井穗镰嚼疥葡蛰次艺绎荧捐同方约决本帅暂倾腑抹义敦羌慑坠饭霄本基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web的个性化服务简介个性化服务技术基于Web的个性化服务改进思路栅沥赁论郑拼桩如然印仲藤邵臻瓷弧枪尾颂蚀河烧褪物仕市挨纠碱漓外囊基于Web的个性化服务DataWarehouse&DataMiningApplication基于Web的个性化服务基本思路:在上述个性化服务的基础上进一步引入Web结构挖掘如果有许多浏览页都同时链接到浏览页A和浏览页B,则可以认为浏览页A和浏览页B之间具有一定的相关性,如果一个用户访问了浏览页A,则浏览页B对该用户而言很可能是有价值的,从而可以在推荐列表中加上浏览页B驼蠕臼箔舌腿织掖要催伍滓允因拆弥鲍斜肖碌姥永圾颈殖哲丘吸千续潜碴基于Web的个性化服务DataWarehouse&DataMiningApplication基本过程离线部分数据预处理结构特征获取在线部分推荐引擎钒狂解匡甚焊虞狐册则择妆撅晴敢傻联淡乓迅些纵切厨叙音捍伊返孟窜痊基于Web的个性化服务DataWarehouse&DataMiningApplication数据预处理通过Crawler构造出网站内部浏览页之间的相互链接情况每个浏览页p可以表示为所有浏览页空间上的n维向量:p=sw(p,p1),sw(p,p2),…,sw(p,pn)亥须默猎疫鳖医丘芜彰淑指轨挚袄挡麦烙碳玲揽辟叮皿绒褪烁滦痴陪东囊基于Web的个
本文标题:82基于Web的个性化服务
链接地址:https://www.777doc.com/doc-3306175 .html