您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 京东商城POP商品搜索原理
搜索组部门经理王文wangwenfeng@360buy.com探讨QQ群:288689084京东搜索分享1、京东搜索原理和结构2、京东搜索相关性及排序3、京东搜索功能简介4、京东搜索后台录入5、京东搜索评测规范、搜索词及搜索问题提交内容简介1.爬虫和抓取搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。2.索引蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库。3.搜索词处理在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文分词处理,判断是否需要整合类目属性信息,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。4.排序对搜索词处理后,搜索引擎程序从索引数据库中找出所有包含搜索词的商品,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。搜索引擎原理搜索引擎结构文档文本提取索引程序索引库(Lucene)搜索查询服务器(Solr)文件数据库爬虫NBA搜索1、搜索相关性2、搜索排序3、搜索框下拉词表4、搜索类目筛选5、搜索属性筛选6、相关搜索及纠错7、分类导航搜索主要功能1、仅标题部分、广告词、类目建索引、用户搜索到的商品需在标题中出现2、按字切词、索引,保证查全率3、精确匹配与模糊匹配4、相关性权重涉及因素:词频、词间距、是否有广告词5、标题中应含有品牌、型号、类别、关键属性、功能、别称等6、搜索词与类目关系:商品相关性与商品分类、用户点击有关7、业务原则和用户搜索原则;例如:用户搜索:“篮球”搜索相关性原理1、相关性排序计算:标题、类目、属性、销量、评论数、价格等因素的综合2、交易性排序计算:销量、价格3、评论数排序计算:好评度、评论数计算4、时效性排序计算:上架时间5、综合各种相关性与商品的商业属性综合算出的排序分值。搜索排序原理1、销量排序:七日销量,价格权重,好评度2、价格排序:按照商品的价格进行高低排序3、好评度排序:好评度、全部评论数综合因素4、商品上架时间:按照商品上架时间排列搜索排序筛选搜索下拉框提示:数据来源:用户搜索词,搜索日志排序:按照相关性进行排序更新日期:每月更新,采销可提供词表搜索框下拉提示1、展示二级类目2、点击进入三级类目,同时在二级类目下搜索3、按照类目数量排序4、进入三级类目进行属性筛选搜索类目筛选1、当用户输入三级类目词时,直接展示属性筛选页。如:用户输入“硬盘”,直接出现属性筛选结果页进行筛选。2、当用户输入其他词时,直接展示类目筛选页,用户点击具体类目进入该产品属性进行筛选。如:用户输入“诺基亚”,直接展示所有类目,用户点手机类目,则直接进入该类目下手机的产品属性进行筛选。3、用户搜“诺基亚”→→点击“手机”类目,→→进入属性筛选页→→进行属性筛选搜索类目筛选1、属性设置为重点属性,关键属性,用户常用属性2、点击具体类目进行筛选3、扩展属性在后台类目的使用,扩展属性中三级类目中排序号的顺序设置为正确排序4、=童装&cid=3962搜索属性筛选1、后台扩展属性设置中排序2、品牌属性中属性排序的设置扩展属性后台相关搜索及纠错数据来源:用户搜索词,搜索日志排序:按照相关性、搜索量进行排序,同时也有智能化推荐更新日期:每月更新相关搜索及纠错数据来源:用户搜索词,搜索日志排序:拼音纠错、错别字纠错更新日期:每月更新、采销可以提供各自纠错词搜索纠错1、搜索结果不好搜索词及搜索案例2、同义词及映射词3、纠错词4、新词添加搜索词和搜索反馈的提供Q&A
本文标题:京东商城POP商品搜索原理
链接地址:https://www.777doc.com/doc-3879262 .html