您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 游戏推荐系统项目计划报告
游戏推荐系统项目计划报告小组成员:邓鹏鹏郭文嘉蔡竹华刘强项目动机:目前游戏种类众多,游戏玩家面对此现状,往往难于选择。故亟需一种这样的系统:能根据玩家的一些简单输入,返回玩家可能喜欢的游戏列表。项目目标及意义:本系统搜集游戏网站上的信息,并通过信息检索,提取,分类等技术形成一个数据库,为用户的查询返回合适的结果。我们最后期望达到的效果是用户输入一系列游戏的关键词,系统会根据查询作相似度计算,返回用户可能喜欢的游戏列表。这是一个很有趣并且有一定实际意义的系统,通过本系统的实现,我们希望可以深入的了解和体会搜索引擎的各方面知识,并且学以致用,在实践中锻炼自己。基本技术路线;系统主要由三大模块组成:1.网页抓取模块Crawler实现功能:把网站入口地址以string形式传给Crawler,返回网站的html文档。该模块采取多线程异步和异步IO实现。2.文本提取模块IE实现功能:将Crawler返回的html文档作为输入,经相应的词法和语法分析和分词处理,过滤掉注释,提取出需要的属性。技术难点:因为不同的html页面有不同的组织结构,不能用统一的wrapper去处理,并且对于游戏属性等关键字的提取涉及到自然语言处理。3.文档分类模块:对游戏的厂商,类别,系列,发布时间等属性赋予一定的权重,根据用户所查询的游戏名称,系统列出用户可能最喜欢的几种游戏。模块结构如下:项目进度:11.20-12.1:需求分析,系统架构;12.1-12.10:系统开发编码,实现原形系统;12.5-12.20:系统测试并改进系统。项目分工:1.刘强负责网页抓取模块Crawler2.蔡竹华负责文本提取模块3.郭文嘉和邓鹏鹏负责文档分类模块,处理查询和评价系统模块.提交查询数据本地存储专业游戏网站文本提取模块查询处理,游戏相关性Crawler线程管理线程线程线程…查询结果
本文标题:游戏推荐系统项目计划报告
链接地址:https://www.777doc.com/doc-779541 .html