您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 广东理工职业学院教案 课程 - 南海广播电视大学
1广东理工职业学院教学方案系(部)工商学部教师黄微课程名称搜索引擎优化实训课程代码29000153学分2学时36编制日期:2017-2-25授课班级1:电子商务专业15级3班(根据实际班级数增减)课程性质公共必修课()公共选修课()专业必修课(√)专业选修课()课程类型理论课()理论+实践课()实践课(√)考核方式考试()考查(√)教材名称(包括出版信息)网站运营直通车-7天精通SEO,吴伟定,北京:清华大学出版社,2012课程单元课程单元名称课时(实训)授课地点单元1基础篇6实训室单元2站内篇8实训室单元3站外篇4实训室单元4高级篇4实训室单元5策略篇6实训室单元6专题篇4实训室单元7综合实践4校内或校外课程单元可根据项目、情境设计,也可根据教材篇章组织,可以是一节自然课时,也可以是若干自然课时。2单元1基础篇参考学时:6教学目标熟悉各大搜索引擎,掌握搜索引擎指令教学内容1.1什么是seoSEO是英文SearchEngineOptimization的缩写,中文翻译为“搜索引擎优化”。简单地说,SEO就是从搜索引擎上获得流量的技术。搜索引擎优化的主要工作包括:通过详细了解搜索引擎的工作原理、如何在浩瀚的网页流中爬取网页、如何进行索引以及如何确定某一关键词排名位置从而对网页内容进行科学的优化,使其符合用户浏览习惯,在不损害用户体验的情况下提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。1.2seo的作用SEO在今天看来已是一个非常热门的行业,尤其是电子商务的兴起,对SEO的需求也越来越大。每个经营性网站需要大流量的支撑才有转化的可能,搜索流量显得异常重要。SEO的作用主要有以下几个分类。(1)通过搜索引擎引来足够的流量,进一步扩大品牌的知名度,使其得到小投入大回报。如中国移动、国美电器等。(2)力图让搜索引擎给网站带来大的流量,以使网站的业绩指标攀升,吸引投资者或者收购等。(3)吸引在搜索引擎上搜索某一需求的精准客户,使他们了解并购买搜索的目标产品。如网店、销售型企业网站等。(4)依靠搜索引擎流量,换取广告商的青睐使其投放一定程度的广告。如百度联盟。(5)希望获得来自搜索引擎的大流量,向浏览者推介某一产品,而不是当场购买。如生产型品牌企业网站、交友网站、会员模式站点等。1.3常用搜索引擎简介1.3.1百度百度(),全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村,它的Logo如图1-1所示。从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,10年来,公司秉承“以用户为导向”的理念,始终坚持如一地响应广大网民的需求,不断地为网民提供基于搜索引擎的各种产品,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,MP3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过70%。3图1-1百度网站的Logo百度的中文搜索优势如下:(1)百度中文数据库不仅最全,也是质量最好的。(2)全球第一的数据挖掘、分布式索引和检索技术与处理速度,以及大规模的工业级系统的开发,支持百度以最快的速度呈现搜索目标内容相关的一切。(3)百度首页不到4K,最干净、最简洁的页面,随区域合理密布的多组服务器机群,架构于强大的网通及电信的骨干网上,可以在瞬间呈现搜索结果。(4)百度拥有全球第一的网页分析技术、世界上独一无二的“中文分词”技术及全球最完善的反垃圾网页技术与流程,因此,百度对搜索结果的显示最为准确。百度在中国的地位已经举足轻重,尤其是谷歌退出之后,百度在中文搜索市场更占据领导地位。很多小站长也靠百度过活,比如做淘宝客、做产品等。在中国要做SEO优化首先要研究的就是百度。1.3.2GoogleGoogle的使命是整合全球信息,使人人皆可访问并从中受益。他拥有全世界最先进的搜索技术。虽然Google已经退出中国大陆市场,但它还是学习SEO的好对象,推荐大家多去关注谷歌的站长管理员指南,所谓“知己知彼,百战不殆”。以下网址可以获知很多的SEO入门材料。图1-2Google网站的Logo1.3.3搜搜SOSO是腾讯QQ旗下重点发力的搜索引擎,现在整合了QQ客户端,给SOSO加上了强大有力的助推器。现有很多营销人士已开始对SOSO进行布局,您还等什么。从SOSO实验室的网址:可以了解更多与SOSO相关的知识,网站Logo如图1-3所示。图1-3搜搜网站的Logo1.3.4搜狗搜狗是搜狐旗下的搜索引擎,现为淘宝合作项目,如果您是从事电子商务行业的,完全可以在这里开拓市场,网站Logo如图1-4所示。4搜狗拼音是搜狐于2006年推出的一款汉字拼音输入法。凭着易用、灵活、全面等特点,再加上推广得当很快就在网络上蔓延开来。搜狗输入法最显著的特点是基于搜狗搜索引擎,很多在搜狗搜索引擎中所查询的热门关键词会同步到搜狗输入法当中,如图1-5所示。图1-4搜狗网站的Logo图1-5搜狗拼音输入法自动更新搜狗输入法有一个自己特有的搜狗细胞词库,里面有网友自己创建的关键词,基本上都是日常所用到的,还有很多是最新最热门的关键词。词库的首页还有一个热词指数,对SEO人员很有参考价值。搜狗与搜狗拼音整合之后最大的好处就是方便SEO人员查询当下热门关键词,以备工作之需。搜狗拼音细胞库网址为:。1.4搜索引擎工作原理1.4.1爬行抓取爬行抓取是搜索引擎工作最重要的一步,把所有需要抓取的地方抓取回来处理分析,因此如果在抓取这部分出了错,后面完全就瘫痪了。回想一下每当我们用搜索引擎输入关键词后,会出现许许多多所查询的关键词信息,这个过程是以秒来计算的。这时我们可以想一想,搜索引擎是在1秒钟之内把所查询的关键词从广大的互联网中逐一抓取一遍,还是事先已经处理好了这部分数据呢。平时我们上网的时候随便打开一个网页的时间也是在1秒钟之内,这仅仅是打开一个网页的时间,所以搜索引擎在以秒计算的情况下是不可能把互联网上的信息都查询一遍,这不仅耗时也耗钱。因此现在的搜索引擎是事先已经处理好了所抓取的网页。搜集工作也是要按照一定的规律来进行的,基本上有如下两种特征。一、批量收集:对互联网上只要是存在链接的网页都收集一遍,耗时在几周左右。缺点在于增加了额外的带宽消耗,时效性也不高。二、增量收集:是批量收集的一个技术升级,完美的弥补了批量收集的缺点。在原有的基础上搜集新增加的网页,变更上次收集之后有改变的页面,删除收集重复和不存在的网页。还有一种比较简单的方法让搜索引擎来爬行,自己主动向搜索引擎提交网5站,等到一定的时间就会来爬取。不过现在主动提交后再来爬行的速度越来越慢了,最理想的办法还是顺着自然链接来收集比较好。这就需要我们在前期做好蜘蛛爬行的入口,一定要找一个和网站自身相关的入口。下面将详细介绍搜索引擎蜘蛛的情况。1.各搜索引擎蜘蛛介绍搜索引擎蜘蛛是搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在搜索引擎中搜索到您网站的网页、图片、视频等内容。一般用法为“spider+URL”,后面的URL(网址)是搜索引擎的痕迹,如果要查看某搜索引擎是否来爬取过你们的网站,可查看服务器的日志里是否有该URL,同时还能查看来的时间、频率等……(1)百度蜘蛛:可以根据服务器的负载能力调节访问密度,大大降低服务器的服务压力。根据以往的经验百度蜘蛛通常会过度重复地抓取同样的页面,导致其他页面无法被抓取到而不能被收录。这种情况可以采取robots协议的方法来调节。百度蜘蛛的用法如下:Baiduspider+(+)(2)谷歌蜘蛛:谷歌蜘蛛属于比较活跃的网站扫描工具,其间隔28天左右就派出“蜘蛛”检索有更新或者有修改的网页。与百度蜘蛛最大的不同点是谷歌蜘蛛的爬取深度要比百度蜘蛛多一些。其用法如下:Mozilla/5.0(compatible;Googlebot/2.1;+)(3)雅虎中国蜘蛛:如果某个网站在谷歌网站下没有很好的收录,在雅虎下也不会有很好的收录和爬行。雅虎蜘蛛的数量庞大,但平均的效率不是很高,相应的搜索结果质量不高,其用法如下:Mozilla/5.0(compatible;Yahoo!SLurpChina;)(4)雅虎英文蜘蛛:雅虎英文蜘蛛的用法与中文蜘蛛不同,其用法如下:Mozilla/5.0(compatible;Yahoo!SLurp/3.0;)(5)微软必应蜘蛛:必应与雅虎有着深度的合作关系,所以基本运行模式和雅虎蜘蛛差不多,其用法如下:msnbot/1.1(+)(6)搜狗蜘蛛:搜狗蜘蛛的爬取速度比较快,抓取的数量比起速度来说稍微少点。搜狗蜘蛛最大的特点是不抓取robot.text文件,其用法如下:Sogou+web+robot+(+(7)搜搜蜘蛛:搜搜早期是运用谷歌的搜索技术,谷歌有收录,搜搜肯定也会收录。2011年搜搜已经宣布采用自己的独立搜索技术,但搜搜蜘蛛的特性和谷歌蜘蛛的特点还是有着相似的地方,其用法如下:Sosospider+(+)(8)有道蜘蛛:和其他搜索引擎蜘蛛一样,凡是高权重网站的链接一般都能将其收录。爬行原理也是通过链接之间的爬行,其用法如下:Mozilla/5.0(compatible;YodaoBot/1.0;)62.链接布局蜘蛛主要通过爬取页面上的链接来发现新的页面,以此类推不停地十字交叉爬行下去便形成一张蜘蛛网。爬行主要按两种策略来执行:一是深度优先爬行,二是广度优先爬行。三、深度优先爬行:如图1-6所示,蜘蛛从A网页顺序到A1、A2、A3、A4,爬行到A4页面之后发现没有页面了,于是又重新返回到了A页面,以此类推爬行到B1、B2、B3、B4页面。深度爬行的主要特点是蜘蛛会一直沿着一条线抓取下去,直到最后,然后再返回到另一条线。图1-6深度优先爬行示意图四、广度优先爬行:指蜘蛛在一个页面上发现多个连接的情况下,首先要做的是把所有第一层的链接抓取一遍,然后再沿着第二层的链接向第三层链接爬行,如图1-7所示。归根到底,只要给蜘蛛足够的时间,无论是广度爬行还是深度爬行都能爬完整个网站。我们做SEO优化就要给蜘蛛节省宽带和资源,毕竟蜘蛛的资源不是无限的,也有满负载的时候,我们所要做的工作就是为蜘蛛指明一条正确的道路,尽量减少蜘蛛的工作。图1-7广度优先爬行示意图73.避免网页重复收集重复收集,从表面意思可以理解为第一次已经收集过之后,又进行了第二次的收集。效率不但没有提高反而增加了带宽的额外开销。对于搜索引擎而言重复做事情相当地消耗资源,也就做不到时效性地更新,而且有可能降低秒级的输出服务。造成重复收集的原因在于蜘蛛并没有记录访问过的页面的url,另一方面还有可能在于一个页面有多个域名指向所导致。因此搜索引擎在这方面增加了一个额外的技术,分别定义两个不同类型的表,即“已访问表”和“未访问表”,依靠这个技术就很简单地解决了重复收集的难题。蜘蛛抓取到一个链接之后,从这两个表中判断这个链接是否已经被访问过,如果没有访问过,抓取回来添加到未访问表中去。如图1-8所示,蜘蛛从开始
本文标题:广东理工职业学院教案 课程 - 南海广播电视大学
链接地址:https://www.777doc.com/doc-3587071 .html