当前位置:首页 > seo工具 / 正文
后台-系统设置-扩展变量-手机广告位-内容页头部广告位
作者:星星

SEO工具:百度蜘蛛是如何爬取网站内容的

星星 2年前(2017-01-11 14:34:02) seo工具

蜘蛛先去抓取百度白名单的网站或者一些信任度非常高的站点和页面(例如:一些高权重网站和网站的首页),在抓取这些网页的内容时发现一些指向另外一些一些页面的链接。蜘蛛会把这些链接保存在自己的数据库里面,然后再根据抓取顺序依次来抓取这些网页。

1、蜘蛛抓取网页的规则: 对于蜘蛛说网页权重越高、信用度越高抓取越频繁,例如网站的首页和内页。蜘蛛先抓取网站的首页,因为首页权重更高,并且大部分的链接都是指向首页。然后通过首页抓取网站的内页,并不是所有内页蜘蛛都会去抓取。 搜索引擎认为对于一般的中小型站点,3层足够承受所有的内容了,所以蜘蛛经常抓取的内容是前三层,而超过三层的内容蜘蛛认为那些内容并不重要,所以不经常爬取。

 2、如何看蜘蛛的抓取? 通过iis日志可以看蜘蛛爬取了哪些内容,iis日志有百度蜘蛛、谷歌蜘蛛等。从iis日志里卖弄分析得出蜘蛛的类型、抓取时间、抓取的页面、抓取内容的大小以及返回的页面代码,200代表抓取顺利。 详细了解IIS分析请点击:IIS日志分析方法

版权声明:本站原创文章,由深圳SEO小星星发表,如有转载请注明来源处。深圳SEO小星星博客www.xinxing327.com

标 签

试试用"←"或"→"方向键快速翻页把 (^o^)/

后台-系统设置-扩展变量-手机广告位-内容页头部广告位
留言与评论(共有 0 条评论)
   
验证码:
搜索
热门图片
最近更新

Powered By 小星星SEO博客

粤ICP备16041893号-1 seo技术交流群