我的SEO博客首页,昨天下午又更新快照了,最新为2013-10-10,感觉还不错,虽然内页的收录还没开始,这个还没开始是指在百度搜索引擎上还没有看到网站内页的展示,但实际上有没有被收录还不一定,为什么这么说呢?你是不是认为通过site语法查询,没有看见页面被收录,该页面就是没有被百度收录(以百度为例),那这个页面是不是就真的没有收录呢?你看到的网页快照时间是不是就是开始展示的时间额?比如快照时间是2013-10-7,是不是7号那天你就能查到这个页面被收录了呢,答案是否定的,一般都是7号之后,你才能发现你的网站是7号被抓取保存的快照。要搞清楚网页快照与实际网页内容存在时间差,首先你要了解搜索引擎的工作原理,知道蜘蛛究竟是怎么在工作的,就能彻底揭开你心中的几个困惑了,比如网页快照时间为什么总是滞后于展现时间,上面提到的7号之后才能看到7号的快照?又比如,为什么网站之前的收录一直都是10几个页面,突然间一天暴增到几十上百的收录,这时候你难免会惊慌,这样的收录变化属于正常现象吗?搜索引擎的工作原理,可以分为4个阶段,第一个是抓取,蜘蛛爬行到你的网站页面,对页面进行抓取,将网页内容下载到网页数据库,如果你的网站存在一些死链,那么蜘蛛将无法顺利完成该页面的抓取;第二个阶段是过滤,搜索引擎会通过算法对蜘蛛采集回来的内容进行过滤,去重,删除一些低质量的网页内容,经过筛选的网页内容,才能顺利进入到下一阶段;第三个阶段是建立索引,对于这些筛选合格的页面内容进行分词建立索引,什么是分词呢?简单说就是划分句子,比如“深圳SEO技术博客普及SEO基础知识”,就会划分为深圳SEO、技术博客、普及等等的组合;第四阶段是输出结果,这个输出结果就是百度结合算法,匹配用户的搜索结果展现出网页内容。这四个阶段是层级关系,所以上面提到的2013-10-7就是搜索引擎索引建立的时间,具体你什么时候看到,那是百度让它展现出来的那个时间点,所以很多时候,你突然间发现网站收录增加了不少,你查看快照时间,都是早于你现在查看时间的,我的SEO博客10号的快照,10号当天就能看到,这当然是和百度建立了一定信任度有关系的,不然我这平时的优化可就做无用功了;你发现你网站的快照不更新,很多情况下都是在搜索引擎过滤低质量页面或者重复页面的时候过滤掉了,这时候你就应该考虑检查你的页面质量和更新内容了。 本文属深圳seo首发: http://www.xinxing327.com原创不易,转载请注明出处
百度搜索结果中显示站点LOGO技巧视频教程
又一部“像素大战”来袭,索尼对Emoji电影不死心 - emoji,表情,索尼电影
微信群内辱骂他人,被判侵犯名誉权赔偿千元 - 微信,朋友圈
AlphaGo们的邪恶用途:日本象棋选手被控请AI作弊 - alphago,人工智能,AI
马云又给你钱用,蚂蚁花呗双11最高可提额5.5万元
seo如何分析数据
38岁全球最年长圈养大熊猫在香港安乐死离世 - 大熊猫
SEO技巧:谈谈通过刷百度指数提升网站权重的技巧,百度指数怎么刷
深度解析百度蜘蛛3.0发布后SEO的操作技巧
SEO方案:实战分析企业网站优化建议书
SEO的春天了吗?与新媒体结合
SEO教程:最新网站TDK的写法技巧
网站底部你不可忽略的seo优化死角
SEO优化时妙不可言的图片属性
浅谈网站怎么实现百度秒收录
网站图片SEO优化的细节包括哪些?
深圳SEO:老域名正反面优化排名分析
SEO:站内站外形成链轮的深度分析
深圳SEO:上海森亿百度负面相关处理
深圳SEO:小星星SEO介绍
SEO优化:今天阐述一下老域名做排名的优势
深圳seo今天来阐述一下镜像网站对排名的影响
深圳SEO:做到以下5点网站不更新内容不发外链排名还是会稳定
深圳SEO:快速排名到底是真是假 ,今天小编就来发表一下自己观点