什么是死链?如何处理死链?

百度站长平台 百度站长平台 2015-05-19 15:24:50

几乎所有网站都会出现不再需要展现的网页,如何处理这样的网页也成为站长经常谈论的话题。为此,百度站长学院专访了负责死链识别处理的工程师,了解到百度眼中的死链其实包括三种:协议死链、内容死链、跳转死链,每种都有门道哦,同时了解到目前比较流行的"个性化死链"对百度并不友好(后面会有详细介绍)。在此我们向各位站长呼吁,尽可能全面地通过百度站长平台死链提交工具提交协议死链、内容死链和跳转死链,网站在百度搜索引擎的可访性和价值得到提升,以获得更高的用户评价。

第一,协议死链:

协议死链是指通过HTTP协议状态码明确表示网页已无阅读价值。HTTP协议状态码很多,但百度协议死链首推404,即未找到文件。请尽量不要用其它状态码来代表死链。

第二,内容死链:

内容死链主要是由网站自身变化引起的,网页可以正常打开未发生跳转,但页面内容对爬虫来说没有收录价值,对用户来说也没有参考价值,如帖子被删除、内容已转移、空间被关闭、信息已过期、交易已关闭等。在这样无有价值信息的网页上,网站应该在明显位置直接给予提示文字,如:

>页面不存在(网页不存在)

>内容已转移

>帖子已删除

>域名过期或出售

>空间被关闭

>网站要备案

>信息已过期

>交易已关闭

在给各位站长看标准内容死链的典型范例之前,先说一个对百度不友好的做法:现在很多网站追求个性化和用户体验,在页面内容失效后并未做协议死链处理,也就是说返回状态码依然是200,仅仅是在页面上做了一个有趣的个性化图片,通过图片告诉用户这个页面没有有价值内容--百度不会认为这是一个内容死链,不提倡大家这样做。

典型范例1:

以下便是内容死链的典型范例,大家感受一下,需要着重强调的是:站长在申请取消闭站保护的时候,百度除了检测站内协议死链外,还会同时检查内容死链的比例和数量。即使您不使用闭站保护功能,百度也提倡大家踊跃提交内容死链,以保证站点评级的稳定。

典型范例2:

典型范例3:

典型范例4:

典型范例5:

典型范例6:

典型范例7:

典型范例:8:

第三,跳转死链

跳转死链是指网站将无阅读价值的页面统一跳转到某一个页面,如前一级目录面、首页等等,跳转前后的两个网页主体内容不同,不存在可替代的关系。除了404协议死链和内容死链外,站长还需要向百度提交跳转死链。

典型范例9:

典型范例10:

一般应该如何处理死链呢?

手动删除死链接 看病最重要的就是找到病根,这样才能对症下药,缩短病人患病的时间,网站建设也是这样,处理死链接的时候我们最好找到死链接自身所处的位置,然后在页面中手动删除,这样比较容易,但是一旦网站上线时间较长,域名使用很久的情况下,虽然我们也可以使用站长工具查出死链接存在的数量,但是删除就不是很容易了,会相当困难,所以我们在建设网站的时候一定要做好防范,杜绝一切死链接的存在,一旦发现,立即删除。

使用robots屏蔽可能的网页 同样以看医生为例,有时候我们会找不到病人的病因,如同网站的死链接,那么这个时候我们难道就不用处理网站死链接了?肯定不是,既然找不到网站的死链接,那么就扩大处理的范围,使用robots屏蔽可能的网页以及链接,编辑方法也很简单,只需要在语言中加入Disallow:死链接绝对网址这个语句就可以了,告诉蜘蛛这个网页无效,禁止抓去网站链接。然后把自己编辑好的语句上传到网站目录就可以了。 PS:但是这里面还存在一个问题,那就是如果网站自身经过改版造成大量死链接的存在,那么这种方法还有效用吗?经过笔者的亲身实践,发现如果网站改版后,内容以及网站结构层次上必然会有一个较大的变更,这时候单纯的使用robots语句对网站页面进行简单屏蔽的话效果并不是很明显,这时候我们需要利用301重定向,将各种网络请求直接转换到其他页面。

401错误页面提醒 如果你的网站上线时间较长,页面收录量是十万级的,使用301重定向方法就显得有些费时间,如果站长想减轻点负担,404错误页面或许是一个不错的选择,我们可以通过404错误页面将用户指引到我们想要他们访问的网站,跳转时间在8秒左右最宜,然后在页面中加入大家想要的网址提示,不过最好是用户自己点击,这样会降低自动跳转带来的用户反感度。但是404错误页面只是将在无法访问的情况下出现的提示,个人还是建议大家使用301重定向,将用户请求直接转换。

长按二维码关注我们