四步走加快分站收录

本站编辑 知乎 2014-08-08 14:10:34

抛开内容,只谈收录的话,其实就是爬取的问题。

1,,首先是区分出你的所有页面中收录和未收录部分。页面较少的话直接用脚本可以实行,较多只能用抽查的方式。

2,然后将得出的未收录页面集合与你的一个月内(这个时间按内页的快照更新周期比较合适)蜘蛛爬取记录相对比,然后得出一个未收录未爬取页面集合和未收录已爬取页面集合。

3,给未收录未爬取页面集合,在网站内提供可爬取的入口。

4,未收录已爬取页面,那从内容方面下功夫。

同理,在已收录方面也可以这样操作,统计已收录的抓取次数,相应使用nofollow。

另外也可以分析一下竞争网站的页面特点,再从自己网站的内容下功夫,让页面里面有其他对手没有的东西,例如人家内容页只有相关文章推荐,那你就可以另辟蹊径,聚合一下相关频道的内容,例如问答,论坛帖子,百科知识等,当然这个得建立在你网站内容够丰富的情况下。

长按二维码关注我们