抛开内容,只谈收录的话,其实就是爬取的问题。
1,,首先是区分出你的所有页面中收录和未收录部分。页面较少的话直接用脚本可以实行,较多只能用抽查的方式。
2,然后将得出的未收录页面集合与你的一个月内(这个时间按内页的快照更新周期比较合适)蜘蛛爬取记录相对比,然后得出一个未收录未爬取页面集合和未收录已爬取页面集合。
3,给未收录未爬取页面集合,在网站内提供可爬取的入口。
4,未收录已爬取页面,那从内容方面下功夫。
同理,在已收录方面也可以这样操作,统计已收录的抓取次数,相应使用nofollow。
另外也可以分析一下竞争网站的页面特点,再从自己网站的内容下功夫,让页面里面有其他对手没有的东西,例如人家内容页只有相关文章推荐,那你就可以另辟蹊径,聚合一下相关频道的内容,例如问答,论坛帖子,百科知识等,当然这个得建立在你网站内容够丰富的情况下。