搜索引擎大概经历了3个阶段的发展。
第一阶段,属于信息匮乏阶段,这一时期,整个网络上的网页数量级较少,这个时候的搜索引擎技术主要是解决信息的抓取。
第二阶段,属于信息爆发阶段,这一时期,整个网络的信息已经达到一定数量级,搜索引擎开始考虑信息的排序问题,同时,以获得排名为主要目的的SEO出现。
第三阶段,属于信息泛滥阶段,也就是现阶段,这一时期,搜索引擎考虑的是如何在浩瀚的网页中推荐用户喜欢的内容,并且避免垃圾内容出现在引擎上,同时,以提升用户体验的UEO出现。本文主要就是说明现阶段搜素引擎的工作原理。
记得看到过这么一段话:搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的优化,同时也会让用户受益。
搜索引擎的原理可以简单归纳为:收录、排序、展现
先来看看收录的原理,大概有以下几个阶段:
1、搜索引擎蜘蛛大军模拟人游走在浩瀚的网页海洋里。
这就是所谓的蜘蛛爬行,搜索引擎会派出蜘蛛大军模拟人的行为去光顾网络上的页面,即会回访已经光顾过的老页面,又按照既定规则光顾未曾见到过的新页面。这就好比皇帝选妃,大批太监派往全国挑选。
2、 蜘蛛所到之处处留情,按门按院安置在存储区。
对于符合规则所光顾的每一个页面,搜索引擎都会对该页面进行标记,并根据特殊方法将这些网页分类索引。这就好比对拟参加选妃的菇凉登记造册。
3、 经过特定考察决定是否合格-----放到检索区。
并不是所有爬行过,储存过的网页有机会被放出来供用户搜索,搜索引擎会有一系列的筛选和淘汰,只有通过的网页才放到检索区。这就好比登记造册的菇凉,条件比较好的,开始被送到京城,进入皇宫了。
4、蜘蛛是“人”,会对网页分成3、6、9等----权重排序
检索区同样也有海量的网页,那怎么决定这些网页的展现顺序呢?搜索引擎会根据一定的排序规则和复杂的算法确定顺序。这就好比,参加选妃的菇凉根据颜值、实力、关系等有的被封为贵人、常在、美人、答应等。
谈到排序,我们就来看看排序的原理。
首先来看看搜索引擎的几个特点:
1、代表用户:凡事用户喜欢的网页它就喜欢、用户越喜欢它越推荐。也就是说搜索引擎是站在用户角度去对待一个网页的。
2、为了自己:作为平台,它也需要用内容留住用户,它需要好内容。搜索引擎本身也是一个平台,本身也要参与市场竞争,因此从自身用户体验出发,他会根据平台需要去推荐优质内容。
3、自我推荐:搜索引擎相信自己,推荐自己信任的内容。所以平台自己产生的内容,如问答,文库,百科等拥有较好的排序,这很正常。
4、推广排名与自然排名是没有关系的,也就是不用担心不花钱推广会被K站,屏蔽等,在百度,这种情况基本上不存在,但排名规则是在不断变化,也是搜索引擎有权设定的。
5、怕麻烦:如果网页藏得太深,网址太长它就会放弃。内容太多他实在太累。
6、怕迷路:如果网页没有来回指向,他不敢去抓。任务太多它要效率。
7…
排序有着复杂的算法,但最主要就是看网页软实力:打铁还需自身硬,
1、网页资质:首页>中间页(一级>二级>三级)>内页;
这个比较好理解,这就好比一颗树,首页是树身,中间页(栏目页,列表页等)是枝干,内页(详情页,最终页)是树叶。所承载的份量自然是树身大于枝干大于树叶了。要避免中间页导航太多。最好就是首页、列表、详情页。
2、网页出生:大站名站>一般站点(主站权重)
这个也很重要,同样的内容,放在大站名站排名肯定会更好,因为大站更得搜索引擎信耐。这就好比拼爹。
3、网页内容:优质原创>原创>转载改编>采集整理>垃圾
这个也好理解,内容为王。这就是拼实力,拼颜值。这里特别把转载和采集也写上,不过注意,写的是转载改编和采集整理。
4、网页url:一级网址>二级网址>(一级文件夹>二级文件夹)>文件>多层级>
Url是网页的物理地址,就是看看你放在哪个文件夹下,不要藏得太深让搜索引擎一层层去扒。举个例子,对与一个重要的专题页面,分别给予以下网址:
http://aaa.com/
http://bbs.zhanzhang.aaa.com/
http://bbs.zhanzhang.aaa.com/zhuanti
http://bbs.zhanzhang.aaa.com/a/b/c/d/e/2015/zhuanti
排名是很明显的
5、内容更新:内容越新越有价值
这是时效性的问题,过期的东西可能价值会不那么大。
6、网页关系:友情链接、外链数量
这就是拼关系,人缘好,朋友多的,自然会受到更多的推崇。因为搜索引擎是“人”嘛,离不开社会。
7、网页粉丝:浏览量、转载分享数量
这就是拼影响力,关注和推荐你的人多,说明你更有影响力,更值得推荐。搜索引擎需要借助你的影响力。
8、内容相关性:关键词密度,5%左右。
关键词密度是相对固定的一个算法,太少,说明内容和搜索词相关性不大,排不上去,当然太多也不可能,除非是你故意堆砌。这个时代,不欢迎黑帽。
9、网页定位:网页自己推什么?关键词是什么
这也就是说,美个页面你想推荐什么词,一定要在Keywords标签里写上。这是公认的规则,搜索引擎会考虑这个。
10、网页自身推荐程度:标题、关键词、内容
如果一个词你觉得重要,那你应该在mate的标题、关键词、描述和正文里都要推荐。就比如你想让人觉得你帅,你就得先帅起来,这就是,自信很重要。
总之,搜索引擎排序的算法估计还有很多,但是万变不离其踪,大家只要把内容做好,把基本的规则掌握好,主动配合搜索引擎的变化,相信会有回报的。