网站运营谈搜索引擎原理,就像选妃和看人

罗建国 托比网 2015-09-14 10:26:09

搜索引擎大概经历了3个阶段的发展。

第一阶段,属于信息匮乏阶段,这一时期,整个网络上的网页数量级较少,这个时候的搜索引擎技术主要是解决信息的抓取。

第二阶段,属于信息爆发阶段,这一时期,整个网络的信息已经达到一定数量级,搜索引擎开始考虑信息的排序问题,同时,以获得排名为主要目的的SEO出现。

第三阶段,属于信息泛滥阶段,也就是现阶段,这一时期,搜索引擎考虑的是如何在浩瀚的网页中推荐用户喜欢的内容,并且避免垃圾内容出现在引擎上,同时,以提升用户体验的UEO出现。本文主要就是说明现阶段搜素引擎的工作原理。

记得看到过这么一段话:搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的优化,同时也会让用户受益。

搜索引擎的原理可以简单归纳为:收录、排序、展现

先来看看收录的原理,大概有以下几个阶段:

1、搜索引擎蜘蛛大军模拟人游走在浩瀚的网页海洋里。

这就是所谓的蜘蛛爬行,搜索引擎会派出蜘蛛大军模拟人的行为去光顾网络上的页面,即会回访已经光顾过的老页面,又按照既定规则光顾未曾见到过的新页面。这就好比皇帝选妃,大批太监派往全国挑选。

2、  蜘蛛所到之处处留情,按门按院安置在存储区。

对于符合规则所光顾的每一个页面,搜索引擎都会对该页面进行标记,并根据特殊方法将这些网页分类索引。这就好比对拟参加选妃的菇凉登记造册。

3、  经过特定考察决定是否合格-----放到检索区。

并不是所有爬行过,储存过的网页有机会被放出来供用户搜索,搜索引擎会有一系列的筛选和淘汰,只有通过的网页才放到检索区。这就好比登记造册的菇凉,条件比较好的,开始被送到京城,进入皇宫了。

4、蜘蛛是“人”,会对网页分成3、6、9等----权重排序

   检索区同样也有海量的网页,那怎么决定这些网页的展现顺序呢?搜索引擎会根据一定的排序规则和复杂的算法确定顺序。这就好比,参加选妃的菇凉根据颜值、实力、关系等有的被封为贵人、常在、美人、答应等。

谈到排序,我们就来看看排序的原理。

首先来看看搜索引擎的几个特点:

1、代表用户:凡事用户喜欢的网页它就喜欢、用户越喜欢它越推荐。也就是说搜索引擎是站在用户角度去对待一个网页的。

2、为了自己:作为平台,它也需要用内容留住用户,它需要好内容。搜索引擎本身也是一个平台,本身也要参与市场竞争,因此从自身用户体验出发,他会根据平台需要去推荐优质内容。

3、自我推荐:搜索引擎相信自己,推荐自己信任的内容。所以平台自己产生的内容,如问答,文库,百科等拥有较好的排序,这很正常。

4、推广排名与自然排名是没有关系的,也就是不用担心不花钱推广会被K站,屏蔽等,在百度,这种情况基本上不存在,但排名规则是在不断变化,也是搜索引擎有权设定的。

5、怕麻烦:如果网页藏得太深,网址太长它就会放弃。内容太多他实在太累。

6、怕迷路:如果网页没有来回指向,他不敢去抓。任务太多它要效率。

7…

排序有着复杂的算法,但最主要就是看网页软实力:打铁还需自身硬,

1、网页资质:首页>中间页(一级>二级>三级)>内页;

这个比较好理解,这就好比一颗树,首页是树身,中间页(栏目页,列表页等)是枝干,内页(详情页,最终页)是树叶。所承载的份量自然是树身大于枝干大于树叶了。要避免中间页导航太多。最好就是首页、列表、详情页。

2、网页出生:大站名站>一般站点(主站权重)

这个也很重要,同样的内容,放在大站名站排名肯定会更好,因为大站更得搜索引擎信耐。这就好比拼爹。

3、网页内容:优质原创>原创>转载改编>采集整理>垃圾

这个也好理解,内容为王。这就是拼实力,拼颜值。这里特别把转载和采集也写上,不过注意,写的是转载改编和采集整理。

4、网页url:一级网址>二级网址>(一级文件夹>二级文件夹)>文件>多层级>

Url是网页的物理地址,就是看看你放在哪个文件夹下,不要藏得太深让搜索引擎一层层去扒。举个例子,对与一个重要的专题页面,分别给予以下网址:

http://aaa.com/ 

http://bbs.zhanzhang.aaa.com/

http://bbs.zhanzhang.aaa.com/zhuanti

http://bbs.zhanzhang.aaa.com/a/b/c/d/e/2015/zhuanti

排名是很明显的

5、内容更新:内容越新越有价值

这是时效性的问题,过期的东西可能价值会不那么大。

6、网页关系:友情链接、外链数量

这就是拼关系,人缘好,朋友多的,自然会受到更多的推崇。因为搜索引擎是“人”嘛,离不开社会。

7、网页粉丝:浏览量、转载分享数量

这就是拼影响力,关注和推荐你的人多,说明你更有影响力,更值得推荐。搜索引擎需要借助你的影响力。

8、内容相关性:关键词密度,5%左右。

关键词密度是相对固定的一个算法,太少,说明内容和搜索词相关性不大,排不上去,当然太多也不可能,除非是你故意堆砌。这个时代,不欢迎黑帽。

9、网页定位:网页自己推什么?关键词是什么

这也就是说,美个页面你想推荐什么词,一定要在Keywords标签里写上。这是公认的规则,搜索引擎会考虑这个。

10、网页自身推荐程度:标题、关键词、内容

如果一个词你觉得重要,那你应该在mate的标题、关键词、描述和正文里都要推荐。就比如你想让人觉得你帅,你就得先帅起来,这就是,自信很重要。

总之,搜索引擎排序的算法估计还有很多,但是万变不离其踪,大家只要把内容做好,把基本的规则掌握好,主动配合搜索引擎的变化,相信会有回报的。


长按二维码关注我们