探寻搜索引擎原理

2019-04-30 14:27:20

  我们先来做搜索引擎分析,看它是如何来收录网站和分析网站以及做关键词排名的。

  当你的站点被搜索引擎(SE)开始索引的时候,这个时候会有第一个检查程序,来检查你的站点作弊违规,如果有丢弃,如果没有继续进行下一步,先会开始边收入你的页面边并抓取网站页面主题,给你的页面划分类别和行业,在这个时候搜索引擎会有一个数据对比,就是先分析这个行业中的主题页面相关性,来跟你网站主题对比来给予网站权重评分,然后抓取你的页面相关关键词,根据上面的权重评比已经搜索指向你网页的关键词链接已经自然的最短路径相关性和网页的简易型等复杂评分来给予关键词排名。所以我们分析,百度主要是一个评分机制,根据抓取你网站数据来分析,分析的主要参考有一个机制,那就所在行业一系统的评估数据,评估数据是定时更新的,根据这个标准(算法)来给网站评分,来进行这个行业相关关键词排名。

  所以我认为并不是每一个行业的优化结构是一样的,连目录结构每一个行业都是不一样的设计标准,这个设计标准如何来评估,我认为是根据该行业对某个关键词的关注度(搜索人数),这个关键词就清晰的作为用户体验,因为这个关键词大家都习惯来搜索,那么如果你这个行业网站里面刚好有这样一个目录或者说频道,那么可以说你是符合用户体验的,相反如果你设定的几个目录名词和相关主题不是用户所喜欢的,那么就不是很符合网站人性化和用户体验。这样的网站当然也是不受欢迎的。

  这个时候当你的网页已经通过顺利通过检查程序,已经评估完毕,做好相应的关键词排名,那么搜索引擎就开始把你的网站从数据库里面解禁出来,你就被正式收录了,恭喜你!但是你要注意,不要高兴的太早,因为百度蜘蛛会定时的光顾的你的网站,其实除了更新外他还有一个目的,就是再次检查你是否有违规现象,这道程序有点负责,先抓取你的内容进入搜索引擎,而后进行对比,如果发现你属于SE规划范围内更新。那么就会通过,更新你的文章,如果发现你的网站在搜索引擎数据库原有页面里面的主题等各个方面有变动,就会重新审核和取消以前评分,但是如果你的网站在搜索引擎数据库里面已有的页面没有变动,只是正常更新的新的内容,那么他会根据你原先得到搜索引擎的评分已经你这个页面本身主题和页面的相关性已经指向链接等各方面标准来给予你这个页面的关键词排名(在这里引用一下相关性问题帖子里面的内容做一个补充)这就是为什么你做了和你网站主题不相关的内容能够在百度引擎上取得好排名的最好解释,当然这个前提是你这个网站在百度评分机制里面评分或者说权重较高,但是也请你不要忘记,百度在下一次更新的时候又会进行比对,如果发现你这个页面和你网站主题相关性很差或者没有相关性的话,那么你就会降低质量评分。

  当你再次更新你的网站时候发现你链接了一个因为作弊而降权的网站后,会给你网站一个相应的低的评分,而后根据评分来处理你的站点,当你的站点因为垃圾链接或者其他原因评分为0时,百度这个时候会丢弃你的网站但是会暂时(可能是一个月或者更久一点)保存你数据库的资料,当他在这个时期里再次扑捉到你网站的时候发现你并没有更改错误,那么SE会清除掉你数据库的资料,但是如果他检查到了你已经换了程序或者已经更改了错误,那么他又会根据它的评分机制给你一个评分,重新收录你的网站。

  写到这里的时候已经很晚了,但是我非常高兴,因为我把我对百度搜索引擎的理解献给了大家!希望能够给予大家更大的帮助,如果有不足或者错误的地方,请告诉我,我及时更改,如果你的看法和我不一样,也请你发帖到群空间,我们一起商量和讨论。一起共同学习。  新浪下载中心  网络设计方案  百度相关