搜索引擎基本工作原理是什么

时间：2020-01-24 08:05:47 栏目：百科资讯

【导读】：文章目录一、爬行和抓取阶段二、索引阶段搜索引擎的工作原理，在我们的SEO工作中经常会被提及，简单来说，主要是四个步骤，爬

文章目录

搜索引擎的工作原理，在我们的SEO工作中经常会被提及，简单来说，主要是四个步骤，爬行和抓取，索引，排名。排名这一块设计算法问题，暂且不去深究，这里主要说说爬行和抓取以及预处理两个方面。

一、爬行和抓取阶段
通过蜘蛛程序，各搜索引擎在访问网站时都会先去查看网站根目录下的robots.txt文件，从而获取网站中被禁止爬取网址的信息。对于被禁止抓取部分的网址，不会被搜索引擎收录，但是需要注意的一个现象是，百度目前会对部分将百度蜘蛛屏幕的网站以下列类似淘宝网的形式显示，据个人不完全观察发现，这种现象正逐渐变的普遍起来。M8
获取更多的信息，蜘蛛会通过跟踪页面上的链接来抓取页面。从理论上来说，蜘蛛可以通过链接抓取整个互联网上的信息，但是在实际操作中，考虑到页面的复杂程度，蜘蛛会采取深度抓取和广度抓取两种方式来进行页面抓取的工作。为了避免重复爬行和抓取，搜索引擎会建立包括已发现但未被抓取以及已被抓取的两个网页地址库进行参考对比，而被抓取的页面会进入原始的页面数据库。到此为止，原始数据库的建立就告一段落了。

标签：

1、本文系转载，版权归原作者所有，旨在传递信息，不代表看本站的观点和立场。

2、本站仅提供信息发布平台，不承担相关法律责任。

3、若侵犯您的版权或隐私，请联系本站管理员删除。

4、、本文由会员转载自互联网，如果您是文章原创作者，请联系本站注明您的版权信息。