SEO实战:搜索引擎工作原理三个阶段简介

admin•2025-03-21 03:46:23•系统教程•阅读72

2024年5月16日发(作者：爱奇艺下载安装手机版)

网站制作

SEO实战：搜索引擎工作原理三个阶段简介

搜索引擎工作过程非常复杂，接下来的几节我们简单介绍搜索引擎是怎样实现网页排名的。这里介绍的内容相对于真正的搜索引擎技术来说只是皮毛，

不过对SEO人员已经足够用了。

搜索引擎的工作过程大体上可以分成三个阶段。

（1）爬行和抓取：搜索引擎蜘蛛通过跟踪链接访问网页，获得页面HTML代码存入数据库。

（2）预处理：索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理，以备排名程序调用。

（3）排名：用户输入关键词后，排名程序调用索引库数据，计算相关性，然后按一定格式生成搜索结果页面。

一、爬行和抓取

爬行和抓取是搜索引擎工作的第一步，完成数据收集的任务。

1．蜘蛛

搜索引擎用来爬行和访问页面的程序被称为蜘蛛（spider），也称为机器人（bot）。

搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后，服务器返回HTML代码，蜘蛛程序把收到的代码存入原始页

面数据库。搜索引擎为了提高爬行和抓取速度，都使用多个蜘蛛并发分布爬行。

蜘蛛访问任何一个网站时，都会先访问网站根目录下的文件。如果文件禁止搜索引擎抓取某些文件或目录，蜘蛛将遵守协议，

不抓取被禁止的网址。

和浏览器一样，搜索引擎蜘蛛也有标明自己身份的代理名称，站长可以在日志文件中看到搜索引擎的特定代理名称，从而辨识搜索引擎蜘蛛。下面列出

常见的搜索引擎蜘蛛名称：

· Baiduspider+（+/search/）百度蜘蛛

· Mozilla/5.0 （compatible; Yahoo！ Slurp China; /）雅虎中国蜘蛛

· Mozilla/5.0 （compatible; Yahoo！ Slurp/3.0; /help/us/ysearch/slurp）英文雅虎蜘蛛

· Mozilla/5.0 （compatible; Googlebot/2.1; +/） Google蜘蛛

· msnbot/1.1 （+/）微软 Bing蜘蛛

· Sogou+web+robot+（+/docs/help/#07）搜狗蜘蛛

· Sosospider+（+/）搜搜蜘蛛

网站制作

· Mozilla/5.0 （compatible; YodaoBot/1.0; /help/webmaster/spider/; ）有道蜘蛛

2．跟踪链接

为了抓取网上尽量多的页面，搜索引擎蜘蛛会跟踪页面上的链接，从一个页面爬到下一个页面，就好像蜘蛛在蜘蛛网上爬行那样，这也就是搜索引擎蜘

蛛这个名称的由来。

整个互联网是由相互链接的网站及页面组成的。从理论上说，蜘蛛从任何一个页面出发，顺着链接都可以爬行到网上的所有页面。当然，由于网站及页

面链接结构异常复杂，蜘蛛需要采取一定的爬行策略才能遍历网上所有页面。

最简单的爬行遍历策略分为两种，一种是深度优先，另一种是广度优先。

所谓深度优先，指的是蜘蛛沿着发现的链接一直向前爬行，直到前面再也没有其他链接，然后返回到第一个页面，沿着另一个链接再一直往前爬行。

如图2-20所示，蜘蛛跟踪链接，从A页面爬行到A1，A2，A3，A4，到A4页面后，已经没有其他链接可以跟踪就返回A页面，顺着页面上的另一个链接，

爬行到B1，B2，B3，B4。在深度优先策略中，蜘蛛一直爬到无法再向前，才返回爬另一条线。

广度优先是指蜘蛛在一个页面上发现多个链接时，不是顺着一个链接一直向前，而是把页面上所有第一层链接都爬一遍，然后再沿着第二层页面上发现

的链接爬向第三层页面。

如图2-21所示，蜘蛛从A页面顺着链接爬行到A1，B1，C1页面，直到A页面上的所有链接都爬行完，然后再从A1页面发现的下一层链接，爬行到A2，

A3，A4，„„页面。

发布者：admin，转转请注明出处：http://www.yc00.com/xitong/1715815581a2675947.html

页面蜘蛛搜索引擎链接爬行

admin

网站建设
各大搜索引擎蜘蛛IP地址大全
百度搜索引擎蜘蛛IP地址大全 220.181.38.177 220.181.19.* 159.226.50.* 202.108.11.* 202.108.22.* 202.108.23.* 202.108.249.* 202.108.250
admin
24天前
70
网站建设
Redis实战：实现高效的搜索引擎
1. 背景介绍随着互联网的快速发展，搜索引擎已经成为人们获取信息的主要途径之一。然而，传统的搜索引擎在处理大规模数据时存在一些问题，例如搜索速度慢、搜索结果不准确等。为了
admin
24天前
30
网站建设
搜索引擎爬虫蜘蛛的useragent
百度爬虫 * Baiduspider(http:www.baidusearchspider.htm”)google爬虫 * Mozilla5.0 (compatible; Googlebot2.1; http:w
admin
24天前
10
网站建设
基于java的搜索引擎系统设计与实现
基于java的搜索引擎系统设计与实现 I. 引言 A.研究背景和动机研究背景： 随着互联网的快速发展和海量数据的不断增长，搜索引擎已成为人们获取信息的重要工具。传统的手工搜索已经无法满足
admin
24天前
00
网站建设
最新最准确各大搜索引擎蜘蛛名称
为什么80%的码农都做不了架构师？>>> 1、百度蜘蛛：Baiduspider网上的资料百度蜘蛛名称有BaiduSpider、baiduspider等，
admin
24天前
10
网站建设
python爬虫项目（十三）：爬取各类网盘的资源链接，搭建资源搜索平台
引言随着信息时代的发展，网盘作为一种重要的数据存储和分享工具，越来越受到用户的青睐。通过爬取各类网盘的资源链接并搭建一个资源搜索平台，可以为用户提供便捷的资源查找服务。本文将介绍如何爬取网盘资源、存储数据并搭建搜索平台的完整流程。目
admin
24天前
30
网站建设
如何清除搜索引擎下拉菜单里的历史记录
1 自定义删除（即想删除哪条历史记录就删除哪条） 在百度搜索网页里的搜索栏中，点击鼠标左键两次，会出现以前搜索过的历史记录。然后用鼠标指向你想要删除的历
admin
24天前
40
网站建设
怎样用搜索引擎
一、介绍　 “搜索引擎”说通俗点就是你能够搜索到自己想要的信息的网站。常用的搜索网站： 百度 http:www.baiduGoogle http:www.google 二、使用在浏览器地址栏输入 www
admin
24天前
10
网站建设
探索高效的全文搜索引擎：tantivy-cli
探索高效的全文搜索引擎：tantivy-cli tantivy-cli项目地址:https:gitcodegh_mirrorstatantivy-cli项目简介 tantivy-cli 是一个基于Ta
admin
24天前
10
网站建设
[转]各大搜索引擎蜘蛛的UserAgent
GOOGLE---------------------------------------------------------------------66.249.70.212 - - [11Jan2009:00:03:35 -0700
admin
24天前
10
网站建设
Vue IOS端跳转后返回页面不刷新问题解决
方法一： we码用了，生效 mounted () {this.$nextTick(()>{首页跳转至门诊或者商城返回 IOS不兼容页面自动刷新问题var unavigator.us
admin
16天前
40
网站建设
如何用selenium或pyppeteer来链接并打开指纹浏览器AdsPower
前言本文是该专栏的第25篇，后面会持续分享python的爬虫干货知识，记得关注。一般来说，选择使用自动化工具来做爬虫算是一种退而求其次的方法，但是要注意的是，面对那种需要模拟登录进行操作，或者是需要模拟登录拿到cookie再交给协议请
admin
15天前
10
网站建设
微信打开链接跳转手机浏览器（付代码）
本方法是在微信中，用户点击链接或者扫描二维码直接跳转到浏览器中打开指定页面，或者用扫描二维码的形式（下面就具体说一下操作方法把。用户在微信中操作，
admin
15天前
20
网站建设
默认浏览器设置及vue自动打开页面
以下为windows 系统操作，仅供参考。一、修改默认浏览器个人偏好谷歌浏览器，设置谷歌浏览器为默认浏览器。 1、首先打开“开始菜单”，点击“控制面板”&#xff
admin
15天前
10
网站建设
jupyter Notebook打开后浏览器页面空白解决办法
第一种方法（推荐）:下载一个浏览器，卸载Jupyter Notebook默认的浏览器。卸载后Jupyter notebook会自动进行选择默认浏览器。第二种方法卸载重新装
admin
15天前
10
网站建设
asp.net中winform窗体程序如何打开浏览器，如何打开链接？
有时候我们在做winform窗体应用程序的时候，也需要打开浏览器，这时候应该怎么做呢？ 其实我们可以选 linkLabel 控件，双击控件添加单击事件
admin
15天前
20
网站建设
搜索引擎和浏览器
浏览器是显示网页的，搜索引擎是查询网页的。作为一个产品来说，如百度搜索引擎本身是一个互联网服务，和电商网站，门户网站一样。而浏览器则是个呈现工具&am
admin
15天前
10
网站建设
Win11商店无法加载页面怎么办 Win11应用商店打不开怎么办
很多用户都升级了Win11系统，升级了系统就想要下载一些新的软件来丰富自己的系统。但是升级了Win11系统之后就无法加载应用商店的界面了，打不开微软的应用商店该怎么办呢?小编给大家带来了一个解决办
admin
15天前
10
网站建设
计算机进不去管理,192.168.3.1登陆页面，192.168.3.1管理页面进不去怎么办？ | 192路由网...
问：设置华为荣耀路由器时，192.168.3.1登陆页面进不去怎么办？ 答：当你设置华为路由器时，不能进入192.168.3.1登
admin
14天前
10
网站建设
【Windows编程学习笔记】1：实现学生信息管理系统的简易页面
本学期非常幸运能和李青老师学习使用纯CC实现Win32的应用程序开发。开发过程中不使用MFC，而是直接调用WindowsAPI来实现应用程序编程，这样做的好处是能够理解界面程序的实现机制&
admin
14天前
10

发表回复

评论列表（0条）

暂无评论

SEO实战:搜索引擎工作原理三个阶段简介

发表回复

评论列表（0条）

联系我们

400-800-8888

SEO实战:搜索引擎工作原理三个阶段简介

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888