Robots Meta 标签和 X-Robots 标签说明

Rate this post

您网站上的某些内容对于搜索引擎索引来说不是必需的。为了防止某些页面被索

引，您可以使用 robots 元标记或 xrobots-tag。

Robots 和 robotstxt 元标

记被错误使用的情况并不少见。这会导致混乱、冲突的指令，无法实现预期的结果：阻止页面被索引。

在本指南中，我们希望帮助您了解如何使用 robots 和 x-robots-tag 元标记来控制您网站内容的索引并识别最常见的错误。

具体来说，我们将看到：

robots 元标记（也称为 robots 标签）是一段 HTML 代码，放置在网页的 <head> </head> 部分，用于控制搜索引擎如何抓取和索引 URL。

以下是页面源代码中的 robots 元标记：

<meta name="robots" content="noindex" />

这些标签是特定于页面的，允许您指示搜索引擎如何处理该页面以及是否将其包含在索引中。

Robots 元标记用于控制 Google 如何索引您的网页内容。这包括以下决定：

要了解如何使用 robots 元标记，我们需要查看不同的属性和指令。我们还将分享一些代码示例，您可以将其插入到页眉中，以提示搜索引擎以某种方式为您的页面编制索引。

对您的网站进行技术审核

使用 Semrush 网站审核工具

一旦您理解了如何设置两个属性：名称和内容，使用 robots 元标记就非常简单了。这两个属性都是必需的，因此您渠道：将电子邮件与社交相结合需要为每个属性设置一个值。

让我们更详细地了解这些属性。

name 属性控制哪些爬虫和机器人（用户代理，也称为 UA）应遵循 robots 元标记中的说明。

要指示所有爬虫遵循说明，请使用：

名称=“机器人”

在大多数情况下，我们建议将其用作默认值，但您可以根据需要使用任意数量的不同 robots 元标记来为不同的爬虫指定指令。

当你想要训练多个爬虫时，只需使用多个标签：

内容属性用于向指定的用户代理提供指令。

重要的是要知道，如果您没有在网页上指定 robots 元标记，则默认为索引该页面并跟踪所有链接（除非它们具有内联指定的 rel=”nofollow” 属性）。

您可以使用的不同指令包括：

您可以在此处查看 Google 支持的指令完整列表，并在此处查看Bing 支持的指令完整列表。