如果您正在寻找可用于控制搜索引擎如何抓取和索引您的网页的 robots 元标记的示例,则可以使用以下内容,这是最常见的使用场景:
不索引该页面但跟随链接至其他页面:
<meta name="robots" content="noindex, follow" />
不要索引该页面并且不要跟随到其他页面的链接:
<meta name="robots" content="none" />
索引该页面但不跟踪到其他页面的链接:
<meta name="robots" content="nofollow" />
不要在 SERP 上显示页面的缓存副本:
<meta name="robots" content="noarchive" />
不要索引页面上的图像:
<meta name="robots" content="noimageindex" /
指定日期/时间之后不在 SERP 中显示页面:
<meta name="robots" content="unavailable_after: Friday, 01-Jan-21 12:59:59 ET" />
如果需要,您可以将指令组合成一个标签,并用逗号分隔它们。
例如,假设您不希望关注页面上的任何链接,并且还希望阻止图像被索引。美国:
<meta name="robots" content="nofollow, noimageindex" /
使用 Robots Meta 标签来控制代码片段
虽然 robots 元标记最常用于控制页 国家邮箱列表 面是否被索引以及该页面上的链接是否被搜索引擎抓取,但它们也可用于控制 SERP 上的片段。
谷歌表示,网站管理员可以使用“多种方法对其网页显示的内容进行更精细的配置”。
它们以以下 robots 元标记的形式出现:
- nosnippet(不在 SERP 中显示页面的摘要/元描述)
- max-snippet:[number](指定片段文 收到的数据隐私和安全 本的最大长度(以字符为单位))
- max-video-preview:[number](指定视频预览的最大持续时间,以秒为单位)
- max-image-preview:[setting](通过选择“无”、“标准”或“大”来指定图像预览的最大尺寸)
使用以下代码来控制网页片段的显示方式:
不要在 SERP 中显示页面摘要:
这些代码还可以组合起来,以便更好地控制您的页面片段。假设您想将代码片段的最大长度设置为 150 个字符,并允许大图像预览。美国:
如果您在法国有受众,您需要密切关注这些标签,因为法国版权法禁止 Google 显示您网站的任何片段,除非您选择使用它们。
如果您不想对代码片段施加任何限制,您可以在页面标题中添加以下内容:
什么是X‑Robots-Tag?
控制搜索引擎如何抓取和索引您的网页的另一种方法是使用 x-robots-tags 而不是 robots 元标记。
虽然在 HTML 页面中实现 robots 元标记相对简单,但 x-robots-tag 则比较复杂。如果您想控制如何处理非 HTML 内容(例如 PDF),则需要使用 x-robots 标签。
这是一个 HTTP 标头响应,而不是 HTML 标签,并且任何可以用作 robots 元标签的指令也可以用作 x-robots-tag。
以下是 x-robots-tag 的示例:
x-robots 标签:noindex、nofollow
要使用 x-robots-tag,您需要能够访问您的网站标题 .php、.htaccess 或服务器配置文件。如果您无权访问此功能,则需要使用 robots 元标记来指示爬虫程序。
何时使用X-Robots-Tag?
使用 x-robots-tag 并不像使用 robots 元标记那么简单,但它确实允许您指导搜索引擎如何索引和抓取其他类型的文件。
在以下情况下使用 x-robots-tag:
- 您需要控制搜索引擎如何抓取和索引非 HTML 文件类型
- 您需要在全局(站点范围)级别而不是页面级别提供指令
如何设置 robots 元标签和 X-Robots-Tag
设置 robots 元标记通常比 x-robots-tag 更容易,但实施任何一种方法来控制搜索引擎如何抓取和索引您的网站可能 博目录 会有所不同,具体取决于您的 CMS 和/或服务器类型。
以下是在最常见配置中使用 robots 和 x-robots-tag 元标记的方法:
- 在 HTML 代码中使用 robots 元标记
- 在 WordPress 上使用 Robots 元标签
- 在 Shopify 上使用 Robots 元标签
- 在 Apache 服务器上使用 X-Robots-Tag
- 在 Nginx 服务器上使用 X-Robots-Tag。