在 HTML 代码中使用 robots 元标记

如果您可以编辑页面的 HTML 代码,只需将 robots 元标记直接添加到页面的 <head> 部分即可。

例如,如果您希望搜索引擎不索引该页面而是跟踪链接,请使用:

在 WordPress 上使用 Robots 元标签

如果您使用 Yoast SEO,请打开页面编辑器下方的块中的“高级”选项卡。

您可以通过在“允许搜索引擎在搜索结果中显示该页面?”下拉菜单中选择“否”选项来设置“noindex”指令。物品。或者通过 b2b电子邮件清单 选择“搜索引擎是否应该跟踪此页面上的链接?”下的否选项来阻止跟踪链接。

任何其他指令都需要在“Meta robots advanced”字段中实现。

 

如果您使用 RankMath,您可以直接从元框的高级标签中选择要应用的 robots 指令:

 

在 Shopify 上使用 Robots 元标签

如果您需要在 Shopify 上实现 robots 元标记,则需要通过编辑 theme.liquid 布局文件的 <head> 部分来实现。

要为特定页面设置指令,请将以下代码添加到此文件:

此代码将指示搜索引擎不要索引 /page-name/,而是跟踪 更高的打开率点击率 页面上的所有链接。

您需要创建单独的条目来在不同的页面上设置指令。

在 Apache 服务器上使用 X-Robots-Tag

要在 Apache 网络服务器上使用 x-robots-tag,请将以下内容添加到您网站的 .htaccess 或 httpd.config 文件中。

<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, follow"
</Files>

上面的例子将文件类型设置为 .pdf,并告诉搜索引擎不要索引该文件,而是跟踪指向该文件的任何链接。

在 Nginx 服务器上使用 X-Robots-Tag

如果您使用的是 Nginx 服务器,请将以下内容添加到您网站的 .conf 文件中:

location ~* \.pdf$ {
add_header X-Robots-Tag "noindex, follow";
}

这将应用 noindex 属性并导致爬虫跟踪 .pdf 文件上的所有链接。

Meta Robots 的常见错误

在指导搜索引擎如何抓取和索引网页时犯错误并不少见。以下是最常见的:

  • Robots.txt 阻止的页面上的 Meta Robots 指令
  • 将 robots 指令添加到 Robots.txt 文件
  • 从站点地图中删除带有 Noindex 指令的页面
  • 意外阻止搜索引擎抓取整个网站

Robotstxt 阻止的页面上的 Meta Robots 指令

如果您的 robots.txt 文件不允许某个页面,搜索引擎机器人将无法抓取该页面,也无法记录您 robots 元标 博目录 记或 x-robots-tag 中的任何指令。

确保所有训练用户代理的页面都可以被抓取。

如果某个页面从未被编入索引,则使用 robots.txt 文件中的 disallow 足以阻止它出现在搜索结果中,但仍然建议添加 robots 元标记。

 

滚动至顶部