在 HTML 代码中使用 robots 元标记

Rate this post

如果您可以编辑页面的 HTML 代码，只需将 robots 元标记直接添加到页面的 <head> 部分即可。

例如，如果您希望搜索引擎不索引该页面而是跟踪链接，请使用：

在 WordPress 上使用 Robots 元标签

如果您使用 Yoast SEO，请打开页面编辑器下方的块中的“高级”选项卡。

您可以通过在“允许搜索引擎在搜索结果中显示该页面？”下拉菜单中选择“否”选项来设置“noindex”指令。物品。或者通过 b2b电子邮件清单选择“搜索引擎是否应该跟踪此页面上的链接？”下的否选项来阻止跟踪链接。

任何其他指令都需要在“Meta robots advanced”字段中实现。

如果您使用 RankMath，您可以直接从元框的高级标签中选择要应用的 robots 指令：

如果您需要在 Shopify 上实现 robots 元标记，则需要通过编辑 theme.liquid 布局文件的 <head> 部分来实现。

要为特定页面设置指令，请将以下代码添加到此文件：

此代码将指示搜索引擎不要索引 /page-name/，而是跟踪更高的打开率点击率页面上的所有链接。

您需要创建单独的条目来在不同的页面上设置指令。

要在 Apache 网络服务器上使用 x-robots-tag，请将以下内容添加到您网站的 .htaccess 或 httpd.config 文件中。

<Files ~ "\.pdf$">

Header set X-Robots-Tag "noindex, follow"

</Files>

上面的例子将文件类型设置为 .pdf，并告诉搜索引擎不要索引该文件，而是跟踪指向该文件的任何链接。

如果您使用的是 Nginx 服务器，请将以下内容添加到您网站的 .conf 文件中：

location ~* \.pdf$ {

add_header X-Robots-Tag "noindex, follow";

}

这将应用 noindex 属性并导致爬虫跟踪 .pdf 文件上的所有链接。

在指导搜索引擎如何抓取和索引网页时犯错误并不少见。以下是最常见的：

如果您的 robots.txt 文件不允许某个页面，搜索引擎机器人将无法抓取该页面，也无法记录您 robots 元标博目录记或 x-robots-tag 中的任何指令。

确保所有训练用户代理的页面都可以被抓取。

如果某个页面从未被编入索引，则使用 robots.txt 文件中的 disallow 足以阻止它出现在搜索结果中，但仍然建议添加 robots 元标记。