noindex 是具有 <meta> 标记或 HTTP 回应标头的规则组合,可用来防止支援 noindex 规则的搜寻引擎 (例如 Google) 将内容编入索引。这样一来,Googlebot 检索该网页并撷取 noindex 标记或标头时,就会将该网页完全排除在 Google 搜寻结果之外,不论是否有其他网站连结到该网页,结果都一样。
重要事项
为了让 noindex 规则生效,「请勿」使用 Robots.txt 档案封锁网页或资源,而是让检索器能存取网页。如果网页遭到 robots.txt 档案封锁,或是检索器无法存取网页,检索器便无从发现 noindex 规则,使得该网页仍可能出现在搜寻结果中。比方说,如果有其他网页连结到该网页,就可能发生这种情况。
如果您没有自身伺服器的根存取权,就很适合使用 noindex,因为这样可以视个别网页情况,控制网站存取权。
实作 noindex
实作 noindex 的方法有两种,分别是使用 <meta> 标记和 HTTP 回应标头。这两种做法的效果相同,请依照内容类别和网站情形选择适合的即可。Google 不支援在 robots.txt 档案中指定 noindex 规则。
您也可以将 noindex 规则与可以控制索引的其他规则合併。举例来说,您可以使用 noindex 规则加入 nofollow 提示:<meta name="robots" content="noindex, nofollow" />。
<meta> 标记
如要防止所有支援 noindex 规则的搜寻引擎将网站上的网页编入索引,请在网页的 <head> 区段中加入下列 <meta> 标记:
<meta name="robots" content="noindex">
如要「专门防止 Google 网路检索器」将特定网页编入索引,请放入下列中继标记:
<meta name="googlebot" content="noindex">
提醒您,有些搜寻引擎对 noindex 规则可能有不同的解译方式,因此您的网页仍可能出现在这些搜寻引擎的结果中。