您可以控制 Google 在您的网站上看到的信息以及在 Google 搜索结果中显示的信息。
为什么要向 Google 屏蔽某些内容? #
您可能会出于多种原因而希望阻止 Google 访问您的某些内容。
确保数据的私密性
您可能在自己的网站上托管了不希望其他用户访问的不公开数据。网站会员联系信息之类的数据通常就属于这种情况,您需要阻止 Google 访问这些信息,以避免这些会员数据显示在 Google 搜索结果中。
避免向受众群体显示价值不大的内容
您的网站可能在不同位置有相同的内容,这可能会对您的网页在 Google 搜索中的排名产生负面影响。例如,如果网站提供了网站级搜索功能以帮助用户浏览网站内容,就会出现重复内容。某些搜索功能会在用户输入查询时生成并显示定制的搜索结果。如果您不阻止 Google 访问这些结果页,Google 就会逐个抓取所有这些自定义搜索结果页。最终 Google 会认为网站中包含许多类似的网页,且可能会将重复内容归为垃圾内容,这可能会导致网页在 Google 搜索中的排名下降。
您的网站可能转载了其他第三方来源生成的信息,这些信息会显示在网络上的其他地方。Google 认为将包含大量重复内容的网页收录到 Google 搜索结果中的价值不大。您可以屏蔽复制的内容来改善 Google 看到的内容质量,从而提高您的网页在 Google 搜索中的排名。
让 Google 专注于重要内容
如果您的网站非常庞大(数千个网址),且具有内容不太重要的网页,或者有大量重复内容,则可能需要阻止 Google 抓取重复或重要性较低的网页,从而使其专注于更重要的内容。
如何屏蔽内容 #
以下是阻止内容显示在 Google 中的主要方式:
内容类型 | 方法 | 说明 |
---|---|---|
所有类型 | 移除内容 | 从网站中移除内容是确保其不会出现在 Google 搜索中或任何地方的最可靠方法。如果信息已显示在 Google 中,您可能需要采取额外的措施。 |
所有类型 | 通过密码保护文件 | 如果您不希望自己的机密或私人内容出现在 Google 搜索结果中,那么最简单有效的方法就是将这些内容存储在网站服务器上用密码保护的目录中,以防止私密网址显示在搜索结果中。Googlebot 和其他所有网页抓取工具都无法访问用密码保护的目录中的内容。 高级用户:如果您使用的是 Apache 网络服务器,可以修改 .htaccess 文件并为服务器上的目录提供密码保护。网络上有许多工具可协助您轻松执行上述操作。 |
图片 | robots.txt 和/或紧急图片移除请求 | 使用 robots.txt 规则屏蔽图片。使用 robots.txt 可以将图片从搜索结果中完全屏蔽;但是对于网页,即使使用 robots.txt 规则屏蔽后 Google 不会抓取网页,但网页仍会出现在搜索结果中。 |
网页 | noindex 指令 | noindex 是一种告诉 Google 不要读取您的网页或让其显示在 Google 搜索结果中的技巧。您的网页仍然可以链接到其他网页,并由其他网页访问,或由用户使用链接直接访问,但它不会显示在 Google 搜索结果中。此方法对技术要求较高,如果您使用内容管理系统托管网站,可能无法使用此方法。 |
网页 | 停用特定的 Google 产品和服务 | 您可以告知 Google 不要将您网站上的内容包含在特定的(而非所有的)Google 产品和服务中。 |
搜索结果摘要 | nosnippet 元标记 | 向网页附加 <meta name=”nosnippet”> 标记,以防止摘要出现在搜索结果中。但请注意,这会在搜索结果中生成令人困惑的消息(“无可用摘要”) |
网页(和常规网址空间) | 网址参数工具 | 高级用户可以使用网址参数工具阻止抓取包含特定参数的网址。 我们仅建议非常高级的用户使用此方法,因为此方法可能会屏蔽您网站的很大一部分网址空间,导致出错时难以调试。 |
从 Google 移除现有内容 #
如果内容已经存在于 Google 上,并且您想要将其移除,则可能需要采取额外的措施。