Google 既支持内嵌指令也支持网页级元标记,可以根据这些指令和标记判断如何在搜索结果中显示您网站的网页。
网页级元标记是网站所有者向搜索引擎提供网站相关信息的绝佳方法。您可以使用元标记为各种类型的客户端提供信息,但每个系统只会处理它可以识别的元标记,而将其余元标记全部忽略。元标记应添加到 HTML 网页的 <head> 部分,通常如下所示:
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta name="Description" CONTENT="Author: A.N. Author, Illustrator: P. Picture, Category: Books, Price: £9.24, Length: 784 pages"> <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/> <title>Example Books - high-quality used books for children</title> <meta name="robots" content="noindex,nofollow">
Google 可识别以下元标记(此列表并未列出所有元标记):
<meta name=”description” content=”A description of the page” / |
此标记用于提供一段有关网页的简短说明。在某些情况下,这段说明会被当作网页摘要的一部分显示在搜索结果中。了解详情 |
<meta name=”robots” content=”. <meta name=”googlebot” content=”. |
这些元标记可以控制搜索引擎的抓取和索引编制行为。
<meta name=”robots”> 标记适用于所有搜索引擎,但 <meta name=”googlebot”> 标记专用于 Google。 如果 robots(或 googlebot)元标记存在冲突,那么应用限制较严的标记。例如,如果某个网页同时包含 max-snippet:50 和 nosnippet 标记,那么应用 nosnippet 标记。 默认值为 “index, follow”,不需要指定。我们可识别以下值(指定多个值时,请使用英文逗号分隔各值): index – 允许将该网页编入索引。 follow – 在抓取过程中跟踪该网页内的所有链接。 noindex – 禁止将该网页编入索引。 nofollow – 禁止在抓取过程中跟踪该网页内的链接。 nosnippet – 禁止将文字摘要或视频预览画面显示在搜索结果中。对于视频,将改为显示一张静态图片(如果可以的话)。示例:<meta name=”robots” content=”nosnippet”> max-snippet:[number] – 将此网页的文本摘要长度限制为 [number] 个字符;指定 0 表示没有摘要,指定 -1 可允许 Google 选择其认为最有助于用户发现您的内容并将用户定向到您网站的摘要长度。 max-image-preview:[size] – 限制与此网页关联的任何图片的大小。[size] 可以是“non”、“standard”或“large”。 max-video-preview:[number] – 限制与此网页关联的任何视频预览不超过 [number] 秒;指定 0 仅允许静态图片,指定 -1 可允许任意预览时长 noarchive – 禁止将该网页的缓存链接显示在搜索结果中。 unavailable_after:[date] – 让您能够指定要停止抓取该网页及将其编入索引的确切日期和时间。 noimageindex – 禁止将该网页作为图片的引荐来源网页显示在 Google 图片搜索结果中。这样做可禁止将此网页上的所有图片编入索引;如果图片显示在其他网页中,系统可能会根据这个网页上的权限抓取该图片并将其编入索引。请注意,这尚未成为一项互联网标准;标准的图片屏蔽方法是使用 robots.txt 规则。 none – 等同于 noindex, nofollow。 all – [默认值] 等同于 “index, follow”。 您也可使用 HTTP 标头指令“X-Robots-Tag”在网页的标头中指定此信息。如果您要限制将非 HTML 文件(如图形或其他类型的文档)编入索引的行为,这种方法尤为实用。详细了解漫游器元标记 |
<meta name=”google” content=”nositelinkssearchbox” / |
当用户搜索您的网站时,Google 搜索结果有时会显示一个供您网站专用的搜索框,以及其他直接指向您网站的链接。此标记用于告知 Google 不要显示站点链接搜索框。详细了解站点链接搜索框。 |
<meta name=”google” content=”notranslate” / |
如果 Google 发现网页内容所用的语言很可能不是用户想阅读的语言,则往往会在搜索结果中提供翻译链接。这样通常会让您有机会将独特而富有吸引力的内容提供给更多用户。不过,在某些情况中,您可能并不希望我们这样做。此元标记会告知 Google 您不希望我们提供该网页的翻译。 |
<meta name=”google” content=”nopagereadaloud” / |
禁止网络浏览器使用 Google 助理语音指令“阅读此页”和“阅读”来朗读已标记的网页。 |
<meta name=”google-site-verification” content=”. |
您可以在网站的顶级网页上使用此标记,以向 Search Console 验证您对该网站的所有权。请注意,虽然“name”和“content”属性的值必须与提供给您的值完全匹配(包括大小写),但是否将标记从 XHTML 更改为 HTML,或者标记的格式是否与网页的格式相符,这些都无关紧要。了解详情 |
<meta http-equiv=”Content-Type” content=”. <meta charset=”. |
此元标记会定义网页的内容类型和字符集。请确保您已在内容属性值的两端添加了引号,否则系统可能会错误地解译字符集属性。我们建议尽可能使用 Unicode/UTF-8。了解详情 |
<meta http-equiv=”refresh” content=”. |
此标记会在一段时间过后将用户转到新网址,有时也会被用作一种简单的重定向形式。不过,并非所有浏览器都支持使用此元标记,因而可能会令用户感到困惑。W3C 建议不要使用此标记。我们建议改用服务器端 301 重定向。 |
<meta name=”viewport” content=”. |
此标记可告知浏览器如何在移动设备上呈现网页。该标记的存在可向 Google 表明该网页适合移动设备。详细了解如何配置视口元标记。 |
<meta name=”rating” content=”adult” />
<meta name=”rating” content=”RTA-5042-1996-1400-1577-RTA” /> |
将网页标记为包含成人内容,以表明网页应被安全搜索结果滤除。详细了解如何标记安全搜索网页。 |
需要注意的其他事项 #
无论网页采用的是哪种代码,Google 都能读取 HTML 和 XHTML 样式的元标记。
除了 google-site-verification 外,其他元标记的大小写通常无关紧要。
此列表并未列出所有可用的元标记,如果其他元标记对您的网站很重要,请放心使用。唯一需要记住的是,Google 会忽略不认识的元标记。
内嵌指令 #
您可以在网页级元标记之外单独指定不在摘要中使用 HTML 网页的某些部分。您可以使用 span、div 或 section HTML 元素中的 data-nosnippet HTML 属性实现这一点。例如:
<p>This text can be included in a snippet <span data-nosnippet>and this part would not be shown</span>.</p>
为了确保机器能读懂,此部分必须是有效的 HTML,并且所有标记均有对应的结束标记。了解详情。