谷歌搜索引擎优化指南 谷歌搜索引擎优化指南 谷歌搜索引擎优化指南 谷歌搜索引擎优化指南
  • 首页
  • 谷歌SEO工具
    • 关键词工具
    • 内容SEO工具
    • 链接查询分析工具
    • 排名监控工具
    • 网站SEO分析工具
    • 谷歌浏览器SEO插件
  • WordPress主题
  • WordPress插件
  • 谷歌SEO优化官方文档
  • 排行榜
  • 提交工具
谷歌搜索引擎优化指南 谷歌搜索引擎优化指南
  • 首页
  • 谷歌SEO工具
    • 关键词工具
    • 内容SEO工具
      • AI写作工具
    • 链接查询分析工具
    • 排名监控工具
    • 网站SEO分析工具
    • 谷歌浏览器SEO插件
  • WordPress主题
    • WordPress插件
  • 谷歌SEO优化指南
    • Google搜索要素
    • SEO基础知识
    • Google抓取和编入索引
    • Google排名和搜索结果呈现
      • 排名算法系统
      • 结构化数据
      • 页面体验
    • 监控和调试
    • 针对特定网站的指南
  • 谷歌SEO技术
    • 谷歌SEO入门教程
  • SEO工具使用指南

谷歌SEO优化指南(新版)

  • 谷歌搜索引擎优化(SEO)简介
  • Google搜索要素
    • Google 搜索要素概览
    • Google 搜索技术要求
    • 适用于 Google 网页搜索的垃圾内容政策
  • SEO基础知识
    • 使您的网站显示在 Google 搜索结果中
    • 关于 Google 搜索运作方式的深度指南
    • 创建实用、可靠、以用户为中心的内容
    • 谷歌搜索引擎优化 (SEO) 新手指南
    • 您需要 SEO 吗?什么是 SEO 专家?
    • 维持网站的SEO效果(技术型SEO技巧与策略)
    • Google 搜索使用入门:开发者搜索指南
  • Google抓取和编入索引
    • 抓取和索引编制主题概览
    • Google可编入索引的文件类型
    • GoogleSEO网址结构最佳实践(Google网址结构准则)
    • GoogleSEO链接最佳实践(内链、外部链接)
    • 关于移动网站和优先将移动版网站编入索引的最佳实践
    • 站点地图Sitemap
      • 了解站点地图(什么是站点地图Sitemap)
      • 创建和提交站点地图(Sitemap格式规范)
      • 使用站点地图索引文件管理站点地图(拆分较大的站点地图)
      • 图片站点地图格式和规范
      • Google新闻站点地图格式和规范
      • 视频站点地图和替代方案(视频站点地图示例)
      • 如何结合使用站点地图扩展
    • 抓取工具管理
      • 请求 Google 重新抓取您的网站网址
      • 减慢Googlebot的抓取速度
      • 验证Googlebot和其他Google抓取工具
      • 面向大型网站所有者的抓取预算管理指南
      • HTTP 状态代码以及网络连接错误和 DNS 错误对 Google 搜索有何影响
      • Google抓取工具和抓取器(用户代理)概览
      • Googlebot-什么是Googlebot
      • Google Read Aloud 用户代理
      • APIs-Google 用户代理
      • Feedfetcher
    • Robots.txt
      • Robots.txt简介与指南
      • 如何编写和提交robots.txt文件(robots协议规则写法)
      • 更新robots.txt文件
      • Google如何解读robots.txt规范
    • 网址规范化
      • 什么是网址规范化
      • 如何使用rel=”canonical”及其他方法指定规范网址
      • 解决规范化问题
    • AMP
      • 与 Google 搜索中的 AMP 网页相关的准则
      • 了解AMP在搜索结果中的运作原理
      • 增强在Google搜索结果中显示的AMP内容
      • 验证AMP内容是否可以显示在Google搜索结果中
      • 从 Google 搜索结果中移除 AMP 网页
    • JavaScript
      • 了解JavaScriptSEO基础知识
      • 解决与 Google 搜索相关的 JavaScript 问题
      • 修正延迟加载的网站内容
      • 将动态呈现作为临时解决方法
    • 网页和内容元数据
      • Google搜索的有效页面元数据
      • Google支持的meta标记和属性
      • 漫游器元标记规范(Robots meta标记、data-nosnippet和X-Robots-Tag规范)
      • 使用noindex阻止搜索引擎编入索引
      • 安全搜索功能和您的网站
      • 向Google说明您的出站链接的用意(rel属性)
    • 删除
      • 控制您在Google搜索中分享的内容
      • 从Google搜索结果中移除您网站上托管的网页
      • 从搜索结果中移除您网站上托管的图片
      • 让隐去的信息不显示在 Google 搜索中
    • 网站迁移和变更
      • 重定向和Google搜索
      • 网站更换托管服务提供商或迁移到内容分发网络 (CDN)
      • 在更改网址的情况下迁移网站
      • 有关在Google搜索中进行A/B测试的最佳实践
      • 暂停或停用网站
  • Google排名和搜索结果呈现
    • Google搜索结果呈现 主题概览
    • AI概览和您的网站
    • Google搜索的视觉元素库
    • Google搜索结果中的标题链接(Title)
    • Google搜索结果中的摘要(如何撰写元描述)
    • 图片搜索引擎优化 (SEO) 最佳实践
    • 视频搜索引擎优化 (SEO) 最佳实践
    • 影响您在Google搜索中的署名日期
    • 定义要在搜索结果中显示的网站图标(Favicon)
    • 经过翻译的功能-1 Google搜索中的翻译搜索结果
    • 经过翻译的功能-2 让广告网络能够使用与翻译相关的Google搜索功能
    • 精选摘要和您的网站
    • 使内容出现在Google探索中
    • Google搜索结果中的网站名称
    • 搜索结果中的站点链接
    • 在Google上启用网络故事、创建网络故事的最佳做法及内容政策
    • 实施灵活抽样时需遵循的常规指南
    • 本地功能-1 向Google添加商家详情
    • 本地功能-2 热门地点列表优化
    • 本地功能-3 退出Google Local
    • Google搜索和您网站上的备注(实验性功能)
    • “包裹跟踪”功能尝鲜者计划
    • 排名系统
      • Google搜索排名系统指南
      • Google搜索实用内容系统
      • Google搜索的评价系统
    • 页面体验
      • 了解Google搜索结果中的网页体验
      • 了解核心网页指标和Google搜索结果
      • 避免使用干扰性插页式广告和对话框
      • 在Google搜索中使用 Signed Exchange
    • 结构化数据
      • Google搜索中的结构化数据标记简介及其运作方式
      • 结构化数据常规指南
      • 丰富且互动的搜索结果
      • 使用 JavaScript 生成结构化数据
      • Google搜索支持的结构化数据标记(结构化数据列表)
      • 文章(Article、NewsArticle、BlogPosting)结构化数据
      • 图书操作 (Book) 结构化数据
      • 面包屑导航 (BreadcrumbList) 结构化数据(路径)
      • 轮播界面 (ItemList) 结构化数据
      • 课程信息(Course 和 CourseInstance)结构化数据
      • 课程列表 (Course) 结构化数据
      • 数据集(Dataset、DataCatalog、DataDownload)结构化数据
      • 论坛 (DiscussionForumPosting) 结构化数据
      • 知识问答(Quiz、Question 和 Answer)结构化数据
      • 雇主总体评分 (EmployerAggregateRating) 结构化数据
      • 估算工资 (Occupation) 结构化数据
      • 活动 (Event) 结构化数据
      • 事实核查 (ClaimReview) 结构化数据
      • 常见问题解答FAQ(FAQPage、Question、Answer)结构化数据
      • 居家活动 (VirtualLocation) 结构化数据
      • Google 图片中的图片元数据
      • 职位搜索的招聘信息 (JobPosting) 结构化数据
      • 学习视频(LearningResource、VideoObject、Clip)结构化数据
      • 本地商家 (LocalBusiness) 结构化数据
      • 数学求解器 (MathSolver) 结构化数据
      • 影片轮播界面 (Movie) 结构化数据
      • 单位组织 (Organization) 结构化数据
      • 练习题 (Quiz) 结构化数据
      • 产品/商品(Product、Review、Offer)结构化数据简介-0
      • 产品/商品(Product、Review、Offer)结构化数据-1商品摘要
      • 产品/商品(Product、Offer)结构化数据-2商家信息
      • 产品/商品结构化数据(ProductGroup、Product)-3变体(商品款式/规格)
      • 个人资料页面 (ProfilePage) 结构化数据
      • 问答 (QAPage) 结构化数据
      • 食谱(Recipe、HowTo、ItemList)结构化数据
      • 评价摘要(Review、AggregateRating)结构化数据
      • 站点链接 (WebSite) 结构化数据
      • 软件应用 (SoftwareApplication) 结构化数据
      • 订阅和付费内容结构化数据 (CreativeWork)
      • 民宿 (VacationRental) 结构化数据
      • 车辆详情 (Car) 结构化数据
      • 视频(VideoObject、Clip、BroadcastEvent)结构化数据
      • 可朗读(Article、WebPage)结构化数据(Beta 版)
      • COVID-19 通知 (SpecialAnnouncement) 结构化数据(Beta 版)
  • 监控和调试
    • 调试 Google 搜索流量下降问题
    • 通过Search Console进行监控
      • Search Console使用入门
      • 利用Search Console气泡图改进搜索引擎优化 (SEO) 效果
    • 使用搜索运算符进行调试
      • Google 搜索运算符概览
      • site: 搜索运算符
      • cache: 搜索运算符
      • Google图片src: 搜索运算符
    • 预防和监控滥用行为
      • 预防和监控网站上的滥用行为概览
      • 防止网站和平台存在用户生成的垃圾内容
      • 恶意软件和垃圾软件
      • 防止感染恶意软件
      • 社会工程学(钓鱼式攻击和欺骗性网站)
      • Google安全浏览屡次违规网站政策
  • 针对特定网站的指南
    • 电子商务网站
      • 在Google搜索中推广电子商务网站的最佳做法 概览
      • 电子商务内容可以展示在Google上的什么位置
      • 与 Google 分享商品数据
      • 添加电子商务网站的结构化数据
      • 如何在Google上发布新的电子商务网站
      • 撰写优质评价
      • 设计电子商务网站的网址结构
      • 电子商务网站导航结构
      • 分页和增量加载以及它们对 Google 搜索的影响
    • 国际网站和多语言网站
      • 国际性和多语言网站主题概览
      • 管理多区域网站和多语言网站
      • 将网页的本地化版本告知Google
      • Google如何抓取语言区域自适应网页

Google搜索引擎优化 (SEO) 指南(旧版)

  • 谷歌搜索引擎优化(SEO)简介
  • Google搜索基础知识
    • 1.快速入门:了解 Google 搜索的基础知识
    • 2.在 Google 上占有一席之地
    • 3.搜索的工作方式(面向新手)
    • 4.针对搜索引擎优化您的网站
    • 5.衡量您的网站在 Google 上的效果
  • Google新手SEO
    • 1.Google搜索新手入门指南
    • 2.Google 搜索的工作方式
    • 3.Google搜索引擎优化 (SEO) 新手指南
    • 4.您需要 SEO 吗?
    • 5.在 Google 上建立商家详情
    • 6.谷歌站长工具Search Console 新手指南
  • Google高级SEO
    • 1.Google高级SEO使用入门
    • 2.进阶内容:Google 搜索的运作方式
    • 3.Google 搜索使用入门:开发者指南
    • 4.谷歌站长工具Search Console 高级指南
    • 5.Google优化指南
      • 5.1Google优化指南概览(目录)
      • 5.2Google网站站长指南
      • 5.3Google常规指南
        • 5.3-1保持简单的网址结构
        • 5.3-2向 Google 说明您的出站链接的用意
        • 5.3-3将网站标记为面向儿童的内容
        • 5.3-4浏览器兼容性
        • 5.3-5避免创建重复内容
        • 5.3-6确保链接可供抓取
        • 5.3-7确保 Googlebot 未被阻止
        • 5.3-8借助 Google 搜索进行网站测试的最佳做法
      • 5.4针对特定内容的指南
        • 5.4-1Google图片最佳做法
        • 5.4-2Google视频最佳做法
        • 5.4-3Google有关富媒体文件的最佳做法
        • 5.4-4与 Google 搜索中的 AMP 网页相关的准则
        • 5.4-5AJAX增强型网站
        • 5.4-6关于 AJAX 的常见问题解答
        • 5.4-7Google 搜索提供的 COVID-19 资源和提示
      • 5.5网站页面质量指南
        • 5.5-1自动生成的内容
        • 5.5-2欺骗性重定向
        • 5.5-3链接方案
        • 5.5-4付费链接
        • 5.5-5伪装真实内容
        • 5.5-6隐藏文字和链接
        • 5.5-7门页
        • 5.5-8抄袭内容
        • 5.5-9联属计划
        • 5.5-10不相关的关键字(关键字堆砌)
        • 5.5-11创建会执行恶意行为的网页
        • 5.5-12用户生成的垃圾内容
        • 5.5-13阻止垃圾评论的方法
        • 5.5-14举报网络垃圾、付费链接或恶意软件
    • 6.控制抓取和索引编制
      • 6.01抓取和索引编制主题概览(目录)
      • 6.02编入索引简介
      • 6.03创建网址列表
      • 6.04向 Google 提交网址
      • 6.07从 Google 中移除信息
      • 6.08暂停在线商家
      • 6.09整合重复网址
      • 6.10创建自定义 404 网页
      • 6.11转移、移动或迁移网站
      • 6.13Google 可以识别的特殊标记
      • 6.14漫游器元标记、data-nosnippet 和 X-Robots-Tag 规范
      • 6.15管理抓取速度:请求 Google 重新抓取您的网址和减慢 Googlebot 的抓取速度
      • 6.05管理站点地图
        • 6.5-1了解站点地图
        • 6.5-2创建和提交站点地图
        • 6.5-3拆分较大的站点地图
        • 6.5-4视频Sitemap及其替代方案
        • 6.5-5图片站点地图
        • 6.5-6创建 Google 新闻站点地图
      • 6.06阻止访问您的内容
        • 6.6-1阻止访问您的内容
        • 6.6-2控制与 Google 分享的内容
        • 6.6-3使用”noindex”阻止搜索引擎编入索引
        • 6.6-4.1通过 robots.txt 阻止访问-robots.txt 简介
        • 6.6-4.2创建 robots.txt 文件
        • 6.6-4.3向 Google 提交更新后的 robots.txt
        • 6.6-4.4有关漫游器robots.txt的常见问题解答
        • 6.6-4.5Robots.txt 规范
        • 6.6-5阻止您页面上的图片出现在搜索结果中
      • 6.12管理多区域和多语言网站
        • 6.12-1管理多区域和多语言网站
        • 6.12-2将网页的本地化版本告知 Google
        • 6.12-3Google 如何抓取语言区域自适应网页
        • 6.12-4跨语言搜索结果
      • 6.16Google 抓取工具
        • 6.16-1Google 抓取工具(用户代理)概览
        • 6.16-2谷歌机器人Googlebot
        • 6.16-3Google Read Aloud 用户代理
        • 6.16-4APIs-Google 用户代理
        • 6.16-5Feedfetcher
        • 6.16-6网页上的 Duplex”用户代理
        • 6.16-7验证 Googlebot
      • 6.17管理JavaScript内容
        • 6.17-1了解 JavaScript SEO 基础知识
        • 6.17-2解决与 Google 搜索相关的 JavaScript 问题
        • 6.17-3修正延迟加载的内容
        • 6.17-4实现动态呈现
    • 7.更改搜索结果呈现
      • 7.1搜索结果呈现主题概览
      • 7.2控制搜索结果中的标题链接
      • 7.4为网站启用搜索结果功能
      • 7.3控制搜索结果中的摘要
      • 7.5精选摘要和您的网站
      • 7.6站点链接
      • 7.7向 Google 搜索提供发布日期
      • 7.8定义要在搜索结果中显示的网站图标
View Categories
  • 首页
  • 谷歌SEO优化官方文档
  • Google搜索引擎优化 (SEO) 指南(旧版)
  • Google高级SEO
  • 6.控制抓取和索引编制

6.14漫游器元标记、data-nosnippet 和 X-Robots-Tag 规范

摘要 #

本文档详细介绍了如何使用网页级和文本级设置调整 Google 在搜索结果中呈现内容的方式。您可以向 HTML 网页或在 HTTP 标头中添加元标记,这样就可以指定网页级设置。您还可以使用网页中 HTML 元素上的 data- nosnippet 属性指定文本级设置。

请注意,只有在抓取工具可以访问包含这些设置的网页时,系统才会读取和遵循这些设置。<meta name=”robots” content=”noindex” /> 标记或指令适用于搜索引擎抓取工具。如需屏蔽非搜索抓取工具(例如 AdsBot-Google),您可能需要添加针对具体抓取工具的指令(例如 <meta name=”AdsBot-Google” content=”noindex” />)。

使用漫游器元标记 #

有了漫游器元标记,您可以使用精细的网页级设置,控制如何将各个网页编入索引并在 Google 搜索结果中显示给用户。请将漫游器元标记放在给定网页的 <head> 部分,如下所示:

<!DOCTYPE html>
<html><head>
<meta name="robots" content="noindex" />
(…)
</head>
<body>(…)</body>
</html>

上述示例中的漫游器元标记可指示搜索引擎不要在搜索结果中显示相应网页。name 属性的值 (robots) 指定这个指令可以用于所有抓取工具。如需针对特定的抓取工具,请把 name 属性的 robots 值替换为这个抓取工具的名称。具体的抓取工具也称为用户代理(抓取工具使用其用户代理请求网页)。Google 的标准网页抓取工具的用户代理名称为 Googlebot。如果您只想阻止 Googlebot 将您的网页编入索引,请按如下所示更新标记:

<meta name="googlebot" content="noindex" />

该标记现在会明确地指示 Google 不要在 Google 搜索结果中显示此网页。name 和 content 属性都不区分大小写。

搜索引擎可能会针对不同资源或出于不同目的而使用不同的抓取工具。有关详情,请参阅 Google 抓取工具完整列表。例如,如果想让某个网页显示在 Google 的网页搜索结果中,但不显示在 Google 新闻中,可以使用以下元标记:

<meta name="googlebot-news" content="noindex" />

如果要分别指定多个抓取工具,请使用多个漫游器元标记:

<meta name="googlebot" content="noindex">
<meta name="googlebot-news" content="nosnippet">

使用 X-Robots-Tag HTTP 标头 #

对于指定的网址,X-Robots-Tag 可以用作 HTTP 标头响应中的一个元素。任何指令只要能够在漫游器元标记中使用,都可以指定为 X-Robots-Tag。下面是一个 HTTP 响应示例,它含有一个 X-Robots-Tag,用来指示抓取工具不要将某一网页编入索引:

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)

您可以在 HTTP 响应中组合使用多个 X-Robots-Tag 标头,也可以指定一系列以英文逗号分隔的指令。下面是一个 HTTP 标头响应示例,它组合使用了 noarchive X-Robots-Tag 和 unavailable_after X-Robots-Tag。

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noarchive
X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST
(…)

X-Robots-Tag 也可以在指令前面指定用户代理。例如,下面这组 X-Robots-Tag HTTP 标头可以用于有条件地允许某一网页在不同搜索引擎的搜索结果中显示:

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: googlebot: nofollow
X-Robots-Tag: otherbot: noindex, nofollow
(…)

指令如果没有指定用户代理,那么对所有抓取工具都有效。HTTP 标头、用户代理名称和指定的值都不区分大小写。

有冲突的漫游器指令:如果漫游器指令存在冲突,那么系统会采用限制较为严格的指令。例如,如果某个网页同时包含 max-snippet:50 和 nosnippet 指令,那么系统会采用 nosnippet 指令。

有效的索引编制指令和内容显示指令 #

您可以将以下指令与漫游器元标记和 X-Robots-Tag 搭配使用,以控制摘要的索引编制和显示。在搜索结果中,摘要是一个简短的文本摘录,它表明了文档与用户查询的相关性。下表中列出了 Google 支持的所有指令,还有它们各自的含义。每个值代表一个特定的指令。您可以将多个指令合并为一个以英文逗号分隔的列表。这些指令不区分大小写。

其他搜索引擎可能不会以相同方式处理这些指令。
指令

all

对索引编制或内容显示无任何限制。该指令为默认值,因此明确列出时并无任何效果。

noindex

不在搜索结果中显示该网页。

若要从 Google 中移除信息,请按照我们的分步指南操作。

nofollow

不追踪该网页上的链接。
none 等同于 noindex, nofollow。

noarchive

不在搜索结果中显示缓存链接。

nosnippet

不在搜索结果中显示该网页的文本摘要或视频预览。如果有静态图片缩略图,而且它能够实现更好的用户体验,那么系统仍可能显示这类缩略图。 这适用于所有形式的搜索结果(Google 网页搜索、Google 图片、“探索”专区)。

max-snippet:[number]

在该搜索结果的文本摘要中,最多只能使用 [number] 个字符(请注意,网址可能会在搜索结果页中显示为多个搜索结果)。这并不会影响图片或视频预览。此限制适用于所有形式的搜索结果,例如 Google 网页搜索、Google 图片、“探索”专区和 Google 助理。 但是,如果发布商已单独授予内容使用权限,则此限制不适用。例如,如果发布商以页内结构化数据的形式提供内容,或者与 Google 签订了许可协议,那么此设置不会妨碍那些更具体的允许用途。如果没有指定可解析的 [number],此指令会被忽略。特殊值:0:不会显示任何摘要。等同于 nosnippet。-1:Google 会选择其认为最有助于用户发现您的内容并将用户定向到您网站的摘要长度。示例:

<meta name="robots" content="max-snippet:20">
max-image-preview:[setting] 对于此网页在搜索结果中的图片预览,设置尺寸上限。

接受的 setting 值:

none:不会显示图片预览。

standard:可能会显示默认图片预览。

large:可能会显示较大的图片预览,最高达到视口宽度。

这适用于所有形式的搜索结果,例如 Google 网页搜索、Google 图片、“探索”专区和 Google 助理。但是,如果发布商已单独授予内容使用权限,则此限制不适用。例如,如果发布商以页内结构化数据的形式提供内容(例如 AMP 网页和规范版本的文章),或与 Google 签订了许可协议,那么此设置不会妨碍那些更具体的允许用途。

如果发布商不希望 Google 将其 AMP 网页和规范版本的文章显示在搜索结果页或“探索”专区中时使用较大的缩略图,则应将 max-image-preview 的值指定为 standard 或 none。

示例:

<meta name="robots" content="max-image-preview:standard">
max-video-preview:[number] 此网页上的视频在搜索结果中的视频摘要时长不得超过 [number] 秒。

其他支持的值:

0:根据 max-image-preview 设置,最多只能使用静态图片。

-1:没有限制。

这适用于所有形式的搜索结果,例如 Google 网页搜索、Google 图片、Google 视频、“探索”专区和 Google 助理。如果没有指定可解析的 [number],此指令会被忽略。

示例:

<meta name="robots" content="max-video-preview:-1">

notranslate

不在搜索结果中提供该网页的译文。

noimageindex

不将该网页上的图片编入索引。

unavailable_after: [date/time]

在指定日期/时间过后,不在搜索结果中显示该网页。日期和时间必须以广泛采用的格式指定,包括但不限于 RFC 822、RFC 850 和 ISO 8601。 如果没有指定有效的 [date/time],此指令会被忽略。默认情况下,内容没有失效日期。

示例:

<meta name="robots" content="unavailable_after: 2020-09-21">

如何处理合并的索引编制指令和内容显示指令 #

您可以将多个以英文逗号分隔的漫游器元标记指令合并起来,创建一条包含多个指令的命令。下面是一个漫游器元标记示例,它会指示网页抓取工具不要将该网页编入索引,也不要抓取该网页上的任何链接:

<meta name="robots" content="noindex, nofollow">

下面的示例会将文本摘要长度限制为 20 个字符,并允许大图片预览:

<meta name="robots" content="max-snippet:20, max-image-preview:large">

如果您指定了多个抓取工具,并且不同的工具对应不同的指令,那么搜索引擎会综合使用所有的否定指令。例如:

<meta name="robots" content="nofollow">
<meta name="googlebot" content="noindex">

Googlebot 在抓取包含这些元标记的网页时,会将它们视为拥有 noindex, nofollow 指令。

使用 data-nosnippet HTML 属性 #

您可以指定不要使用 HTML 网页的哪些文字部分来产生摘要。您可以使用 span、div 和 section 元素中的 data-nosnippet HTML 属性,在 HTML 元素级别上实现这一点。data-nosnippet 被视为布尔属性,无论是否有值,都是有效的。为了确保机器能读懂,HTML 部分必须是有效的 HTML,并且所有标记都有对应的结束标记。

示例:

<p>This text can be shown in a snippet
 <span data-nosnippet>and this part would not be shown</span>.</p>

<div data-nosnippet>not in snippet</div>
<div data-nosnippet="true">also not in snippet</div>

<div data-nosnippet>some text</html>
<!-- unclosed "div" will include all content afterwards -->

<mytag data-nosnippet>some text</mytag>
<!-- NOT VALID: not a span, div, or section -->

Google 通常会渲染网页,以便将它编入索引,但无法保证一定会渲染。因此,在渲染之前和之后都可能会提取 data-nosnippet。为避免渲染的不确定性,请不要通过 JavaScript 添加或移除现有节点的 data-nosnippet 属性。通过 JavaScript 添加 DOM 元素时,请在最初向网页的 DOM 添加该元素时根据需要来包含 data-nosnippet 属性。如果使用了自定义元素,并且您需要使用 data- nosnippet,请通过 div、span 或 section 元素封装或渲染它们。

使用结构化数据 #

漫游器元标记会控制 Google 自动从网页中提取并显示为搜索结果的内容量。但是,很多发布商也使用 schema.org 结构化数据为搜索呈现提供具体信息。漫游器元标记限制不会影响该结构化数据的使用,但为其他广告素材指定的结构化数据的 article.description 和 description 值除外。如需根据这些 description 值指定预览的最大长度,请使用 max-snippet 漫游器元标记。例如,即使文本预览会受到限制,页面上的 recipe 结构化数据也可以包含在食谱轮播界面中。您可以使用 max-snippet 限制文本预览的长度,但是在使用结构化数据提供信息以获得富媒体搜索结果时,系统不会使用此漫游器元标记。

如需管理在网页中使用结构化数据的方式,请修改结构化数据类型和值本身,添加或移除信息,以便只提供您想提供给 Google 的数据。另外还请注意,在 data-nosnippet 元素内声明结构化数据后,这些数据仍然可以用于显示搜索结果。

X-Robots-Tag 的实际实现 #

您可以通过网站的网络服务器软件的配置文件将 X-Robots-Tag 添加到网站的 HTTP 响应中。例如,在基于 Apache 的网络服务器上,您可以使用 .htaccess 和 httpd.conf 文件。在 HTTP 响应中使用 X-Robots-Tag 的好处是,您可以指定要应用于整个网站的抓取指令。系统支持正则表达式,因此带来了很高的灵活性。

例如,如需在整个网站的所有 .PDF 文件的 HTTP 响应中添加 noindex, nofollow X-Robots-Tag,请将以下代码段添加到网站的根目录 .htaccess 文件或 httpd.conf 文件中(在 Apache 上),或者网站的 .conf 文件中(在 NGINX 上)

Apache:

<Files ~ ".pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>

NGINX:

location ~* .pdf$ {
  add_header X-Robots-Tag "noindex, nofollow";
}

对于无法在 HTML 中使用漫游器元标记的非 HTML 文件(如图片文件),您可以使用 X-Robots-Tag。下面的示例说明了如何针对整个网站上的图片文件(.png、.jpeg、.jpg、.gif)添加 noindex X-Robots-Tag 指令:

Apache:

<Files ~ ".(png|jpe?g|gif)$">
  Header set X-Robots-Tag "noindex"
</Files>

NGINX:

location ~* .(png|jpe?g|gif)$ {
  add_header X-Robots-Tag "noindex";
}

如何组合使用抓取指令与索引编制/内容显示指令 #

只有当网址被抓取时,漫游器元标记和 X-Robots-Tag HTTP 标头才会被抓取工具发现。如果您通过 robots.txt 文件禁止抓取某一网页,那么抓取工具就不会找到任何关于索引编制/内容显示指令的信息,因此会忽略这些信息。如果必须遵循索引编制/内容显示指令,那么您不能禁止抓取工具抓取包含这些指令的网址。

分享这篇文章 :
  • Facebook
  • X
  • LinkedIn
  • Pinterest
更新 2021年1月21日

暂无评论

再想想
暂无评论...
文档目录
  • 摘要
  • 使用漫游器元标记
  • 使用 X-Robots-Tag HTTP 标头
  • 有效的索引编制指令和内容显示指令
  • 如何处理合并的索引编制指令和内容显示指令
  • 使用 data-nosnippet HTML 属性
  • 使用结构化数据
  • X-Robots-Tag 的实际实现
  • 如何组合使用抓取指令与索引编制/内容显示指令
SEO算法教程

Copyright © 2021 SEO工具导航 粤ICP备15089945号-7 粤公网安备 44098102441079号

  
常用
搜索
工具
社区
生活
    热门推荐: