Google 可以将大多数类型的网页和文件编入索引。以下是关于特定富媒体类型的一些具体做法:
一般性最佳做法 #
如果您确实计划在网站上使用富媒体,可以参阅下面的建议,以避免出现问题。
尽量只在需要时使用富媒体。我们建议您对内容和导航使用 HTML。
提供网页的文本版本。如果您的首页使用了非 HTML 的启动画面,请确保在该首页上提供一个常规 HTML 链接指向基于文本的网页,以便用户(或 Googlebot)无需富媒体也能浏览您的网站。
一般情况下,搜索引擎会根据文本进行搜索。这意味着您的内容需采用文本格式才能被抓取并编入索引(Google 现在可以将 Flash 文件中包含的文本内容编入索引,但其他搜索引擎可能不行)。
这并不是说您的网站中不能包含 Flash、Silverlight 或视频等富媒体内容,而是意味着您嵌入这些文件中的任何内容也应通过文本格式提供,否则搜索引擎可能无法访问这些内容。以下示例集中介绍非文本内容的最常见类型,但对于其他任何类型的内容,指南中的要求都是相似的:需要为所有非文本文件提供对应的文本格式内容。(另外请注意,大多数移动浏览器已不再支持 Flash。)
这不仅会提高 Googlebot 抓取内容并将其编入索引的成功率,同时也会使内容更便于访问。很多人(比如有视觉障碍的用户、使用屏幕阅读器的用户或带宽较低的用户)无法看到网页上的图片,因此如果您提供了对应的文本内容,就可以拓宽受众群体。
视频 #
请查看有关视频的最佳做法。
Iframe #
Iframe 有时用于在网页上显示内容。通过 iframe 显示的内容可能不会被编入索引,也可能不会在 Google 的搜索结果中显示。因此,我们建议您避免使用 iframe 显示内容。如果您的网站中使用了 iframe,请务必额外提供基于文本的链接以指向 iframe 所显示的内容,以便 Googlebot 能够抓取这些内容并将其编入索引。
Flash #
Googlebot 几乎可将用户与您网站上的任意 Flash SWF 文件互动时看到的任意文本编入索引,并使用这些文字生成摘要,或与 Google 搜索中的查询字词匹配。另外,Googlebot 还可以发现 SWF 文件中的网址(例如,指向您网站上其他网页的链接),并跟踪这些链接。
我们抓取此类内容并将其编入索引的方式与我们抓取您网站上其他类型内容并将其编入索引的方式相同,您无需执行任何特殊操作。然而,我们不保证将抓取所有内容(Flash 或其他)并将所有内容编入索引。
如果 SWF 文件加载其他一些文件(无论是文本、HTML、XML、其他 SWF 等)的内容,Google 也可以将此外部内容编入索引,并将其与父 SWF 文件及其嵌入到的任何文档相关联。
我们一直在努力改进 Flash 文件的编入索引过程,但目前仍存在一些限制。例如,我们目前无法将 Flash 文件中的双向语言内容(如希伯来语或阿拉伯语)编入索引。
请注意,虽然 Google 可以将 Flash 文件的内容编入索引,但其他搜索引擎可能不行。因此,我们建议您将 Falsh 等富媒体技术主要用于装饰目的,而针对内容和导航使用 HTML。这不但可以让您的网站更便于抓取工具处理,也能让它获得更多的受众群体,包括如因视力障碍需使用屏幕读取器的用户、使用较早版本或非标准浏览器的用户,以及带宽有限或较低的用户(如手机或移动设备用户)。好处还不止这些,将 HTML 用于导航时,用户可为内容添加书签并可通过电子邮件发送直接链接。
您还可以考虑使用 sIFR (Scalable Inman Flash Replacement) 技术。sIFR 是一个开源项目,可让网站所有者使用对等的 Flash 内容替换文本元素。使用该技术,内容和导航由嵌入的 Flash 对象显示,但由于内容包含在 HTML 源文件中,非 Flash 用户(包括搜索引擎)也可以读取。