网页flash抓取视频(哪些Flash文件能更好地被谷歌索引到呢?(组图))
优采云 发布时间: 2021-11-23 23:17网页flash抓取视频(哪些Flash文件能更好地被谷歌索引到呢?(组图))
核心提示:索引团队的软件工程师 Ron Adler 和 Janis Stipins 将就我们最近在 Flash 文件索引方面的改进与您进行更深入的讨论和交流。
问:目前哪些 Flash 文件更适合被 Google 索引?
我们改进了在所有类型的 SWF 文件中索引文本内容的能力,包括按钮或菜单之类的 Flash“小工具”、独立的 Flash 网站 以及介于 Flash 形式之间的所有内容。
问:Google 可以更好地索引这些 Flash 文件中的哪些?
用户在与您的 Flash 文件交互时看到的所有文本内容都将被更好地编入索引。如果您的 网站 收录 Flash,Google 将使用其中的文本内容来生成您的 网站 的摘要。同时,Flash 文件中出现的文本可用于匹配用户在 Google 搜索框中输入的搜索查询。
除了索引 Flash 文件中的文本内容,我们现在还可以识别出现在 Flash 文件中的 URL,并将这些链接收录在搜索引擎机器人抓取的目标队列中,就像出现在非 Flash 网页中的 URL 一样。例如,如果您的 Flash 应用程序收录指向您的 网站 内部页面的链接,Google 现在将能够更好地发现和抓取您的 网站。
问:Flash 文件中收录的非文本内容(例如图片)如何处理?
目前,我们只能识别和索引 Flash 文件中的文本内容。如果您的 Flash 文件中只有图片,我们将无法识别这些图片中出现的任何文本并为其编制索引。同样,如果 Flash 按钮没有任何附加文本,我们将无法为此类 Flash 按钮生成任何指向特定链接的锚文本。
还应该注意的是,我们无法索引 FLV 文件,例如在 YouTube 上播放的视频,因为这些文件不收录任何文本元素。
问:Google 如何识别 Flash 文件中的内容?
我们开发了一种算法,可以让谷歌机器人模仿人类通过点击按钮、输入内容等方式来理解Flash文件。我们的算法可以记住一路上遇到的所有文本内容,然后将这些内容编入索引。我们不能告诉你更多的机密细节,但我们可以告诉你,通过使用 Adobe 新的可搜索 SWF 数据库,该算法的有效性得到了进一步的提高。
问:如何让 Google 索引出现在我的 Flash 文件中的文本?
基本上,您无需执行任何操作。我们所做的技术改进使该功能无需网页设计师或网站 管理员的任何特殊操作即可实现。如果您的 网站 上有 Flash 内容,我们将尽最大努力根据现有技术能力自动索引它们(详情请参阅下一个问题)。
换句话说,您应该明白 Google 现在可以识别显示给您的 网站 访问者的短信。如果您希望 Google 忽略某些次要内容,例如“版权”或“正在加载”信息,您可以考虑将这些文字替换为图片,这样我们就不会抓取它们。
问:Google 在索引 Flash 文件时遇到的主要技术问题是什么?
当前的问题主要体现在三个方面,这正是我们正在努力解决的问题:
1、Googlebot 无法执行某些类型的 JavaScript 程序。因此,如果您的网页通过 JavaScript 加载 Flash 文件,Google 可能无法识别该 Flash 文件,在这种情况下,它不会被编入索引。
2、目前,我们无法将通过您的 Flash 文件加载的外部内容与您的 Flash 文件集成。换句话说,如果您的 Flash 文件加载了一个 HTML 文件、一个 XML 文件或另一个 SWF 文件等,Google 会将这些资源单独编入索引,但它们不会被视为您的 Flash 文件内容的一部分。
3、虽然我们可以索引几乎所有出现在互联网上的语言的Flash,但仍然很难识别用两种语言编写的Flash内容。在此问题得到解决之前,我们将无法识别 Flash 文件中的希伯来语或阿拉伯语内容并将其编入索引。
但是,我们已经在这些问题上取得了长足的进步,敬请期待我们的进一步改进!