谷歌搜索引擎对Flash 文件的索引问题探讨
作者:佚名 来源:谷歌网站管理员博客 发布时间:2009-02-01 13:27:00
问:目前哪些 Flash 文件能更好地被谷歌索引到呢?
我们改善了对所有类型 SWF 文件中的文字内容的索引能力,其中包括像按钮或菜单这样的 Flash “小工具”,独立自成一体的 Flash 网站,以及所有介于两者之间的 Flash 形式。
问:这些 Flash 文件中的哪些内容能被谷歌更好地索引呢?
用户在与您的 Flash 文件互动过程中所看到的一切文本内容都将得到更好地索引。如果您的网站包含 Flash ,其中的文字内容会被 Google 用来生成您网站的摘要。同时,出现在 Flash 文件中的文字可以用来匹配用户在 Google 搜索框中输入的搜索查询。
除了索引 Flash 文件中的文本内容,我们现在也能够识别在 Flash 文件中的出现的 URL ,并且把这些链接纳入搜索引擎机器人爬行的目标队列中,就像对待那些非 Flash 网页中出现的 URL 一样。例如,如果您的 Flash 应用程序中包含指向您网站内部页面的链接,Google 现在能够更好地发现并抓取您的网站。
问:那么 Flash 文件中包含的非文本内容呢,比如图片?
目前,我们只能识别和索引 Flash 文件中的文本内容。如果您的 Flash 文件里只有图片,我们将不能识别和索引出现在这些图片中的任何文字。类似地,如果一个 Flash 按钮没有任何附属的文字的话,我们将无法对这类指向特定链接的 Flash 按钮生成任何錨文本。
还应注意到的是,我们无法索引 FLV 文件,比如在 YouTube 上播放的视频,因为这些文件没有包含任何文字元素。
问:Google 是怎样识别 Flash 文件里的内容呢?
我们开发出了一种算法,这种算法可以使 Google 机器人能够模仿人类通过点击按钮、输入内容等方式来了解 Flash 文件。我们的算法能够记住沿途它遇到的所有文字内容,其后这些内容都能被索引到。我们无法告诉您更多的保密细节,但是我们可以告诉您,通过使用 Adobe 的新型可检索性 SWF 数据库,这种算法的有效性得到了进一步提高。
问:我怎样做才能使 Google 索引到我的 Flash 文件中出现的文本呢?
基本上,您不需要做任何事情。我们已经取得的技术改进,使这项功能的实现,无需网页设计者或网站管理员做任何特别的操作。如果您的网站上有 Flash 内容,我们会在现有技术能力的基础上,尽最大能力对它们自动进行索引(详见接下来的问题)。
也就是说,您应该了解 Google 现在已经可以识别那些展现在您网站访问者面前的文字信息。如果你希望 Google 忽略一些次要内容,如“版权”或“加载”等信息,您可以考虑把那些文本替换为图片,这样它们就不会被我们抓取到了。
问:在索引 Flash 文件上,Google 遇到的主要技术难题是什么?
目前的问题主要体现在三个方面,这也正是我们在努力解决的:
1、Googlebot 不能执行某些类型的 JavaScript 程序。因此,如果您的网页通过 JavaScript 加载 Flash 文件的话,Google 可能无法识别该 Flash 文件,在这种情况下,它将不会被索引到。
2、目前,我们还无法把那些通过您的 Flash 文件加载的外来内容和您的 Flash 文件整合起来。也就是说,如果您的 Flash 文件加载了一个 HTML文件,或一个 XML 文件,或另一个 SWF 文件等等,Google 将分别索引这些资源,但是它们将不会被认为是您 Flash 文件内容的一部分。
3、虽然我们能够索引在网络上出现的几乎所有语种的 Flash ,但在识别用双向语言书写的 Flash 内容还有一定困难。在这个问题解决之前,我们将无法识别和索引 Flash 文件中的希伯来文或阿拉伯文的内容。
但是,在这些问题上我们也已经取得了相当的进展,所以,敬请期待我们进一步的改进!


猜你喜欢
- typecho 是一个轻量级的PHP博客程序,猫一直在用,试了一下,挺有亲和力,后台界面是我喜欢的那种,代码也很简洁易读,速度比WP相比,一
- 背景我本来是要在VMware 官方download 一个6.7的Vcenter,但是除了VMware-VCSA-all-6.7 还看到一个
- 什么是黑帽SEO 笼统的说,所有使用作弊手段或可疑手段的,都可以称为黑帽SEO。比如说垃圾链接,隐藏网页,桥页,关键词堆砌等等。近一两年,最
- Win2K操作系统的一个主要特色就是将IIS融入其内核之中,并提供一些用来配置和维护软件的向导工具,使构建一个Internet网站轻松易得。
- 最近陆陆续续有不少园友加我好友咨询 redis 集群搭建的问题,我觉得一定是之前写的这篇 《基于Docker的Redis集群搭建》 文章有问
- Nginx发音为“ engine x”,是一种开源的高性能HTTP和反向代理服务器,负责处理Internet上一些最大站点的负载。它可用作H
- 当你在计划构建个人服务器时,应考虑一些相关因素:拟在服务器上提供的服务,相关服务软件推荐的硬件配置, 包括理器速度,硬盘大小,内存数量,你的
- 1.关键词在网站TITLE 上的使用2.关键词在Meta Description中的使用3.关键词在Meta Keywords 中的使用4.
- 10月21日消息,阿里巴巴B2B公司今日对外公布“中国中小企业商务服务伙伴计划”,与首批纳入计划的四家物流巨头签订战略合作协议,其中天天快递
- Apache需要设定成虚拟网站空间方式。新版SuSE的Apache已经改成模组化。所以只要修改几个档案就可以在建立帐号时,网站就对应的到位置
- DNS(Domain Name System)即域名系统是历史悠久的方法,它可以为具有IP地址的计算机分配域名,使计算机拥有字符型名称,如如
- 番茄花园事件发生后,一份其作者洪磊和“好友”的对话录音引起了关注。该录音中,洪磊详细解析了番茄花园的盈利模式以及和其他网站、软件合作的情况,
- 之前我通过百度经验上的过程来安装Ubuntu16,但是每次安装的时候没有什么问题,就是安装好了Tools,也设置好了共享文件夹,但是在路径:
- 首先要提到的是这里的内网是指一般我们网吧内部环境的内网,对局域网内网我没什么好说的,愿花钱的去DNS0755好了。一个基本条件:一个公网IP
- 北京时间10月14日上午消息,据国外媒体报道,消息人士透露,温思坦影业(Weinstein Company)准备将旗下富豪社交网络ASmal
- 问题背景:矿秘书网的历史遗留问题,刚开始由于各种问题,一些动态页面都是用了?id=参数的形式,对seo/seo.html" tar
- 400 无法解析此请求。 401.1 未经授权:访问由于凭据无效被拒绝。 401.2 未经授权: 访问由于服务器配置倾向使用替代身份验证方法
- 删除默认建立的站点的虚拟目录,停止默认web站点,删除对应的文件目录c:inetpub,配置所有站点的公共设置,设置好相关的连接数限制,带宽
- 国外有很多的主机商都只是提供Linux的服务器,我看了有不少站长其实也是需要Windows的服务器的,比如你的网站是ASP.NET或者是AS
- 简单的总结一下:一、原创的文字,围绕关键字优化,强烈建议在title里也加一下。这里的原创不是说纯自己写的就完事了,你还要搜索一下别人是不是