网站运营
位置:首页>> 网站运营>> 谷歌搜索引擎对Flash 文件的索引问题探讨

谷歌搜索引擎对Flash 文件的索引问题探讨

作者:佚名 来源:谷歌网站管理员博客 发布时间:2009-02-01 13:27:00 

标签:


问:目前哪些 Flash 文件能更好地被谷歌索引到呢?

我们改善了对所有类型 SWF 文件中的文字内容的索引能力,其中包括像按钮或菜单这样的 Flash “小工具”,独立自成一体的 Flash 网站,以及所有介于两者之间的 Flash 形式。

问:这些 Flash 文件中的哪些内容能被谷歌更好地索引呢?

用户在与您的 Flash 文件互动过程中所看到的一切文本内容都将得到更好地索引。如果您的网站包含 Flash ,其中的文字内容会被 Google 用来生成您网站的摘要。同时,出现在 Flash 文件中的文字可以用来匹配用户在 Google 搜索框中输入的搜索查询。

除了索引 Flash 文件中的文本内容,我们现在也能够识别在 Flash 文件中的出现的 URL ,并且把这些链接纳入搜索引擎机器人爬行的目标队列中,就像对待那些非 Flash 网页中出现的 URL 一样。例如,如果您的 Flash 应用程序中包含指向您网站内部页面的链接,Google 现在能够更好地发现并抓取您的网站。

问:那么 Flash 文件中包含的非文本内容呢,比如图片?

目前,我们只能识别和索引 Flash 文件中的文本内容。如果您的 Flash 文件里只有图片,我们将不能识别和索引出现在这些图片中的任何文字。类似地,如果一个 Flash 按钮没有任何附属的文字的话,我们将无法对这类指向特定链接的 Flash 按钮生成任何錨文本。

还应注意到的是,我们无法索引 FLV 文件,比如在 YouTube 上播放的视频,因为这些文件没有包含任何文字元素。

问:Google 是怎样识别 Flash 文件里的内容呢?

我们开发出了一种算法,这种算法可以使 Google 机器人能够模仿人类通过点击按钮、输入内容等方式来了解 Flash 文件。我们的算法能够记住沿途它遇到的所有文字内容,其后这些内容都能被索引到。我们无法告诉您更多的保密细节,但是我们可以告诉您,通过使用 Adobe 的新型可检索性 SWF 数据库,这种算法的有效性得到了进一步提高。

问:我怎样做才能使 Google 索引到我的 Flash 文件中出现的文本呢?

基本上,您不需要做任何事情。我们已经取得的技术改进,使这项功能的实现,无需网页设计者或网站管理员做任何特别的操作。如果您的网站上有 Flash 内容,我们会在现有技术能力的基础上,尽最大能力对它们自动进行索引(详见接下来的问题)。

也就是说,您应该了解 Google 现在已经可以识别那些展现在您网站访问者面前的文字信息。如果你希望 Google 忽略一些次要内容,如“版权”或“加载”等信息,您可以考虑把那些文本替换为图片,这样它们就不会被我们抓取到了。

问:在索引 Flash 文件上,Google 遇到的主要技术难题是什么?

目前的问题主要体现在三个方面,这也正是我们在努力解决的:

1、Googlebot 不能执行某些类型的 JavaScript 程序。因此,如果您的网页通过 JavaScript 加载 Flash 文件的话,Google 可能无法识别该 Flash 文件,在这种情况下,它将不会被索引到。

2、目前,我们还无法把那些通过您的 Flash 文件加载的外来内容和您的 Flash 文件整合起来。也就是说,如果您的 Flash 文件加载了一个 HTML文件,或一个 XML 文件,或另一个 SWF 文件等等,Google 将分别索引这些资源,但是它们将不会被认为是您 Flash 文件内容的一部分。

3、虽然我们能够索引在网络上出现的几乎所有语种的 Flash ,但在识别用双向语言书写的 Flash 内容还有一定困难。在这个问题解决之前,我们将无法识别和索引 Flash 文件中的希伯来文或阿拉伯文的内容。

但是,在这些问题上我们也已经取得了相当的进展,所以,敬请期待我们进一步的改进!

0
投稿

猜你喜欢

  • 一,什么是WordPress QI?WordPress QI是一个单独的WordPress的安装文件,WordPress QI最大的两个特点
  • Discuz!7.0.0 作为目前优秀的社区产品,越来越多的得到站长的青睐,其中一个很重要的原因就是可调控性较强,站长可以根据自己的特点调整
  • 做seo优化,友情链接的整站链接和只是首页链接是有很大区别的。会分散权重。很多常见wordpress主题模板,都是设置全站友情链接的,所以我
  • 本文将为大家介绍SOFTETHER服务器Linux版的环境要求,安装方法,启动方法,以及运营/管理方法。1)工作环境要求Linux版Soft
  • 你是否遭遇过这样的情况?当你在浏览器中输入正确的URL地址,但是打开的并不是你想要去的网站。它可能是114的查询页面,可能是一个广告页面,更
  • 7月28日消息,有网游爆料称QQ最新版 2010SP1(版本号1760)有巨大漏洞,发送代码之后,打开聊天记录就可以执行。TechWeb从
  • 目前很多企业单位正在构架自己的Intranet,FTP服务器是其中的一个服务支持,有很多单位购置了基于UNIX平台的计算机,为了在网上能够提
  • Fatcow是一家创始于1998年的老牌虚拟主机服务商,它有一个非常有趣而且易记的名字“肥牛”,并且它的机房使用的是100%的风能发的电,是
  • 发布日期:2007-09-19更新日期:2007-09-19受影响系统:Dibbler Dibbler 0.6不受影响系统:Dibbler
  • 前几天在网上看到这篇文章觉得挺有用的,就转载过来与大家一起分享一下!下面的要点可以让你仅仅依靠Google,在一年的时间里,打造一个成功的网
  • 种种迹象表明百度Hi马上就要公测了,相信在不久的几天大家就可以共同使用了,作为意外可以登录百度Hi而的用户,还是先做个比较详细的图解让大家看
  • 很多热门论坛都会给会员提供FTP资源下载,达到一定等级的会员就可以免费登录这些FTP服务器下载诸多共享资源,如影视、技术资料、常用大型工具软
  • UCenter Home是Comsenz公司发布的一款SNS建站系统,目前最新版本是1.5。用户栏目功能是UCenter Home中用于丰富
  • 最近跟一些站长交流了一下,根据他们及网络和自己的一些总结,归纳了合格站长应具备的基本条件,这几天也一直为自己的论坛忙的不可开胶,也一直在找关
  • 10月27日消息,阿里巴巴CEO马云在《纽约时报》发表署名文章,就如何支持小企业等问题进行了阐述,以下是全文:全球经济衰退的来袭令许多国际企
  • 做站长已经有好几年了,每次都在失望中结束。经过一番冷静思考以后,才知道经营网站不是想象的那么容易,一是需要下功夫,二是需要坚持。下功夫是要懂
  • 忍痛割爱关掉自己的论坛做了一年的地方论坛,今天亲手关闭了,顺便讲点心得。做地方论坛,每天要忍受着各个方面的压力,我已经不堪重负,虽然做了一年
  • 其实这个问题只要将请求网页HTTP内容明白就好解决.请求HTTP头内容如下:GET 你的网址 HTTP/1.1Accept: image/g
  • DHCP概述1 采用DHCP的必要性在TCP/IP网络上,每台工作站要能存取网络上的资源之前,都必须进行基本的网络配置,一些主要参数诸如IP
  • 1.UPS(不间断电源)的使用问题某商店正在压榨它的网络系统的最后生命。尽管那台很老的服务器几乎难以满足商店运营的需要,但经营者甚至连更换U
手机版 网站运营 asp之家 www.aspxhome.com