与谷歌机器人约会:关于状态代码节约带宽
作者:Chewy Trewhella 来源:谷歌网站管理员 发布时间:2009-02-06 08:58:00
我们与谷歌机器人的上一次约会棒极了,但网站们还对响应代码感到比较困惑,不知道自己返回的响应代码是否正确。我们的服务器返回了301永久重定向代码,但在什么情况下我们应该返回302临时重定向? 如果我们返回一些新的“404文件无法找到”代码,Googlebot是否不会再访问我们的网站?我们应该支持标头(header)“If-Modified-Since”吗?这些问题让人困惑不解,就好像懵懂的爱情一样。为了少一点诸如此类的烦恼,我们来问问专家——谷歌机器人,看看他怎样评价我们的响应代码。
亲爱的谷歌机器人,
我有一个问题。我生活在互联网中一个充满活力的地方,我不断改变对事物的看法。当你问我一个问题,我绝不会说出同一个答案两次,我的网站上的头条内容每个小时都在变化,我总会想到新的内容。你看起来像一个很直爽的人,希望得到直接的答案。当我的网站内容频繁更新的时候,我该怎么让你明白又不使你感到困惑呢? —Temp O’Rary
亲爱的Temp,
我刚刚告诉Jimmy通过301永久重定向来告知谷歌机器人你的新网址,但是你描述的情况则不同,应当适用于302临时重定向。对某一特定已经被索引的URL,如果你想告知你的用户该URL的地址是正确的,但是想访问的内容可以临时在另一个地址找到,那么使用302临时重定向(或更为罕见的“307临时重定向”)是一个既礼貌又妥当的方式。例如,Orkut将用户从http://orkut.com 重定向到http://google.com/accounts/login?service=orkut,但当检索Orkut*时,这个URL并不是一个具有实际检索价值的网页,而且是在另一个域名下。因此,使用302临时重定向可以告诉我,不要把属于http://orkut.com的内容和反向链接计算到重定向后的目标网址上——因为它只是一个临时页面。
这就是为什么当您搜索orkut时,您看到的是orkut.com,而不是那个更长的URL。
请记住:直接沟通是保持良好关系的关键。
你的朋友,
谷歌机器人
*请注意,在这里我把URL做了简化,使它更易读。实际的URL要远复杂于此。
谷歌机器人上尉,
我是一个经常重新设计和组织的网站。我注意到很多网站链接的URL都是我在很久以前就删掉的URL。我已经为这些已删除的URL设置了指向新URL的301永久重定向,但在这之后我又对网站做了重新设计,很多上述新的URL也不存在了,于是我又用301永久重定向来让它们指向更新的URL。现在我很担心,在抓取的时候,沿着这些指示,你很可能会不断地抓取到一连串的301重定向,而最终导致你可能放弃未来对我网站的抓取。 —Ethel Binky
亲爱的Ethel,
听起来好像你已经设置了很多嵌套重定向的URL。好吧,天哪!如果次数比较有限的话,这些“重复重定向”是可以被理解的,但我们或许应当首先思考一下你为什么要这样做。如果你把中间环节的301重定向统统移除,并将我直接引导到该URL的最终目标网址,你将为我们彼此节省大量的时间和HTTP请求。但是不要仅仅想到我们两个,想想其他访问者可能早已经厌倦了在状态栏中不断看到反复的“连接…加载…连接”的冗长过程。
设身处地地想一想,如果你的重定向开始看起来都相当长,用户们很可能担心你已经把他们推入到一个无限死循环中。机器人和人类都会害怕那种“无穷无尽的重复”。相反地,试着消除那些重复重定向,或至少保持他们尽可能短一些,我们就可以体谅一下广大访问者!
设想周到的谷歌网络机器人
亲爱的谷歌机器人,
我知道你一定是很喜欢我,要不然你就不会隔段时间就发出抓取我某一网页的请求,即使他们的内容从来没有改变过,就好像我的十年内都没有变化的大学论文一样。但是这些现在开始变成我的一个麻烦了,有什么办法可以帮助我不让你来占用我珍贵的带宽吗? —Janet Crinklenose
Janet, Janet, Janet,
看起来你应该学会一个新的名词——“304未修改”。如果我之前曾经访问过一个URL,那么我会在我的请求中插入一个“If-Modified-Since”。此行还包含一个HTTP格式的日期字符串。如果你不想再向我重复发送一遍该文档,那么你只需要向我发送一个正常的并带有“304未修改”状态的HTTP 标头。我很喜欢这样的信息。当你这么操作的时候,你没有必要再向我重复发送该文档,这就意味着你不用浪费你的带宽,而我也不会觉得你又在用老掉牙的重复内容糊弄我。
你很可能会注意到很多浏览器和代理服务器也会在标头上显示“ If-Modified-Since ”,你也可以这么做来抵制滥用带宽的行为。
现在就开始行动,节省更多的带宽吧!
谷歌机器人
谷歌机器人对我们真是太有帮助啦!现在我们知道应该怎样更好地响应用户和搜索引擎了。下次我们再相聚的时候,就该和这个老朋友坐下来促膝谈心了(与谷歌机器人的第三次约会即将发表,敬请关注!)。


猜你喜欢
- 对于一般的CMS用户,CMS系统默认的标签封装的越完整,使用越简单越受欢迎,但如果是个性化数据调用需求较多的用户,通常都会感觉系统内置的标签
- Ftp登陆不了是很经常碰到的事,很多人常常是不加分析就发贴询问。老实说,这样既浪费自己时间,又浪费别人精力,还常常不能得到满意的回答。因此每
- 网赚和经营小生意并没有什么不同,只要你用心经营和努力就获利的机会,但如果你不摆任何心思在网赚上,你要获利的机会就微乎其微。另外广开财源绝对是
- 在安装完VMware后,启动时可能会遇到一下问题: 出现这类问题的原因可能是之前安装过VMware,但是卸载后未将vmx86文件清
- 本人只是一个网络的小小草根,很像与大树平起平坐,但火候不够,在此发表一些自己的观点,希望站长朋友不要介意:网络发展迅猛异常,07年,中国的网
- winxp os: c:/windows/system32/drivers/etc/hosts add a line like : 127.
- 许多坛友常常问我,做Google adsense能赚多少钱?以前,我常这样回答,收入的多少与网站类型、内容有关,与访问量有关,还与广告是否经
- 核心提示:在搜索引擎优化上面,为使得效果更加明显,问题简单快速解决,大家对站点的静态化趋之若骛。然而对于一些大型网站,静态化带来的问题和后续
- 在前面的讲解(//www.jb51.net/article/97357.htm)中,我们已经在VMware虚拟机管理软件中,创建了一台虚拟的
- 今天向往常一样打开我的雅虎邮箱,看到一个标题是《phpwinds与贵站建议长期合作关系!》,phpwinds?是那个著名的php论坛吗?不过
- 前言最近工作中遇到一个需求,需要将程序的输出写到终端,同时写入文件,通过查找相关的资料,发现可以用 tee 命令实现,首先来解释一下 tee
- 以Fedora操作系统进行举例: 1)首次安装apache,在编译时增加——enable-rewrite选项。 如。/configure —
- 版主是论坛的一笔财富,没有出色的版主就没有优质的论坛。掌握了一定的论坛资源的版主,首先应该是一个管理者,其次是一个服务者,还应该是一个引导者
- 这样, root 就可以直接进入 Linux 主机了。不过,建议不要这样做。也可以在普通用户进入后,切换到root用户,拥有root的权限。
- 本文以Red Hat Enterprise Linux AS v4为平台一、资料参考与准备:DNS 是指:域名服务器(Domain Name
- 打算做个下半场营销软件下载站。放上去谷歌广告adsense后,发现杂得也不给我显示。后来找到了原因,我的站应该是属于谷歌官方所说的“版权材料
- 一.利用windows2003自带POP3/SMTP服务实现第一步:安装这两项服务默认情况下windows2003是没有安装的,我们必须手工
- 1) Aaron Wall - SEOBook.com 是在互联网上最好的搜索引擎优化博客之一.我真的喜欢他直接了当的文章风格.在他文章里,
- 俗称“脚本小鬼”的家伙 是属于那种很糟糕的黑客,因为基本上他们中的许多和大多数人都是如此的没有技巧。可以这样说,如果你安装了所有正确的补丁,
- 很多人在选择虚拟主机(Virtual Hosting)或者VPS的时候因为备案,网络审查,外贸等原因都倾向于把主机放在美国。美国作为互联网的