详细的百度蜘蛛爬行检测代码诠释
作者:活着 来源:admin5 发布时间:2008-04-03 16:14:00
做seo的朋友都知道,研究se爬行规律对于网站优化意义重大,特别是对百度蜘蛛Baiduspider的研究。本文解释一下百度蜘蛛爬行后返回代码代表的具体含义:
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理认证自身。
410 请求的网页不存在(永久);
415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
5xx 服务器中出现的错误
500 内部错误 — 因为意外情况,服务器不能完成请求。
501 未执行 — 服务器不支持请求的工具。
502 错误网关 — 服务器接收到来自上游服务器的无效响应。
503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
比如说:
2008-03-27 04:25:32 61.135.145.208 - *.*.*.* 80 GET http://www.uctalk.org/index.html - 304 Baiduspider+(+http://www.baidu.com/search/spider.htm)
这就意味着百度蜘蛛在2008-03-27 04:25:32 爬过/index.html这一页,304代表了它发现这页是没有更新过的。根据这个我们可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的问题,进而改正。
猜你喜欢
- 输入字母验证码,俺觉得特烦,特别还要输入大写字母。于是找到文件并修改成数字验证码。修改文件 验证码文件位置include\validatei
- 当网站没流量的时候,我们的站长该怎么做呢?我就拿我一个成功网站的(www.hngwyw.com)经验给大家说下,从以前的100到现在日IP5
- GoDaddy主机用户如果想要取消主机帐户,将会删除存储在服务器上的所有的网站文档。所以在确保取消帐户前,需要保存文档的备份。首先.登陆Ac
- Windows2003服务器安装及设置教程好久没有更新了,正好最近上了一台服务器,正好把剩下的几篇补全,今天先说的是MSSQL安全篇第一篇—
- 发布商都很关注收入的波动问题,今天我们就帮大家深入分析一下如何知道收入波动的背后原因,并采取相应的措施。首先,大家都知道,AdSense 收
- V5MALL: 多用户商城的到来过去的2009年是电子商务的“爆发之年”,而2010年作为电子商务“繁荣之年”网购用户规模与交易规模的迅速增
- virtualenv是一个用来创建隔离的python虚拟环境的工具。它可以在一个独立的目录创建自己的python环境,使用virtualen
- 今天,安装了CentOS系统,自带的YUM源更新太慢,所以更新使用了163的YUM源,具体更换方法:1.下载repo文件:wget http
- 这两天破天荒地做了另外一件事情:把托管在上海华数漕宝路机房达2年之久的差不多有200G资料的服务器给全部格式化了,然后换成了centos。很
- 近一段时间带有ARP攻击行为的病毒,木马很是常见,主要有两种表现形式:1. 频繁的出现地址冲突的现象2. 上网速度很慢甚至上不了网经分析,这
- 四、Sendmail的配置配置Sendmail的步骤如下。1、在/etc/mail目录下创建access文件,内容如下:127.0.0.1
- 在Internet大众化及Web技术飞速演变的今天,在线安全所面临的挑战日益严峻。伴随着在线信息和服务的可用性的提升,以及基子Web的攻击和
- 写这篇的动力源于上一篇中反复出现的robots,它让我想起了spider(蜘蛛)与crawler(爬虫)。此二者一样?不一样?以前就看过一篇
- 攻击者可以通过反弹技术使我们对DDOS攻击更难以防御——利用反弹服务器反弹DDOS的洪水包,也就是说,通过发送大量的欺骗请求数据包(来源地址
- 免费开源博客程序wordpress正式发布wordpress 3.2版本,并同时发布了中文版本。目前官方下载地址已经替换为wordpress
- LAMP 方案是一系列自由和开源软件的集合,包含了 Linux、Web 服务器 (Apache)、 数据库服务器 (MySQL / Mari
- SMTP提供一种可靠的有效的传送机制,它用于传送电子邮件。虽然十几年来,它的作用已经有目共睹,可是对它功能的扩充也是必不可少的。对SMTP服
- 近日在IT龙门阵被面授了一些大淘宝战略的玄机,先说点题外的话,PPT写的很精彩,特别是提供了一些比较新颖的图,另外淘宝的对外宣讲的纪律性也非
- 途牛网tuniu.com作为国内知名的旅游直销网站在国内还是很有名气的,也是南京本地为数不多的比较成功的互联网企业。去年大学刚毕业刚好认识途
- 前言上周电脑重装,换了ubuntu 16.04,想起来之前上课老师也是ubuntu而且他还提到他桌面是他自己写的个小脚本实现的自动更换桌面壁