深度分析 谷歌搜索引擎蜘蛛等级那些事儿
作者:ehsy-sem团队 来源:SEO论坛 发布时间:2008-12-12 14:08:00
一、GOOGLE搜索引擎蜘蛛的等级
首先先谈下GOOGLE蜘蛛起源。
当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快。
服务器将采集的信息分类,整理到庞大的数据库。其中有个数据库都是用来存网站域名的。域名只要被搜索引擎索引到,将自动存入此数据库。此数据库是1号蜘蛛的核心。
其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕。10个等级的数据库 其周期也不同,基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次。所以基本你也会发现收录有大的幅度也是在7天内的某一天 。
细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4。越是PR高其周期越是短,越是PR低周期越长,当然说到这很多站长有这样的疑惑。会觉得蜘蛛有时天天收录他的站这里对其收录的也就是接下来要说的2号蜘蛛,2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,主要针对于被1号蜘蛛爬过的网站的外部链接。PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多。
二、当然不只是有2号,还有3号蜘蛛
所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站。
目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级。并对其等级的抓取率有个很明确的标准,而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取。
三、 比方讲
A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-12-12,那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是,最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问,之后再爬行2008-12-12以后的信息。如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行。
如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次。
以下为GOOGLE提供的官方数据。


猜你喜欢
- 俗称“脚本小鬼”的家伙 是属于那种很糟糕的黑客,因为基本上他们中的许多和大多数人都是如此的没有技巧。可以这样说,如果你安装了所有正确的补丁,
- 这篇文章针对那些希望利用ftp协议和朋友们共享文件的人们,就像windows下的FTPserU,我提供的方式不是唯一的,希望我的方法足够清晰
- 搜索引擎优化(Search Engine Optimization,SEO),也就是针对各种搜索引擎的检索特点,让网站建设和网页设计的基本要
- 广告的位置完全决定了广告的点击率,以文章网站为例,文章正文放336*280是公认点击率最高的。有的人总是抱怨某项广告收益太低,也许就是因为广
- 10月12日消息,据国外媒体报道,互联网用户管理机构ViziSense最新数据显示,谷歌Gmail已经超越雅虎,成为印度最受欢迎的电子邮件服
- 今天看到微博上@hellodba发的一个帖子:“内部晋升越来越困难,但是外部来的大P越来越多,所以很多人都选择跳槽”,之后我从三个方面简要的
- 0.前言之前在学springcloud的时候,提到有些项目还是使用zookeeper作为注册中心。因此决定掌握这个技能,但是本地为了测试而部
- Windows Server 2008的一个特性在于,操作系统的许多方面的功能都可以通过命令行方式进行管理。如果我们在一台带GUI界面的电脑
- 详解 Linux 常用目录的作用一 常用一级目录注意:1、根目录下的bin和sbin,usr目录下的bin和sbin,这四个目录
- docker将jar包构建成镜像并执行1.编写Dockerfile文件????FROM java:latest????ADD Aeureka
- 做网赚说复杂也复杂,说简单也会简单,但为什么新手做网赚往往感到很无力,找不到任何方向,在万般无奈的情况下找到一个网赚的项目到头来还发现居然是
- 网站性能压力测试是服务器网站性能调优过程中必不可缺少的一环。只有让服务器处在高压情况下,才能真正体现出软件、硬件等各种设置不当所暴露出的问题
- 为了方便,最近用vitualbox搭了一个centos7的虚拟机,整个过程比较简单,在这里记录一下。下载vitualbox直接去官网(htt
- 由SiteServer CMS、中国站长站联合主办,中电数据、创意在线协作举办、站长 * 别支持的“2010,我爱SiteServer CMS
- 一、系统的安装 正常情况下Internet 信息服务(IIS)只需要选择三项:Internet服务管理器 + Wo
- 今天我们一起来探讨文件管理命令中的mkdir命令,创建文件夹,学习永无止境,冲!1、mkdir 命令介绍mkdir命令来自于英文词组&
- 一、背景不定时会做一些内训,会经常用到实验坏境;一开始搭建了一个docker容器,但考虑到不是所有学员都会使用docker,因此做了一个虚拟
- 为WordPress做模板的时候我们经常可能遇到这样的问题,每个页面用的模板不一样,比如,这个页面有侧边,那个页面没侧边,这个页面用这个导航
- 同Web站点一样,用户也可以使用多种方法来管理FTP站点服务器。例如:设置FTP站点服务器的虚拟目录的访问权限、设置匿名访问、创建用户账户等
- 你可以在采用Windows XP、2000和Server 2003操作系统的本地计算机上使用这些方法,或者在Server 2003和2000