网站运营
位置:首页>> 网站运营>> 网站的规范标准化建设以及robots协议详解(3)

网站的规范标准化建设以及robots协议详解(3)

作者:张栋伟 来源:中国站长站 发布时间:2008-12-02 10:14:00 

标签:

四、 Robots META标签

1.什么是Robots META标签

Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots META标签则主要是针对一个个具体的页面。和的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。具体的形式类似(见黑体部分):

<html>

<head>

<title>中国站长站</title>

<meta name="Robots" content="index,follow">

<meta http-equiv="Content-Type" CONTENT="text/html; charset=gb2312">

<meta name="keywords" content="站长">

<meta name="description" content="中国站长站(chinaz)">

<link rel="stylesheet" href="/css.css" type="text/css">

</head>

<body>


</body>

</html>

2.Robots META标签的写法:

Robots META标签中没有大小写之分,name=&rdquo;Robots&rdquo;表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=&rdquo;BaiduSpider&rdquo;。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以&ldquo;,&rdquo;分隔。

INDEX 指令告诉搜索机器人抓取该页面;

FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。

这样,一共有四种组合:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">


其中

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">可以写成

<META NAME="ROBOTS" CONTENT="ALL">;

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">可以写成

<META NAME="ROBOTS" CONTENT="NONE">

需要注意的是:上述的robots.txt和Robots META标签限制搜索引擎机器人(ROBOTS)抓取站点内容的办法只是一种规则,需要搜索引擎机器人的配合才行,并不是每个ROBOTS都遵守的。

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令&ldquo;archive&rdquo;,可以限制GOOGLE是否保留网页快照。例如:

<META NAME="googlebot" CONTENT="index,follow,noarchive">

表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

0
投稿

猜你喜欢

  • 站长在竞争及生存压力非常大的今天,该如何靠网站赚钱?据CHINAZ的调查显示,六成站长靠广告联盟赚钱,但是流量是基础,如果没有流量,就赚不到
  • 邀请机制?我的第一反应就是Gmail,最早拥有Gmail帐户的同学都是在焦急和期待中过来的。渐渐,这种方式被互联网产品延续开来,进而形成一种
  • 你是否还在为网站某些关键字的排名上不去而苦恼?你是否还在为一个日流量几百IP的关键词消失了而苦恼?这个时候,你可以尝试检查一下你的网站是不是
  • 关于网站用户粘性的问题,谈及的文章已经很多了。结合自己的经验和教训,总有不吐不快的感觉,因此也就来说说这个问题。请各位同仁斧正。先谈用户。任
  • 因为需要更改电子邮件,你也许想加强多个电子邮件帐户或者把不同的地址组织到不同的帐户里。要这样做,你不需要取消或者重新创建你的电子邮件帐户或者
  • 现在搜索引擎越来越重视网站的质量了,对于一些小网站的惩罚更是毫不手软,很多站长都被搜索引擎惩罚过,也有一部分网站经过改善后又重新被收录,并且
  • 电信和网通两大基础网络,人为地割裂了整个中国的网络。无论是选择把网站托管在电信、还是网通,都等于是在拒绝处于另外一个网络中的客户,因为实在太
  • dedecms默认在列表是无法调用tag标签的,经过各位版主们的帮助,现给大家提供出种方法方法1:在列表需要的位置加入下列代码[field:
  • 在网络科技时代,SOHO(Small OfficeHome Office)或远程办公(Tele-office)作为一种新的工作和生活方式,已
  • IDC首席分析师预计到2012年,美国云计算总开支将达到400亿美元,是2008年的3倍。面对这个巨大的利益诱惑,谷歌等IT企业早已跃跃欲试
  • 我以前曾经介绍过将Z-Blog数据库转换到WordPress的SQL语句,做为反例,还会有从WordPress系统转换到Z-Blog系统的S
  • 中国游戏行业是一个悲情的行业,虽然他有着远超体育圈的关注和参与人群,但是在社会上它始终被定位在“小众”。其最大的一个表现就是,它应该是全中国
  • 由于众所周知的原因,微软的产品总能吸引黑客们的目光,IIS也不例外。IIS是什么?即因特网信息服务,作为当今流行的Web服务器之一,它提供了
  • 部分访客在博客评论后不习惯留下网站URL链接,使用z-blog博客的博主点击访客用户名就会跳转到Z-Blog官方网站首页,如果有其他的访客点
  • 小弟虽然没做百度联盟,但是我的几个站基本在靠着百度和GG的搜索带来流量,所以对K站这个问题很敏感,也有点小怕。最近连续看到一些帖子在讨论加入
  • 不算前言的前言前两天小韩简单写了写关于在网站编程中跨站漏洞的一些知识,如果你还没有看到,那么为什么不现在就去看看呢:跨站漏洞解析-小韩网站编
  • 在前面的广告优化四要素系列中,我们分别对广告的格式、颜色和位置的选择技巧向大家进行了介绍。不过请注意,这三个要素并非是孤立的,而是要结合网页
  • 1.漏洞介绍在XHTML 1.0标准下,使用特殊构造的CSS样式,在Internet Explorer 7.0 打开特定的网页后,Inter
  • Web的大多数安全问题都属于下面三种类型之一:1、服务器向公众提供了不应该提供的服务。2、服务器把本应私有的数据放到了公开访问的区域。3、服
  • 站点运营推广类的文章百度下可以搜索到36万条之多。站长对此类话题的关注程度可见一斑。许多中小站长面对一个新上线的站点并不知如何良好的运营和广
手机版 网站运营 asp之家 www.aspxhome.com