网站的规范标准化建设以及robots协议详解(3)
作者:张栋伟 来源:中国站长站 发布时间:2008-12-02 10:14:00
四、 Robots META标签
1.什么是Robots META标签
Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots META标签则主要是针对一个个具体的页面。和的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。具体的形式类似(见黑体部分):
<html> <head> <title>中国站长站</title> <meta name="Robots" content="index,follow"> <meta http-equiv="Content-Type" CONTENT="text/html; charset=gb2312"> <meta name="keywords" content="站长"> <meta name="description" content="中国站长站(chinaz)"> <link rel="stylesheet" href="/css.css" type="text/css"> </head> <body>
</html> |
2.Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合: <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW"> <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">可以写成 <META NAME="ROBOTS" CONTENT="ALL">; <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">可以写成 <META NAME="ROBOTS" CONTENT="NONE"> |
需要注意的是:上述的robots.txt和Robots META标签限制搜索引擎机器人(ROBOTS)抓取站点内容的办法只是一种规则,需要搜索引擎机器人的配合才行,并不是每个ROBOTS都遵守的。
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
<META NAME="googlebot" CONTENT="index,follow,noarchive"> |
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。


猜你喜欢
- 从事于网站推广的站长们都应该知道,不管是那方面的推广,细节的东西都应该要做的很好。网站推广的方法很多,博客留言的推广也是众多方法中的一种,博
- 10月14日,中国软件资讯网据外电报道,当苹果的市值又再度超越Google时,这次它能够一直保持领先吗?《BusinessWeek》专栏作家
- 序言偶尔你们会有机会了解一件事情的来龙去脉和其中的内幕,今天你就很幸运,因为我将带你领略当今最热门,同时也可能是你已经熟悉了的技术:万维网。
- OpenStack Heat AutoScaling一、背景Openstack的Heat是在H版之后加入的组件,旨在创建一套业务流程,更轻松
- 真的都是些小建议,如果你是学生站长的话,如果你有个几分钟闲余时间的话,不妨看完这篇文章,看看有没有一点帮助。学生站长的定义:在这里我定的比较
- 自己做站几个月了,还是个高中生,也没太多时间,所以属于新手中的菜鸟,什么也不懂,如果说的不对,还希望大家能够指正。谢谢。.第一次做站记得是个
- 本教程使用CentOS 7 64位, 为每个虚拟机分配2GB内存和20G硬盘空间,请按需分配内存和硬盘空间网络连接使用桥接模式启动虚拟机,使
- Apache Superset是一个强大的BI工具,它提供了查看和探索数据的方法。它在 ClickHouse 用户中也越来越受欢迎。我们将介
- 为什么要学 vimlinux 有大量的配置文件,所以 linux 的文本处理工具也是比较多的,常用的有 less vi head tail
- 软文炒作是生命力最强的一种广告形式。也是很有技巧性的广告形式,软文是相对于硬性广告而言,由企业的市场策划人员或广告公司的文案人员来负责撰写的
- “网页游戏是我们最先叫起来的”,孙文俊这样对腾讯科技说,“最初的叫法是WebGame或浏览器游戏。”孙文俊05年底创立了一个《OGame银河
- 网上流传了很多个版本的Google Adsense低价广告过滤清单,并且也有很多发布者就在使用这个名单。从技术角度上讲,过滤单价广告不能提高
- 阿里巴巴集团董事局主席马云在2007年“中国IT两会”之计算机世界互联网年会上首次公开谈论创办网上广告交易平台阿里妈妈的初衷,称是为感恩当年
- 1.查看80端口是否被占用,一般80端口多被apache服务占用。netstat -anp|grep 80 2.修改apache服务的端口号
- 目前,市场上有多种Internet邮件服务器产品供选择,这些邮件服务器产品价格各异,所提供的功能也有不少差别。对于网络管理员来说,如何根据自
- 百度C2C推出之际屏蔽门等风波不断,这将对新平台带来严峻的考验;百度应该快速的平息这场风波,用协商对话的方式来应对,中国互联网需要和谐竞争,
- 见到论坛里有部分朋友反映发布内容,内容缩略图选择为“站内选择”方式上传图片,上
- SEO最常见的问题之今天你的站又被降权了吗?网站被降权是常有的事,相信每位站长都曾经历过。一不留神,被降权了,再怎么千万次的问候某个伟大的女
- 一、Windows Server2003的安装1、安装系统最少两需要个分区,分区格式都采用NTFS格式2、在断开网络的情况安装好2003系统
- 虚拟机是非常方便的测试软件,我们可以用来做各种测试,不会对硬件造成伤害,为了能够更加方便的演示环境,便于做各种例子;而又能保证主机的快速运行