如何防止自己网页的内容被采集
作者:蝴蝶雨 来源:qq123qq126.cn 发布时间:2008-09-12 13:29:00
防采集第一种方法:在文章的头尾加上随机广告
网站采集者在采集时,通常都是指定头尾特征从哪到哪过滤.我们这里讲的第一种方法:文章头尾加随机广告,当然随机广告是不固定的。
比如你的文章内容是"校内网涂鸦代码",则随机广告的加入方法:
<div id="xxx">随机广告1欢迎访问校内网涂鸦代码站随机广告2</div>
注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.
防采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''
当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了。。
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机广告1欢迎访问4399com小游戏站随机广告2
<--</div>--></div><--</div>-->
防采集第三种方法:加在文章列表的随便链接样式。
即:正文头尾或列表头尾添加<!--重复特征代码-->
原理是让采集的人无法抓到列表链接规律,无法批量进行采集.
请看:
<a href="xxx.html">标题一</a>
<a alt="xxx" href="xxx.html">标题二</a>
<a href='xxx.html'>标题三</a>
<a href=xxx.html>标题四</a>
如果你把三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..
如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.
呵呵!那么关于防采集的一点小经验就写到这里了
猜你喜欢
- 如果臧家宜不是在故弄玄虚,扰乱视听,那郭台铭的风光日子可能即将到头。在台湾,鸿海的股价已经因自家掌门人 * 被查的消息而受挫,即便爆料者已经因
- 这两天,互联网上出现了这样的观点:“垃圾信息是搜索不公正主因” 。谷歌中国认为,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概
- 什么是 vim?Vim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。简单的来
- 暂且不提世界人口增长,北极冰川融化、海平面上升,单是不断的荒漠化和环境污染已经让人们的居住环境越来越少了,拥有的各种自然资源也越来越贫乏。在
- 软文写作最常遭遇问题:网络营销者、网站站长、文案写作者、销售人员最头疼的问题常常是不知道该写些什么,缺乏软文写作的思路和方向,本次,我们以实
- Tcp_Wrappers是一个用来分析TCP/IP封包的软件,类似的IP封包软件还有iptables,linux默认都安装了此软件,作为一个
- 作为中国三大搜索之一,雅虎,本身也掌控着巨大的流量。或者大部分的客户都着眼于百度和GG,其实,优化好雅虎,效果也不差,毕竟对于一个站点来说,
- 前几天的一篇博客是关于“为什么有的小站点(或新站点)在搜索结果中排名能靠前?”,下面又是一个很少人注意的影响SEO效果的因素:你购买域名时一
- 1、何谓虚拟系统“虚拟系统”的意思是“假的系统”,亦即当一个
- 7字开头的公交车在重庆可谓家喻户晓,私家车速度快、乱停乱靠的特点在其身上发扬的无比光大。由于其安全系数是所有公交车中最低的,所以我很少坐&a
- xingTemplate 是一个基于PHP的模板引擎,主要对于PHP程序的方面快速开发而设计。它可以通过简易快捷的模板语法编译为PHP文件,
- 很多时候我们会发现自己的系统问题越来越多,如果将就使用,那系统运行效率肯定不会很高,甚至还无法正常运行,如果选择重新安装系统,那不但麻烦不说
- 01、明确内容如果你想成为一个网站设计者,并正想建一个网站的话,首先应该考虑网站的内容,包括网站功能和你的用户需要什么。你的整个设计都应该围
- 自从上次由于没有成功备份导致博客的大部分文章无法还原之后,我就更加小心博客的备份了,并且还尝试了多种的备份方法,以下是其中三种直接备份&nb
- 一、Ubuntu Server 18.04.5 LTS系统安装Ubuntu分为桌面版(desktop)和服务器版(Server),下面为大家
- vscode中对git进行了集成,很多操作只需点击就能操作,无需写一些git指令。不过这就需要你对vscode进行配置。下面我会讲到git的
- 3月24日凌晨消息,阿里巴巴网络有限公司(1688.HK)CEO卫哲近日承认,在数月之内,阿里巴巴将有一个战略性的项目面世。据悉,该项目或与
- 硅谷IT初创型公司Cuil已经成功获得第二轮风投2500万用于开发“新型搜索引擎”Cuill.团队核心领导人表示将正式向google发出挑战
- 注意:建议虚拟机内存2G以上,一定要配置阿里云的加速镜像1.下载镜像文件docker pull beginor/gitlab-ce:11.0
- 12月3日上午消息,百度贴吧今日迎来成立六周年的生日。据知情人士透露,百度贴吧已悄然启用www.tieba.com的全新独立域名,并获得国家