网站运营
位置:首页>> 网站运营>> 百度如何判断网站文章是否原创

百度如何判断网站文章是否原创

作者:im286 来源:CHINAZ 发布时间:2008-12-22 09:41:00 

标签:



大量复制内容网站有的时候会影响关键字的排名。

比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:

1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

3)域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4)网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

但到目前为止,无论以哪一个因素为主,或怎样组合这些因素,都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新,域名也很新,文章被收录的时间有的时候也不一定是最早的,就权威地位和被信任度来说,也肯定比不上很多中文网站。但我的博客新,我的域名新,并不意味着我的内容就不是原始出处,实际上我的所有博客都是原创。

我最近也发现了很多网站都转载,有的时候是抄袭我的博客内容,很多网站的规模,历史,PR值都比我的网站要高的多。

在检测文章原始出处方面,Google做的比较好,基本上能够正确判断,百度做的就比较差。从我的文章在不同的地方出现的情况看,百度似乎认为域名比较老的就是原创。(diyfzl.cn)

0
投稿

猜你喜欢

  • 近期服务器频繁有被暴力破解,大致分析了一下入侵行为,整理了常用的安全策略:最小的权限+最少的服务=最大的安全1. 修改ssh默认连接22端口
  • 通常利用Apache的rewrite模块对 URL 进行重写的时候, rewrite规则会写在 .htaccess 文件里。但要使
  • 因为之前搭建的MongoDB分片没有采用副本集,最近现网压力较大,所以准备研究一下,于是在自己电脑的虚拟机中搭建环境,但是发现之前VMwar
  • Tcp_Wrappers是一个用来分析TCP/IP封包的软件,类似的IP封包软件还有iptables,linux默认都安装了此软件,作为一个
  • 10月27日消息,阿里巴巴CEO马云在《纽约时报》发表署名文章,就如何支持小企业等问题进行了阐述,以下是全文:全球经济衰退的来袭令许多国际企
  • 一. 环境变量$PATH:Linux是一个多用户操作系统,每个用户都有自己专有的运行环境。用户所使用的环境由一系列变量所定义,这些变量被称为
  • 当年,江南春看到人们在等电梯时百无聊赖,发明了在电梯口放视频广告的主意,由此成就了如今在纳斯达克风光无限的分众传媒。现在,一个类似于分众视频
  • Confd和Consul是什么鬼?Confd和Consul都是用于配置管理和服务发现的工具。https://www.consul.io/ht
  • 经常看到有人在论坛里问URL的绝对路径和相对路径问题,在网站中应该使用哪种?对SEO有什么影响?这实际上没有绝对的答案,两者各有优缺点。Go
  • 以前我们学校的服务器经常中毒,而且基本上是一个网站中毒而牵连到其他的网站。这无非是服务器的权限配置没做好,让黑客们利用一个大权限用户把整台服
  • 从2009年到2011年,接触Dedecms已经有2个年头了,在这期间使用DEDE制作了有10来个网站,有些网站也取得不错的搜索排名和流量,
  • 安装好Serv-U初次运行时,会自动弹出创建域和账户操作向导窗口。由于使用向导创建的账户会带来一些未知的安全问题,因此在这里建议单击“取消”
  • IIS的相关设置: 删除默认建立的站点的虚拟目录,停止默认web站点,删除对应的文件目录c:inetpub,配置所有站点的公共设置,设置好相
  • 裸设备,也叫裸分区(原始分区),是一种没有经过格式化,不被Unix通过文件系统来读取的特殊字符设备。本文收集裸设备和Oracle问答20例。
  • 一、GOOGLE搜索引擎蜘蛛的等级首先先谈下GOOGLE蜘蛛起源。当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,其每天放
  • 1 VMware网卡VMware默认情况下会安装三个网卡,如下图示(点击最上方编辑-->虚拟网络编辑器)。VMnet0:“桥接网络”
  • 1|0编译内核(1)执行命令uname -r以查看内核版本。(2)执行命令apt-cache search linux-headers查看是
  • 负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载
  • 公司目前有一台服务器,网络环境太高,那台服务器和源服务器连接下载,就跑到400M-500M,为了控制一下,所以研究了一下TC,来做流量控制。
  • 安装四个下载的软件包:#dpkg-i*.deb修改/etc/amavis/amavisd.conf:@inet_acl=qw(127/81.
手机版 网站运营 asp之家 www.aspxhome.com