网站运营
位置:首页>> 网站运营>> 也谈Google搜索引擎对原创内容的识别

也谈Google搜索引擎对原创内容的识别

作者:williamlong 来源:月光博客 发布时间:2008-07-11 14:08:00 

标签:原创,内容,google,收录

Google中文网站管理员博客在《由抄袭造成的重复内容》文章中提到:“鉴别内容的原创来源是Google所擅长的,在大多数情况下原创内容源都能被正确地识别出来,从而不会给发布真正原创内容的网站带来任何负面影响……当有人剽窃了您网站中的内容,并将其展示在其他网站上牟利。Google在不同网站遇到相同内容的时候,会基于许多不同的依据来判断究竟哪个网站才是原创,而这样的判断通常是准确的。”  

根据我的观察,Google识别原创内容源的能力有时候比较准,但有时候不太准,不准的情况主要是在中文网站上,因为Google无法用简单的链接权重来平衡门户网站和个人博客之间的孰是孰非。

目前的中国互联网仍然是主流门户网站的天下,个人博客的生存环境异常艰辛,个人辛辛苦苦的写作往往得不到回报,产生的内容却因为种种原因无法给个人带来应该得到的回报,所有的流量都逐步流向主流门户网站。通常情况下,Google给予门户网站的权值和网站权威度都非常高,当一篇完全相同的文章同时出现在门户网站和个人博客上的时候,Google往往认为原创者是门户网站,除非个人博客的权值非常大。

门户网站为了内容的大量更新而雇佣了不少“网站编辑”,“网站编辑”通过人肉筛选的方法从个人博客上挑选出优秀的文章,并将这些文章复制到门户网站,复制内容的同时通常会删除原始文章的作者和文章中的链接地址,同时小幅修改文章的标题,经过这一番“处理”,Google通常很难判断出到底哪个文章是原创,当一个原创个人博客的文章被大量门户网站复制之后,Google搜索引擎可能会惩罚这个原创博客,不再索引上面的文章。

这里我举一个例子,我在今年三月份曾经写了一篇文章《十个常用网络密码的安全保护措施》,然而相当长的一段时间里,我在Google中搜索这篇文章的标题时,却看不到来自我的博客的一点踪影,我看到的是什么呢?这篇文章被21CN中关村在线新浪网硅谷动力计算机世界瑞星科技等等无数大型门户或专业网站非法转载,最具讽刺意味的是,国家违法和不良信息举报中心这样的国家政府机关的网站竟然也非法进行了转载,通常情况下政府网站在搜索引擎中的权威度是非常高的。

结果是,我的原始文章被搜索引擎惩罚了,至今在百度上找不到我的文章地址了,而Google前几天才重新索引了我这篇文章,其余时间网站的排名都被上面那些主流门户网站抢走了。

从内容上说,个人博客的内容远远无法和主流门户网站相比,主流门户网站拥有自己的编辑团队和营销团队,具有足够的资源和能力输出更好的内容,而个人博客要写一篇好文章需要酝酿很长时间,每周能写一篇好文章已经算不错了,这就注定了个人博客是竞争不过门户网站的。

当然,个人博客也有自己的对策,就是要求门户网站删除复制的文章,但通常会浪费巨大的时间和精力,当被复制的文章累计到成千上万的时候,完成这种工作量通常是不可能的任务。

因此,Google要想在中文的互联网环境下实现对于原创内容识别的准确性,需要考虑使用专门针对中国特殊国情的特殊算法,否则,中国原创的博客群落将会逐渐被门户网站边缘化,走向自生自灭的可悲下场,最为可悲的是,中国最大的搜索引擎百度对于原创内容的识别几乎是一片空白,这也使得当前中国的互联网的环境显得异常恶劣。

0
投稿

猜你喜欢

  • 前文所述SVN客户端使用的时候,用的SVN服务器通常为外部,例如Google Code的服务器,不过,做为一个程序开发人员,就算自己一个人写
  • 网络赚钱,简称网赚,英文名make-money-online。指单纯通过网络手段,赚取现实中的现金。大多数人对这个概念的印象非常理想:点点鼠
  • 种种迹象表明百度Hi马上就要公测了,相信在不久的几天大家就可以共同使用了,作为意外可以登录百度Hi而的用户,还是先做个比较详细的图解让大家看
  • 一、基本知识: Sendmail是在Unix环境下使用最广泛的邮件传输代理程序,Sendmail邮件服务器的特点是功能强大但配置复
  • WordPress 即将更新到 3.2,和 3.1 的理念一样,WordPress 3.2 将继续在用户体验上下功夫。WordPress 3
  • 伴随着UCenter Home(简称UCHome)1.5的发布,国内越来越多垂直细分的社交网站采用UCHome搭建。同时,漫游(Manyou
  • 简述本文介绍如何在Windows XP 64位操作系统中安装和管理Exchange 2007!以下为实现的步骤:1. 安装IIS中的Comm
  • 从事互联网多年,积累了些许“概念”,现一一罗列,供大家参考:平铺和翻滚: 网站获得流量有两种方法,一是平铺,二是翻滚。平铺又可分为搜索引擎平
  • QQ网站登录处没有使用https进行加密,而是采用了RSA非对称加密来保护传输过程中的密码以及敏感信息的安全性。 QQ是在javascrip
  • 网站优化一个最重要的因素就是网站的标题标签(Title Tag),如何取一个好的网站标题?元创认为,用一个精简的对用户有吸引力的标题再恰当不
  • 今天收到google以官方的名义发布的邮件,全文内容如下:如果您已经收到本期款项,请您忽略此邮件。尊敬的发布商:我们很抱歉的通知您,我们本期
  • 前面我们讲过,FTP协议的数据传输存在两种模式:主动模式和被动模式。这两种模式发起连接的方向截然相反,主动模式是从服务器端向客户端发起;被动
  • 目前,微软提供一个名为Anti-Spam Migration Tool的工具,将Exchange Server 2003中的广告过滤设置安装
  • 今年的娱乐圈屡传喜讯,近日中国模特叶子金通过层层筛选最终斩获“2009环球皇后世界赛事中国皇后亚军”一奖,同时小编还从51wan寻找女一号组
  • SEO的趋势如何? 2009年SEO的工作好找吗? 昨天百度知道里一位SEO新人这样提问。今天我回答一下以上问题:第一个问题:SEO的趋势如
  • 熟悉Windows Server 2003的朋友,相信对RMS(权限管理服务)都不会陌生,它能够有效的保护我们的数字资产在相应授权范围之外不
  • 好的开始是成功过的一半,个人站长的队伍越来越庞大,找不到方向的站长也是越来越多,个人站长的发展方向到底在哪里。到底怎么做才能通过网站赚钱,今
  • Discuz!7.1 的编辑器更为人性化,使用起来方便快捷。站长可以在管理后台设置编辑器模式及表情的显示; Discuz! 还自带了四种 D
  • 最近集中精力学习了一下前辈们的网站营运及推广经验,和如何实现盈利的方法,针对目前我所运营的深圳掘吧网不温不火的现状,决定作出一次尝试:去扫街
  • 作为一个成长中的二流站长,说实话我做网站的目的就是为了赚钱,所以刚一开始我选择了做垃圾站。因为垃圾站能够短期内带来大量的流量,从而在短期内就
手机版 网站运营 asp之家 www.aspxhome.com