谷歌关于网站重复内容的10个建议
作者:乱世末日之刀 来源:ehouse365.net 发布时间:2008-01-23 14:34:00
最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。
最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。
什么是内容重复?
重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。
什么不是重复内容?
虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。
什么谷歌关心重复内容?
谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到Google给出象example.com/contentredir?value=shorty-george〈=en一样复杂的URL。他们往往更喜欢类似example.com/en/shorty-george.htm的URL。
谷歌做了些什么?
Google在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的网站有文章的正常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上… 因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。
网站管理员如何主动处理内容复制问题?
适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的"最佳"版本,你也许希望指引谷歌选取你的首选版本。譬如说,如果你不想我们索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。
使用301重定向:如果你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(永久性重定向)来重定向你的用户、Google爬虫、以及其他搜索引擎蜘蛛等。
链接要一致:努力使你的内部链接保持一致; 不要既有/page/,又有/page和/page/index.htm 的内部链接
使用顶级域名:为了让我们总是使用最合适的文件版本, 请尽可能使用国家特定的顶级域名。与诸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文为核心的内容。
小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
使用谷歌网站管理员工具的首选域功能: 如果其他网站链接你的URL时既使用www版本又使用无www的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。
减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。
避免发布无内容页:用户不喜欢看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及Google爬虫)才不会看到无穷多的写着"以下是在【某城市名】中不可错失的待租房列表…"但其实根本没有什么列表的网页。
了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。
不要担心,保持快乐:不要过分受搜刮(挪用和转载)你内容站点的干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。如果你实在忍无可忍, 欢迎你提出千禧年著作权法案申请 来声明对你的内容的所有权。我们会处理那些无赖网站。
总之, 如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。
猜你喜欢
- 随着3G网络的完善以及手持终端的快速增长,亚洲最大的网络零售商圈淘宝网也加速了其无线战略部署。5月12日,淘宝网正式对外发布了手机版旺旺,目
- 10月14日消息,据国外媒体报道,今年第二季度,中国网络游戏收入同比增长了39.5%至9.06亿美元,腾讯公司上升至榜首,领先于竞争对手盛大
- 每家公司都有各自不同的需求,我需要的是什么?眼花缭乱的统计系统,该如何取舍?流量概况今天的流量是增了?是减了?幅度是多少?现在所调用的统计系
- 对SEO来说,友情链接的重要性是大家都知道的。所以很多做SEO的公司都成立了媒介部呀,外联部呀等等一个专门的部门来做友情链接或者软文的工作,
- 没有人喜欢垃圾信息,除了制造者本人。如果你正运行着一个 WordPress 博客系统,你可能已经至少安装了一个垃圾信息控制部件,但
- 一旦你精心建设好了自己的站点,就要把它发布出去。把你的Web站点提交给搜索引擎、目录和相关的站点是成功的关键。如果你用错误的方式推广自己站点
- 随着互联网的快速发展,网购,这个名词对于广大网民来说已经是再熟悉不过了。只要上网,必定穿梭在网上人家的大街小巷之中。可以说互联网上的B2B,
- 2月25号,百度算法更新之前,百度几乎收录了80后门户所有文章,80后门户主要是用伪原创来做网站推广的,百度更新算法前,权重不错,很多词都排
- 所谓百度框计算,是为用户提供基于互联网的一站式服务,是一种可依赖的互联网需求交互模式,用户只要在框中输入服务需求,系统就能明确识别这种需求,
- 1、网关主机设置 服务器上有两块网卡,eth0使用*.*.*.*IP地址连接Internet,eth1连接LAN,则其/etc/n
- 北京时间11月9日消息,据国外媒体报道,消息人士周日透露,美国移动运营商Sprint Nextel(以下简称Sprint)及其合作伙伴计划至
- 1、概述电子邮件是最常用的网络应用之一,已经成为网络交流沟通的重要途径。但是,垃圾邮件(spam)烦恼着大多数人,近来的调查显示,93%的被
- 个人卖家在淘宝网上低价销售盗版书,作为交易平台的淘宝网也被出版公司起诉。记者昨天获悉,市二中院终审认定淘宝网不构成共同侵权,判决个人卖家单独
- 11月11日消息,据外国媒体报道,eBay首席执行官John Donahoe称,eBay将关注中国的出口商,并与与中国当地的公司扩大合作。D
- “我们将围绕B2B企业客户,建立中小企业“人才+能力提升”需求动态系统,逐步开发
- 使用了那么多博客程序,写写看法吧.先说我现在使用的sablog-x,功能简单,后台简单,一目了然,安全方面呢,还不错吧.当然也不排除被人黑,
- 巨人网络CEO史玉柱10月24日消息,巨人网络CEO史玉柱近日在接受国内媒体采访时畅谈“带队伍”、管理企业之道。史玉柱表示,领导者用人,第一
- 关于FedoraFedora 是一个 Linux 发行版,是一款由全球社区爱好者构建的面向日常应用的快速、稳定、强大的操作系统。它允许任何人
- 10月31日消息,消息人士透露,思科和EMC将联手销售用于云计算服务的新款网络设备、计算机和存储系统。据国外媒体报道称,代号为&ld
- 如何查看Godady E-gift card的余额呢?有些朋友说它们根本找不到,在哪儿查看Godaddy E-gift card的余额?余额