Google--PageRank(网页级别)技术解密
发布时间:2008-06-11 12:24:00
1. 什么是PageRank
2. PageRank的决定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000项搜索结果
6. PageRank与其它影响网站排名因素间的区别
一:什么是PageRank(网页级别)
PageRank(网页级别)是Google用于评测一个网页“重要性”的一种方法。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
简单说来,Google通过下述几个步骤来实现网页在其搜索结果页(SERPS)中的排名:
1) 找到所有与搜索关键词匹配的网页
2) 根据页面因素如标题\关键词密度等排列等级
3) 计算导入链接的锚文本中的关键词
4) 通过PageRank得分调整网站排名结果
事实上,真正的网站排名过程并不是这么简单,我们会在后面进行详细深入的阐述。
二:PageRank的决定因素
Google的PageRank是基于这样一个理论:若B网页设置有连接A网页的链接(B为A的导入链接时),说明B认为A有链接价值,是一个“重要”的网页。当B网页级别(重要性)比较高时,则A网页可从B网页这个导入链接分得一定的级别(重要性),并平均分配给A网页上的导出链接。
导入链接(也叫逆向链接)指链至你网站的站点,也就是我们一般所说的“外部链接”。而当你链至另外一个站点,那么这个站点就是你的“导出链接”,即你向其它网站提供的本站链接。
PageRank反映了一个网页的导入链接的级别(重要性)。所以一般说来,PageRank是由一个网站的导入链接的数量和这些链接的级别(重要性)所决定的。
三:如何知道一个网页的PageRank得分
可从http://toolbar.google.com上下载并安装Google的工具栏,这样就能显示所浏览网页的PageRank得分了。PageRank得分从0到10,若不能显示PageRank得分,可检查所安装版本号,需将老版本完全卸载,重启机器后安装最新版本即可。
四:PageRank的重要性
搜索引擎网站排名算法中的各排名因子的重要性均取决于它们所提供信息的质量。但如果排名因子具有易操纵性,则往往会被一些网站管理员利用来实现不良竞争。例如初引入的排名因子之一--关键词元标识(Meta Keywords),是由于理论上它可以很好地概括反映一个页面的内容,但后来却由于一些网站管理员的恶意操纵而不得不黯然退出。所以“加权值”--即我们对该因子提供信息的信任程度是由排名因子的易操纵程度和操纵程度共同决定的。
PageRank无疑是颇难 * 纵的一个排名因子了。但在它最初推出时针对的只是链接的数量,所以被一些网站管理员钻了空子,利用链接工厂和访客簿等大量低劣外部链接轻而易举地达到了自己的目的。Google意识到这个问题后,便在系统中整合了对链接的质量分析,并对发现的作弊网站进行封杀,从而不但有效地打击了这种做法,而且保证了结果的相关性和精准度。
五:Google的前1,000项搜索结果
一般说来,网站排名因素包括网页标题(META TITLE),网页正文中的关键词密度,锚文本(也叫链接文本,指链接或超链的文本内容)和PageRank所决定的。
请记住:单靠PageRank是无法使你获得比较理想的网站排名的。PageRank只是网站排名算法中的一个乘积因子,若你网站的其它排名因子的得分是零,就算你的PageRank是两百亿,最后的得分还是零。但这并不是说PageRank就毫无价值,而是在什么情况下PageRank才能完全发挥其功力。
如果在Google上进行广泛搜索,看起来好象有几千个结果,但实际显示最多前1,000项结果。例如对“car rental”,显示搜索结果为5,110,000,但实际显示结果只有826个。而且用时只有0.81秒。试想一下,0.84秒的时间就可以计算这五百万搜索结果的每个排名因子得分,然后给出最终我们所看到的网站排名结果吗?
答案就在于:搜索引擎选取与查询条件最相关的那些网页形成一个子集来加速搜索的速度。例如:假设子集中包含2,000个元素,搜索引擎所做的就是使用排名因子中的两到三个因素对整个数据库进行查询,找到针对这两三个排名因子得分较高的前2,000个网页。(请记住,虽然可能有五百多万搜索结果,但最终实际显示的1,000项搜索结果却是从这个2,000页的子集中提炼出来的。) 然后搜索引擎再把所有排名因子整合进这2,000项搜索结果组成的子集中并进行相应的网站排名。由于按相性进行排序,子集中越靠后的搜索结果(不是指网页)相关性(质量)也就越低,所以搜索引擎只向用户显示与查询条件最相关的前1,000项搜索结果。
请注意,在搜索引擎生成这2,000项网页的子集中我们强调了“相关性”这个词。即搜索引擎找寻的是与查询条件有共同主题的网页。如果这时候我们把PageRank考虑进去,就很可能得到一些PageRank很高但主题只是略微相关的一些搜索结果。显然这有违搜索引擎为用户提供最为相关和精准的搜索结果的原则。
一旦理解了为什么会如此,就说明了为什么你应当首先努力在“页面”因子和锚文本上下足工夫,最后才是PageRank。所以关键在于:
你必须首先在页面因素和/或锚文本上下足工夫,使这些排名因子能够获得足够的得分,从而使你的网站能够按目标关键词跻身于这2,000项搜索结果的子集中,否则PageRank再高也与事无补。
六:PageRank和其它排名因子之间的不同
网页Title标识 仅能被列出一次。
正文中的关键词 连续的重复只会降低关键词的重要性,重要的是接近度。
锚文本 加权值极高,但存在上限,超过上限的锚文本信息将被忽略或降低权值。
PageRank 潜质无穷,没有上限的限制,但需要大量工作。
备注 其它排名因子都存在一个上限(阙值),超过上限部分其权值将降低或不再计分。PageRank则不存在此问题


猜你喜欢
- 11月19日消息,中国领先的社区平台与服务提供商康盛创想(Comsenz)旗下核心产品Discuz!新版正式发布。全新推出的Discuz!
- 在搜索引擎优化的过程中,我们是以关键词为中心来展开工作的,所以,关键词是搜索引擎优化的核心。我们知道,适当的关键字,能带来更多的流量。遗憾的
- 2006年,中国迎来了个人网站蓬勃发展的一年,当网赚摧枯拉朽的疯狂了一年后。2007年我怀着一腔热血踏上了艰难的建站之路。建站的定位首先很重
- 1、经常规律性的更新文章2、确保服务器工作正常3、使页面尽量简洁,确保打开速度快4、检查内部链接结构,去除死链接和重复链接5、尽量多从正规和
- 日前,据媒体报道,国产服务器领军企业——浪潮服务器在2007年上半年取得了重大销售突破,已经连续两个
- 建立博客有助于打造卓越企业的核心要件。企业的核心需求如下所示:妙点子好产品能见度训练有素的团队,为企业的成功而努力不懈提升业务的创意,改善公
- UCHome出现Incorrect file format ‘uchome_log’的大体原因是网站访问期间服务器重启后导致。通过PHPMy
- GoDaddy.com, Inc. 已与Google合作,来为你提供一种你在创建你的共享托管账户是就可以用来立即登陆你的网站数据的站长管理工
- 下述设置以时钟源服务器IP地址为192.168.0.1为例。可以命令ntpstat 和 ntpq -p 查看本机NTPD服务状态。配置完成后
- 前言:SEO在网站运营中的地位已经不言而喻了,SEO说难不难,因为只要在网站制作过程中,把握一些“套路”,不要过于修饰就差不多了,这个方面站
- 你完全不必耐心看完所有内容:简要安装说明如下安装http://sourceforge.net/projects/awstats/ 下载安装包
- 众所周知,QQ空间的人气很高,那作为站长的我们能否利用QQ的高人气呢?答案是肯定的!虽然QQ空间带来的反链效果很差,但带来的流量却相当可观!
- etang最近服务器出问题了,看看,这个曾经获得过接近5000万美金风险投资的网站,今天孤零零的只剩下大学四六级查分的工具了。etang曾经
- 网络营销和传统营销比起来,具有投资小,见效快,回报大的特点,企业在发展的过程中,可以利用互联网进行一种全新的网络营销模式,推广自己企业的产品
- 我的师父黄裳@岳旭强曾经说过,“好的架构图充满美感”,一个架构好不好,从审美的角度就能看得出来。后来我看了很多系统的架构,发现这个言论基本成
- 最近有很多新朋友入群后,都问笔者如何通过推广的方式增加流量,在此先谢谢大家对笔者的信任。其实不用对外推广,通过网站自身的优化也能达到流量爆涨
- 受影响系统:IBM Lotus Domino 7.0不受影响系统:IBM Lotus Domino 7.0.2 FP2描述:Lotus Do
- 典型的 Linux 发行版包含 Linux 内核,但还包含许多应用程序和工具。总的说来,Linux 分发版中出现的许多系统级别和用户级别的工
- 网站在搜索引擎中被K掉(处理),如网站首页搜索没有收录、网站收录被拔掉、排名下降、都是网站被K的现象。网站被K是广大站长最为头疼的事之一,总
- 这篇文章缘起于这段时间我对拆东墙补西墙这种工作方式的抱怨。先是磁盘空间不够用,配发的电脑仅仅剩余12G的空间,不能外接硬盘,暂时也不能上传备