Google--PageRank(网页级别)技术解密(3)
发布时间:2008-06-11 12:24:00
九:PageRank的计算方法
PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
其中PageRank (A)表示给定页面A的PageRank得分;
D为阻尼因子,一般设为0.85;
PageRank (T1)表示一个指向A页的网站其本身的PageRank得分;
C(T1)表示该页面所拥有的导出链接数量;
PageRank (Tn)/C(Tn)表示为每一个指向A页的页面重复相同的操作步骤。
事实上,计算某个页面的PageRank得分需要大量繁复计算。例如若计算A页的PageRank得分则首先要知道所有链至A页的网页(导入链接)的PageRank得分。要想知道这些外部链接页的PageRank得分,又需要先知道这些页面的外部链接的PageRank得分,等等。我们只需要知道:
A页的外部链接B能够带给A的PageRank得分与B的导出链接数量成反比,即随着B上导出链接数的增加,带给A的PageRank得分亦随之降低。这同样表明了一个网页的PageRank得分是该网页对其它页面投票的一个基本的度量形式。一个网页可以投票给一个或多个导出链接,但其总投票权一定,并被平均分配给所有的导出链接。假设B的PageRank得分是5,且B上只有一条指向A的链接,那么A将获得B全部的PageRank得分(B没有损失任何东西,而A赢得了B的PageRank得分)。但如果B上有N个链接,则A只能得到B的PageRank得分的N分之一。
我们可以用图表来阐述其工作原理。假设有四个网页A,B,C和D,它们相互链接,如表-1所示:
表-1:链接前的PageRank得分
假设这四个网页初始PageRank得分均为0。则根据上面的公式它们的PageRank得分都是0.15。我们计算一下链接后各自的PageRank得分情况。
1.A链向B、C和D。A的初始PageRank得分是0.15,所以A的导出链接获得PageRank得分总数为 0.85 * 0.15 = 0.1275。B,C和D三个网页各得0.0425分。
2.B链向C、B的初始PageRank得分也是0.15,所以其唯一链接页面C所能够获得的PageRank得分是0.85 * 0.15 = 0.1275分。
C链向A,其0.1275的PageRank得分传递给唯一链接对象A。
D链向C,其0.1275的PageRank得分传递给了C。
现在各网页的PageRank得分结果如下:
A:0.15 + 0.1275 (得自C) = 0.2775
B:0.15 + 0.0425 (得自A) = 0.1925
C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475
D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
继续这样的计算,直到每个页面的数值逼近一个定值(PageRank属收敛函数)。最后可以发现,C的PageRank最高。而且外部链接的数量显著地改变了PageRank得的分布。
表-3:最后的PageRank得分结果
表-4:外部链接与PageRank得分对照表:
导入链接 数量 导出链接 数量 最终PageRank得分
C A/B/D 3 A 1 1.4860614724
A C 1 B/C/D 3 1.4131522515
B A 1 C 1 0.5503931379
D A 1 C 1 0.5503931379
十:PageRank的反馈性[出自chinaseo]
PageRank的反馈机制说明了为什么一个网站的导出链接能够使网站自身受益。
假设A页链向B,根据PageRank计算公式,其初始PageRank为0.15,链接后的PageRank变为1。如果A链向C,而C又链回A,则A此时的PageRank变成了1.4594594595。也就是说若A链向一个外部网页,而那个网页又回链向A的话,则使A的PageRank会增加。(如果A链向一个网页,而该网页又链向C,C再链向A的话,也会发生同样的情形)。如果把所有相互链接的页面看做是一个系统整体的话,其实链接前后系统总的PageRank并没有发生改变,只是由于不同链接关系的发生导致了PageRank对系统内每个链接页面的重新分布。
表-6-1:无链接交换时:A到E页都是已被Google收录的页面。其中A和B是我们网站的内页
A的PageRank得分: 1 1.3599321536
B的PageRank得分: 1 0.7279711653
网站的PageRank总分: 2 2.0879033189
其增量比较小,整体则视情况而定。但有一点是显而易见的 – 提供导出链接的网页往往会通过一种叫做PageRank反馈的机制提升了自身的PageRank。
结论:
这表明和一些大型站点进行互惠链接交换是比较明智的。这些大网站均采用链接结构,并对链接页给予高度关注。你所链接的对象站点所包含的网页数量及其设计结构对于你网站的PageRank反馈总数有着显著的影响。


猜你喜欢
- 为维持其“硬件+软件+服务”三合一连动发展的业务模式,IBM需要不断地推出新的概念来创造需求。IBM变得愈发令人难以捉摸了:我们看到的究竟是
- 今天收到google以官方的名义发布的邮件,全文内容如下:如果您已经收到本期款项,请您忽略此邮件。尊敬的发布商:我们很抱歉的通知您,我们本期
- 据新加坡《联合早报》10月15日报道,发明全球互联网的英国人伯纳斯承认,当初在网址前面加上双斜线实在有欠考虑。据报道,伯纳斯大约30年前想出
- 相较于前两年大型客户端网游一统江湖的局面,如今的网游市场可谓是遍地开花,尤其是网页游戏自去年以来的不俗表现,吸引了包括腾讯、盛大、网易等巨头
- 测绘之家是我一个朋友的小站。说它小是因为它的定位服务范围小,只是针对一个很小的专业的人才网站。在帮朋友建站推广这段时间,其在该专业主流搜索关
- 首先,解释下什么是资源的永久重定向,通俗简单理解下,当你在浏览器中输入sina.com.cn(新浪首页)的时候,网址是不是变成 www.si
- 做站长已经有好几年了,每次都在失望中结束。经过一番冷静思考以后,才知道经营网站不是想象的那么容易,一是需要下功夫,二是需要坚持。下功夫是要懂
- 1、新站没有提交,但2个星期内均被百度与google收录了。为什么没有提交就收录了?有的提交很久也不能被收录。这是正常的。只要你在别的地方有
- 本文收集总结了几点保护DNS服务器的有效方法。1.使用DNS转发器DNS转发器是为其他DNS服务器完成DNS查询的DNS服务器。使用DNS转
- 1、网站打开的速度要快;网站的打开速度,直接影响用户对所使用网站的感受。很难想像,一个半天都打不开的网站会给浏览者一种什么样的感觉。如果是我
- 前言最近在笔记本装了一个centos,想要让别人也可以登录访问,用自己的账号确实不太好,于是准备新建一个用户给他。发现网站这方便的资料比较少
- 我知道最近大家都听说了老版本的 Wordpress 被攻击的消息。如果你还没有升级你的博客到最新最好的 Wordpress 版本,现在就花点
- 服务器不仅仅是企业网络设备的中枢,也是企业软件及数据库应用的主体。在实际运行中服务器经常会出现这样或那样的故障,软件的或者硬件的。很多故障是
- CentOS简介CentOS 是一个基于Red Hat Linux 提供的可自由使用源代码的企业级Linux发行版本。每个版本的 CentO
- 第一步:创建自定义网络docker network create --subnet=172.18.0.0/24 docker-br0备注:这
- 站长之家(chinaz.com)3月17 日消息:时隔快1年,国内知名ASP平台的博客程序Zblog新版将再次与用户见面。据官方管理员称,Z
- linux 任务管理-后台运行与终止fg、bg、jobs、&、ctrl + z命令一、 &加在一个命令的最后,可以把这个命令
- 1、合理的配置权限,每个站点均配置独立的internet来宾帐号,限制internet 来宾帐号的访问权限,只允许其可以读取和执行运行网站所
- 10月29日消息,全球最大中文视频搜索引擎百度视频搜索(video.baidu.com)正式发布了新版首页,凭借百度庞大的视频数据库和超强的
- 网易科技讯 5月13日凌晨消息,微软今天正式在全球发布了包括MS Office 2010在内的商用平台软件。和以往相比,新商用软件平台最大的