当前位置: 首页 > 系统教程 > SEO教程 > 详细页面

Google PR

时间:2017-07-30 02:16来源:ZAC 作者:admin

PR是PageRank的缩写。Google PR理论是所有基于链接的搜索理论中最有名的。SEO人员可能不清楚本节介绍的其他链接理论,但不可能不知道PR。
PR是Google创始人之一拉里佩奇发明的,用于表示页面重要性的概念。用最简单的话说就是,反向链接越多的页面就是越重要的页面,因此PR值也就越高。
Google PR有点类似于科学文献中互相引用的概念,被其他文献引用较多的文献,很可能是比较重要的文献。
(1)PR的概念和计算
我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页面之间的有向链接传递着页面的重要性。一个链接传递的PR值决定于链接所在页面的PR值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。
传递的PR值也取决于页面上的导出链接数目。对于给定PR值的页面来说,假设能传递到下级页面100份PR,页面上有10个导出链接,每个链接能传递10份PR;页面上有20个导出链接的话,每个链接只能传递5份PR。
所以一个页面的PR值取决于导入链接总数,链接源页面的PR值,以及链接源页面上的导出链接数目。
 
PR值计算公式:
PR(A)= (1-d)+ d( PR(t1)/C(t1)+ ... + PR(tn)/C(tn) )
A代表页面A。
PR(A)则代表页面A的PR值。
d为阻尼指数。通常认为d=0.85
t1...tn代表链接向页面A的页面t1到tn
C代表页面上的导出链接数目。C(t1)即为页面上的导出链接数目。
 
(2)PR的两个比喻模型
投票。链接就像民主投票一样,A页面链接到B页面,就意味着A页面对B页面投了一票,使得B页面的重要性提高。同时,A页面本身的PR值决定了A所能投出去的投票力,PR值越高的页面,投出的票也更重要。在这个意义上,传统基于关键词匹配的算法是看页面自己说页面内容是什么,基于链接的PR则是看别人怎么评价一个页面。
随机冲浪。假设一个访问者从一个页面开始,不停地随机点击链接,访问下一个页面。有时候这个用户感到无聊了,不再点击链接,就随机跳到了另一个网址,再次开始不停地向下点击。所谓PR值,就是一个页面在这种随机冲浪访问中被访问到的概率。
一个页面导入链接越多,被访问到的概率就越高,因为PR值也越高。
阻尼系数也与随机冲浪模型有关。(1-d)=0.15 实际上就是用户感到无聊,停止点击,随机跳到新URL的概率。
 
(3)工具条PR
真正的用户排名计算的Google PR值我们是无法知道的,我们所能看到的只是Google工具条PR值。工具条PR值并不是真实的PR值的精确反应。已不再更新。
 
(4)关于PR的几个误解
PR的英文全称PageRank。名字源于发明人佩奇(Page)。不过约定俗成,一语双关。PR也就称之为页面级别。
PR值只与链接有关。有反向链接就有PR,没有反链就没有PR。
工具条PR值更新与页面排名变化在时间上没有对应关系。因为PR时时刻刻都在变。
(5)PR的意义
Google PR现在是一个被过度宣传的概念,其实PR只是Google排名算法的200多个因素之一,而且重要性已经下降很多。
不过,PR还是Google排名算法中的重要因素之一。除了直接影响排名,PR的重要性还体现在下面几点。
(1)网站收录深度和总页面数。搜索引擎蜘蛛爬行时间及数据库的空间都是有限的。Google希望尽量优先收录重要性高的页面,所以PR值越高的网站能被收录更多页面,蜘蛛爬行内页的深度也更高。对于大中型网站来说,首页的PR值是带动网站收录的重要因素之一
(2)访问及更新频率。PR值越高的网站,搜索引擎蜘蛛访问得就越频繁,网站上出现新页面或旧页面上内容更新时,都能更快地被收录。由于网站新页面通常都会在现有页面上出现链接,因此访问频率高也就意味着新页面被发现的速度快。
(3)重复内容判定。当Google在不同网站上发现完全相同的内容时,会选出一个作为原创,其他作为转载或抄袭。用户搜索相关查询词时,被判断为原创的那个版本会排在前面。而判断哪个版本为原创时,PR值也是重要因素之一。这也就是为什么那些权重高、PR值高的大网站,转载小网站内容却经常被当作原创的原因。
(4)排名初始子集的选择。前面介绍排名过程时提到,搜索引擎选出所有与关键词匹配的文件后,不可能对所有文件进行相关性计算,因为返回的文件可能有几百万、几千万,搜索引擎需要从中挑选出一个初始子集,再做相关性计算。初始子集的选择显然与关键词相关度无法,而只能从页面的重要程度着手,PR值就是与关键词无关的重要度指标。
现在的PR算法与当初拉里佩奇专利中的描述相比肯定有了改进和变化。一个可以观察到的现象是,PR算法应该已经排除了一部分Google认为可疑或者无效的链接,比如付费链接、博客和论坛中的垃圾链接等。所以有时候我们会看到一个页面有PR6甚至PR7的导入链接,经过几次工具条PR更新后,却还维持在PR3甚至PR2。按说一个PR6或7的链接,应该能把被链接的页面带到PR5或PR4。所以很可能Google已经把一部分它认为可疑的链接排除在PR计算之外。
再比如,同一个页面上不同位置的链接是否应该传递出去相同数量的PR值?正文、侧栏导航、页脚的链接应该同等对待吗?按照最初的PR设计,是的,因为没有考虑链接位置。但显然,不同位置的链接重要性是不一样的,被真实用户点击的概率也是不一样的,那么传递出去的PR值是否也应该不一样呢?现在的Google PR值算法中是否已经引入了矫正呢?
PR专利发明人是拉里佩奇,专利所有人是斯坦福大学,Google公司拥有永久性排他使用权。
虽然PR是Google拥有专利使用权的算法,但其他所有主流搜索引擎也都有类似算法,只不过不称为PR而已。所以这里提到的PR的作用和意义,同样适用于其他搜索引擎
 
 

上一篇:TrustRank算法

下一篇:Hilltop算法