假設(shè)一個(gè)由4個(gè)頁(yè)面組成的小團(tuán)體:A,B, C 和 D。如果所有頁(yè)面都鏈向A,那么A的PR(PageRank)值將是B,C 及 D的和。
PR(A) = PR(B) + PR(C) + PR(D)
繼續(xù)假設(shè)B也有鏈接到C,并且D也有鏈接到包括A的3個(gè)頁(yè)面。一個(gè)頁(yè)面不能投票2次。所以B給每個(gè)頁(yè)面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的 PageRank 上。
PR(A) =PR(B) /2+PR(C) /1+PR(D)/3
換句話說(shuō),根據(jù)鏈處總數(shù)平分一個(gè)頁(yè)面的PR值。
PR(A) =PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)
最后,所有這些被換算為一個(gè)百分比再乘上一個(gè)系數(shù)q。由于下面的算法,沒(méi)有頁(yè)面的PageRank會(huì)是0。所以,Google通過(guò)數(shù)學(xué)系統(tǒng)給了每個(gè)頁(yè)面一個(gè)最小值1-q。
PR(A) =(PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)+...+PR(N)/L(N))q+1-q
所以一個(gè)頁(yè)面的 PageRank 是由其他頁(yè)面的PageRank計(jì)算得到。Google 不斷的重復(fù)計(jì)算每個(gè)頁(yè)面的 PageRank。如果您給每個(gè)頁(yè)面一個(gè)隨機(jī) PageRank 值(非0),那么經(jīng)過(guò)不斷的重復(fù)計(jì)算,這些頁(yè)面的 PR 值會(huì)趨向于正常和穩(wěn)定。這就是搜索引擎使用它的原因。
其中,PR(A):指網(wǎng)頁(yè)A的佩奇等級(jí)(PR值)
PR(B)、PR(C)...PR(N)表示鏈接網(wǎng)頁(yè)A的網(wǎng)頁(yè)N的佩奇等級(jí)(PR)。N是鏈接的總數(shù),這個(gè)鏈接可以使來(lái)自任何網(wǎng)站的導(dǎo)入鏈接(反向鏈接)。
L(N):網(wǎng)頁(yè)N往其他網(wǎng)站鏈接的數(shù)量(網(wǎng)頁(yè)N的導(dǎo)出鏈接數(shù)量)
q:阻尼系數(shù),介于0-1之間,google設(shè)為0.85.
從上面的公式我們可以看到網(wǎng)頁(yè)A的PR是由鏈接它的其他網(wǎng)頁(yè)L(N)所決定的。在網(wǎng)頁(yè)L(N)中如果有一個(gè)鏈接指向網(wǎng)頁(yè)A,那么A就得到了一個(gè)“投票氣而這個(gè)投票來(lái)自網(wǎng)上任何一張網(wǎng)頁(yè)。每個(gè)“投票”都是表示一份“支持”。越多的鏈接指向網(wǎng)頁(yè)A,網(wǎng)頁(yè)A的PR值或者等級(jí)就越高。沒(méi)有鏈接就是沒(méi)有一個(gè)網(wǎng)頁(yè)支持A。
但是不同網(wǎng)頁(yè)的PR值不同,所以不同的網(wǎng)頁(yè)給網(wǎng)頁(yè)A的投票權(quán)重是不一樣的。
完整的PR值計(jì)算方法
這個(gè)方程式引入了隨機(jī)瀏覽的概念,即有人上網(wǎng)無(wú)聊隨機(jī)打開(kāi)一些頁(yè)面,點(diǎn)一些鏈接。一個(gè)頁(yè)面的PageRank值也影響了它被隨機(jī)瀏覽的概率。為了便于理解,這里假設(shè)上網(wǎng)者不斷點(diǎn)網(wǎng)頁(yè)上的鏈接,最終到了一個(gè)沒(méi)有任何鏈出頁(yè)面的網(wǎng)頁(yè),這時(shí)候上網(wǎng)者會(huì)隨機(jī)到另外的網(wǎng)頁(yè)開(kāi)始瀏覽。
為了對(duì)那些有鏈出的頁(yè)面公平,q = 0.15(q的指阻尼系數(shù))的算法被用到了所有頁(yè)面上,估算頁(yè)面可能被上網(wǎng)者放入書(shū)簽的概率。
所以,這個(gè)等式如下:

p1,p2,...,pN是被研究的頁(yè)面,M(pi)是鏈入pi頁(yè)面的數(shù)量,L(pj)是pj鏈出頁(yè)面的數(shù)量,而N是所有頁(yè)面的數(shù)量。
PageRank值是一個(gè)特殊矩陣中的特征向量。這個(gè)特征向量為

R是等式的答案

如果pj不鏈向pi, 而且對(duì)每個(gè)j都成立時(shí),等于 0

這項(xiàng)技術(shù)的主要缺點(diǎn)是舊的頁(yè)面等級(jí)會(huì)比新頁(yè)面高。因?yàn)榧词故欠浅:玫男马?yè)面也不會(huì)有很多上游鏈接,除非它是某個(gè)站點(diǎn)的子站點(diǎn)。
這就是PageRank需要多項(xiàng)算法結(jié)合的原因。Google經(jīng)常懲罰惡意提高PageRank的行為,至于其如何區(qū)分正常的鏈接交換和不正常的鏈接堆積仍然是商業(yè)機(jī)密。
但是我們始終堅(jiān)持一點(diǎn)是,大家不要刻意的去追求PR值,因?yàn)橛绊懪琶囊蛩赜猩习俜N。建議網(wǎng)站設(shè)計(jì)人員可以充分認(rèn)識(shí)佩奇等級(jí)在google優(yōu)化排名中的重要作用,從設(shè)計(jì)前的考慮到后期網(wǎng)站更新都要考慮一下佩奇等級(jí)。從而很好的利用google PageRank。




