PageRank算法




在諸如Google一類(lèi)搜索引擎中使用PageRank(PR值)來(lái)量化網(wǎng)站的排名,PageRank是一系列算法,能對(duì)每個(gè)網(wǎng)頁(yè)給出一個(gè)數(shù)值,表示網(wǎng)頁(yè)在互聯(lián)網(wǎng)中的重要性[5] 。PageRank的具體細(xì)節(jié)還沒(méi)有公開(kāi),該算法最早出現(xiàn)在其創(chuàng)始人的一篇論文中,是利用頁(yè)面相關(guān)性得分(RelevancyScore)+頁(yè)面等級(jí)得分(PageRank)來(lái)決定頁(yè)面的相關(guān)性與重要性。該算法首先找到所有與查詢(xún)關(guān)鍵詞相匹配的網(wǎng)頁(yè),然后根據(jù)頁(yè)面因素等進(jìn)行排名,最后通過(guò)PageRank得分調(diào)整網(wǎng)站排名結(jié)果[5] 。 假設(shè)網(wǎng)頁(yè)A有網(wǎng)頁(yè)t1,t2,····,tn的鏈接指向它,則PageRank的原始公式為:PR(A)=(1-d)+d(PR(t1)/C(t1)+····+PR(tn)/C(tn))其中d為阻尼系數(shù)(dampingfactor),一般設(shè)為0.85;PR(A)是網(wǎng)頁(yè)A的網(wǎng)頁(yè)級(jí)別 (PageRank);C(tn)是網(wǎng)頁(yè)tn的指向外部鏈接的總數(shù)量。公式可描述為:A網(wǎng)頁(yè)的PR值等于鏈向該頁(yè)面的所有鏈接頁(yè)面的PR值分別除以各自的外部鏈接數(shù)量的總和,再加上(1-d)。