也許很多人已經聽過,Google 的網頁評分方法叫做 PageRank,這個方法會對每個網頁算出一個分數,分數高的就容易在 Google 搜尋結果的前面出現。在概念上,網頁內容的 Authority (權威性)越高,分數就應該越高,困難的是,電腦根本不可能讀懂網頁的實際內容到底是什麼,更不用說自動去判斷這個網頁資訊是不是豐富清楚有權威,怎麼辦呢?當時 Google 的兩個創辦人就想到:網路的使用者是聰明的人類啊,好的重要的資訊自然有很多人想要引用,引用就會產生連結,所以當大家講某個特定的概念都連結到某個特定的網頁時,電腦程式就可以據以判斷「這個網頁在這個辭彙上有權威性」。像是這一段的第二句講 PageRank 附上連結到 wiki,對 Google 搜尋引擎來說,就像是我的這篇文章對於 wiki 解釋 PageRank 的網頁投下了一票贊成票一樣,這也就是為什麼有人說「網路是民主的」,因為有眾多使用者如你我在網路上自主地發表網頁和連結我們認為有用的網頁。
根據研究,大家上網路的目的除了獲取知識以外,另外一個目的是了解他人的意見(見:筆記)。然而新聞報導、部落格評論、論壇意見…充斥在茫茫網海裡,大家有沒有一種資訊很多,卻不知從何找起的困擾呢?除了像書籤網站那樣依靠使用者聚志成城的 digg 或是像台灣的 funp,研究者也在嘗試哪些自動化方法可以幫助使用者更有效率地獲取多元的訊息,這一周內我就看到了兩個這樣的網站哩,大概是因為美國總統大選將至,此類研究正火紅吧。趕緊來介紹。
第一個網站是 Memeorandum:
這個網站每五分鐘會重新收集新聞報導及網路上的部落格(它有一個 targeting blog list),每篇文章的分數是依據它被其它部落格、新聞引用、評論的數目來計算的,分數越高會被排在越前面出現。下圖的頭條好像是某個共和黨名人之子在他的部落格公佈他要投給 Obama,後面Discussion的部份就是討論這篇文章的其他部落格列表。它跟 digg/funp 這樣書籤網站的不同之處是,不靠使用者去推薦,而是自動去搜尋網路上的相關討論,討論越多就算越熱門。
第二個網站是 Microsoft Labs 推出的 Political Streams:
這個網站還在非常初期的實驗階段,但是可以看出 Microsoft 的研究人員對於統整性資訊的構想,有四個主要的分類:新聞、部落格、名人、地點。每一篇文章/人物的分數是這些分類各別分數的綜合,箭頭指出這篇文章或人物近期受矚目的程度是上升或下降。
接著進入某一則文章裡會得到該篇文章更仔細的資訊,像是是哪些部落格在討論,關於這篇文章有提到的名人他們最近被討論的趨勢是如何等等。
感想:雖然電腦還是很笨,沒辦法了解網頁真實的內容,但是,只要大家願意在網路上發表自己的意見、締造有意義的連結,電腦可以透過分析網頁互連的特性,統合出一個更為貼近基層的聲音出來。
留言列表