Selected Category: 雪花的奧祕 -- Math & Tech (12)

View Mode: Post List Post Summary

有人講好,就一定有人講歹…這時陣,是欲如何是好咧?免煩惱,可以靠 twitrratr (http://twitrratr.com/) 來幫忙。

下圖顯示 twitrratr 的搜尋結果,首先它做了 Twitter search 找出含 query 的網友意見,然後再判斷各則意見是好評呢、負評呢、還是中立?最後得到統計數據。像Obama 的這個例子,可以很快知道網友意見的好壞比大概是 2:1。

我喜歡它整個界面的設計,很簡潔。不過,被歸到負評的 tweets,有不少是電腦誤判的,演算法還有再改進的空間。另外,它也還不能做中文搜尋。

 

twitrratr.JPG

Posted by ironsnow at 痞客邦 PIXNET Comments(1) Trackback(0) Hits(95)

也許很多人已經聽過,Google 的網頁評分方法叫做 PageRank,這個方法會對每個網頁算出一個分數,分數高的就容易在 Google 搜尋結果的前面出現。在概念上,網頁內容的 Authority (權威性)越高,分數就應該越高,困難的是,電腦根本不可能讀懂網頁的實際內容到底是什麼,更不用說自動去判斷這個網頁資訊是不是豐富清楚有權威,怎麼辦呢?當時 Google 的兩個創辦人就想到:網路的使用者是聰明的人類啊,好的重要的資訊自然有很多人想要引用,引用就會產生連結,所以當大家講某個特定的概念都連結到某個特定的網頁時,電腦程式就可以據以判斷「這個網頁在這個辭彙上有權威性」。像是這一段的第二句講 PageRank 附上連結到 wiki,對 Google 搜尋引擎來說,就像是我的這篇文章對於 wiki 解釋 PageRank 的網頁投下了一票贊成票一樣,這也就是為什麼有人說「網路是民主的」,因為有眾多使用者如你我在網路上自主地發表網頁和連結我們認為有用的網頁。

Posted by ironsnow at 痞客邦 PIXNET Comments(0) Trackback(0) Hits(137)

An anthropological introduction to YouTube by Michael Wesch
(很長的 video 有 55分鐘,但是講得很棒不要錯過)

Posted by ironsnow at 痞客邦 PIXNET Comments(0) Trackback(0) Hits(237)

這篇純筆記,怕以後找書不記得書名。

Bo Pang and Lillian Lee 的新書--Opinion Mining and Sentiment Analysis,有線上版可以直接看喔,想訂書請按這裡

Posted by ironsnow at 痞客邦 PIXNET Comments(2) Trackback(0) Hits(299)

昨天跟 ys 聊了一會兒她寫的網路分析文章, 想起之前看過的一篇論文,研究對象是使用 MSN Messenger 的人他們的社群互動行為(social network),分析2006年六月一整個月之中使用者上線及對話時間的記錄(放心,他們沒有也不能研究對話內容),總計有2億4000萬使用者,這些 使用者之間共產生了300億筆對話記錄,這應該是截至目前為止關於社群網路最大規模的研究了。

Paper source:Planetary-Scale Views on a Large Instant-Messaging Network (作者是 CMU博士班學生 Jure Leskovec 和 Microsoft Research 的大頭 Eric Horvitz)

Posted by ironsnow at 痞客邦 PIXNET Comments(2) Trackback(0) Hits(423)

1 2 3