twitrratr.JPG
有人講好,就一定有人講歹…這時陣,是欲如何是好咧?免煩惱,可以靠 twitrratr (http://twitrratr.com/) 來幫忙。
下圖顯示 twitrratr 的搜尋結果,首先它做了 Twitter search 找出含 query 的網友意見,然後再判斷各則意見是好評呢、負評呢、還是中立?最後得到統計數據。像Obama 的這個例子,可以很快知道網友意見的好壞比大概是 2:1。
我喜歡它整個界面的設計,很簡潔。不過,被歸到負評的 tweets,有不少是電腦誤判的,演算法還有再改進的空間。另外,它也還不能做中文搜尋。

ironsnow 發表在 痞客邦 留言(1) 人氣()


也許很多人已經聽過,Google 的網頁評分方法叫做 PageRank,這個方法會對每個網頁算出一個分數,分數高的就容易在 Google 搜尋結果的前面出現。在概念上,網頁內容的 Authority (權威性)越高,分數就應該越高,困難的是,電腦根本不可能讀懂網頁的實際內容到底是什麼,更不用說自動去判斷這個網頁資訊是不是豐富清楚有權威,怎麼辦呢?當時 Google 的兩個創辦人就想到:網路的使用者是聰明的人類啊,好的重要的資訊自然有很多人想要引用,引用就會產生連結,所以當大家講某個特定的概念都連結到某個特定的網頁時,電腦程式就可以據以判斷「這個網頁在這個辭彙上有權威性」。像是這一段的第二句講 PageRank 附上連結到 wiki,對 Google 搜尋引擎來說,就像是我的這篇文章對於 wiki 解釋 PageRank 的網頁投下了一票贊成票一樣,這也就是為什麼有人說「網路是民主的」,因為有眾多使用者如你我在網路上自主地發表網頁和連結我們認為有用的網頁。

根據研究,大家上網路的目的除了獲取知識以外,另外一個目的是了解他人的意見(見:筆記)。然而新聞報導、部落格評論、論壇意見…充斥在茫茫網海裡,大家有沒有一種資訊很多,卻不知從何找起的困擾呢?除了像書籤網站那樣依靠使用者聚志成城的 digg 或是像台灣的 funp,研究者也在嘗試哪些自動化方法可以幫助使用者更有效率地獲取多元的訊息,這一周內我就看到了兩個這樣的網站哩,大概是因為美國總統大選將至,此類研究正火紅吧。趕緊來介紹。

ironsnow 發表在 痞客邦 留言(0) 人氣()

An anthropological introduction to YouTube by Michael Wesch
(很長的 video 有 55分鐘,但是講得很棒不要錯過)

ironsnow 發表在 痞客邦 留言(0) 人氣()

這篇純筆記,怕以後找書不記得書名。
Bo Pang and Lillian Lee 的新書--Opinion Mining and Sentiment Analysis,有線上版可以直接看喔,想訂書請按這裡。

ironsnow 發表在 痞客邦 留言(2) 人氣()


昨天跟 ys 聊了一會兒她寫的網路分析文章, 想起之前看過的一篇論文,研究對象是使用 MSN Messenger 的人他們的社群互動行為(social network),分析2006年六月一整個月之中使用者上線及對話時間的記錄(放心,他們沒有也不能研究對話內容),總計有2億4000萬使用者,這些 使用者之間共產生了300億筆對話記錄,這應該是截至目前為止關於社群網路最大規模的研究了。
Paper source:Planetary-Scale Views on a Large Instant-Messaging Network (作者是 CMU博士班學生 Jure Leskovec 和 Microsoft Research 的大頭 Eric Horvitz)
這篇文章裡有一些有趣的數據,報乎大家知:

ironsnow 發表在 痞客邦 留言(2) 人氣()

由華盛頓大學與微軟實驗室合作的 MySong,在今年春天的 CHI (Computer-Human Interaction) Conference 發表。請看以下的影片介紹:

使用者只要哼旋律把它錄起來,MySong 就會利用 Band-in-a-Box 技術自動搭配和弦來伴奏,更好玩的是,它加上了選擇快樂程度的選項,所以同一個旋律可以根據心情挑選不同的和弦來搭配,如果你不滿意它幫你挑的和弦,它會建議你其他適合的和弦,讓使用者自己選擇調整。另外,根據我最近看到的報告,開發人員又加入新功能 -- Jazziness,跟和弦是否緊緊搭配著旋律還是比較 free style 有關。
MySong 底層技術用的是 Hidden Markov Model,其實沒有很難,資訊系的學生大概都會吧。但是結合了音樂知識,再加上把數學模型 (probability matrices)轉化成大家都能很簡單理解的 Happiness、Jazziness,就變成一款很有趣的軟體啦。

ironsnow 發表在 痞客邦 留言(1) 人氣()

1. Award Winner: Best New Product - Fonolo

這是今年三月在 Emerging Communications Conference 得到最佳新產品獎的公司,它將提供客服專線的搜尋引擎服務。我們打服務專線的時候,常常會有語音選單,「繳費請按1,技術支援請按2 .....」,按了以後進入下一層選單 etc,有時真是煩瑣到爆炸。Fonolo 的服務就是要解決這個問題。它事先搜索了常用的客服專線,把這些專線提供的所有項目轉變成網址,讓大家可以查詢並且選擇想要的客服服務,然後 Fonolo 會幫你打電話把這些選單自動選好接到指定的目的地,再把電話轉到使用者的手機,大家就不用浪費時間在無聊的語音選單或「請稍等」的轉接上了。此項服務需要 有 phone crawler + online speed recognition 等多項技術整合起來才辦得到呢。
2.

ironsnow 發表在 痞客邦 留言(0) 人氣()



(image source: http://graphics8.nytimes.com/images/2008/04/16/us/0416-nat-subOBAMA.jpg)

這張圖是紐約時報的 Amanda Cox 所製(被部落客Nathan發現在這裡)。新聞裡可以出現決策樹分析,很酷吧。
兩個重點能力:如何分析資料以及如何視覺化結果。她用決策樹法分析以郡為單位的民主黨初選結果,並且以簡潔的圖示表現出來。

ironsnow 發表在 痞客邦 留言(5) 人氣()


今天去圖書館借書,在我想借的書旁邊看到一本叫做「數學家的心靈」的書,書名很吸引人,就順便借了回來。下午等待實驗結果之餘,看了這本書的序,寫序的人盛讚這本書的作者賈桂斯.哈達馬得 ( Jacques Hadamard ) 對數學的貢獻,就上網查了一下,哈達馬得何許人也。一查之下,才發現他就是鼎鼎大名的「質數定理 (Prime number theorem) 」的證明者,而「數學家的心靈」也是一本開認知科學先趨的書。書還沒讀完,沒辦法分享,不過和哈達馬得先生這麼有緣,來介紹一下他到底證明了什麼。

大家還記得質數是什麼嗎?就是除了 1 和自己以外,不能被分解成別的數連乘的數。例如 31 是質數,但是 33 = 3*11 就不是質數。

ironsnow 發表在 痞客邦 留言(6) 人氣()


下表包含了十個人(五男五女)他們心目中的理想對象排名。如果你是媒人的話,你會把怎麼把他們湊成五對,並且保證這十個人婚後不會外遇呢?又,外遇只會發生在當你安排了
A 女 和 M 男 結婚
B 女 和 K 男 結婚
由下表可知, A 喜歡 K 多於 M,K 也喜歡 A 多於 B,所以 A 和 K 就會背著 M 和 B 外遇啦。

ironsnow 發表在 痞客邦 留言(15) 人氣()


上一篇「理髮師的困境」裡用了Diagonalization的方法證明這個世界上實數比自然數(零加上正整數)還要多。這一篇要討論什麼呢?那–就–是:這個世界上有理數是不是也和實數一樣,比自然數還要多?
如果你忘記什麼叫做有理數的話,有理數的定義是這樣的:可以代表兩個整數之間比例的數,例如 2/3 是個有理數,因為 2 和 3 都是整數。(叉題一下,有理數的英文是 rational number, 其實應該要翻成「比例數」才對,因為 rational 除了有「理性的」意思以外,也有「符合比例 (ratio) 的 」這個意思,但是第一個中文翻譯的人大概數學不太好,就…)
我們先來算一算吧,自然數有 0, 1, 2, 3, 4,  .....  有理數有 0, ..., 1/4, 1/3, 1/2, ...., 1, ..., 5/4, 4/3, 3/2, ...., 2, .... 所以,有理數比自然數多吧!但是,這文章的標題叫做「自然數和有理數的驚人事實」,難道是自然數比有理數多?
在這裡要先賣個關子,因為要了解數學家怎麼去思考這個問題,必需要先了解什麼叫做

ironsnow 發表在 痞客邦 留言(5) 人氣()

在一個小鎮裡,只有一個理髮師阿怪,阿怪很有原則,他只幫那些不替自己刮髮子的人刮鬍子。
小鎮裡所有的男人都有刮鬍子。
問題來了,那誰幫理髮師阿怪刮鬍子呢?

如果阿怪不幫自己刮鬍子的話,根據原則阿怪就得幫自己刮鬍子,因為全村男人都有刮鬍子而且阿怪是唯一的理髮師。

ironsnow 發表在 痞客邦 留言(5) 人氣()

1
Blog Stats
⚠️

成人內容提醒

本部落格內容僅限年滿十八歲者瀏覽。
若您未滿十八歲,請立即離開。

已滿十八歲者,亦請勿將內容提供給未成年人士。