第二個奇蹟:演算法網絡

現代搜尋引擎的故事,緣起於1916年維也納南方的難民營。在義大利軍隊佔領當地之前,醫生雅各.莫瑞諾負責大約一萬名已安置完成的難民之醫療。當時,他想尋找一個能緩解難民間緊張關係的途徑。為此,他想要知道,誰和誰處得來。他需要一個能讓數千人的社會網路一目瞭然的方法。這個引導他對於網絡做特別思考的點子,就是1998年開始的搜尋網頁判斷依據的核心。

 

為了能了解GOOGLE核心,如同莫瑞諾身為社會學家做過的事情一樣,我們造訪了一個小學班級。我們並非出現在數學課堂,而是下課時間。我們詢問每位正在玩耍的孩子,哪些小朋友是他的朋友,然後把結果畫在一張紙上【在家長開始打電話抗議之前,我們先強調所有資料都是匿名的】。

 

我們在一張A4白紙上畫了許多格子,每位孩子都在上面。如果保羅說,李安德是他的朋友,我們就從保羅這邊畫一個箭頭往李安德那邊去。小學下課時間第一課:這卻不表示從李安德這邊也會發出一個箭頭給保羅,友誼有時候是不對稱的。深入研究友誼網絡的人會發現,在當中有足球隊員、少女殺手、特立獨行的怪人、局外人,以及憂國憂民者。即使沒看過這些孩子,沒與他們交談過,眾多格子與箭頭形成了一本充滿友情、嚮往與悲傷的校園小說:這個網絡結構展現了複雜的人際關係特徵。小學休息時間第二課:把完成的圖給整個班級看,每位學生不僅都能精確地認出誰是誰,還能知道誰把誰當作朋友【因為被告知實驗是不記名而放心的父母,真的非常天真】。

 

看來,我們可以藉由格子和箭頭確認社會角色。然而,我們是依照什麼認出某些特定的社會角色呢?我們需要為每個班級設定新的論點與觀點,寫出不同的小說嗎?或是有沒有一些,比如說,找出人緣最好的學生的普遍性規則?我們來試試看,人緣最好的學生是得到最多箭頭的學生,這是個好的判斷依據嗎?不是,因為這樣很快就會出現問題。有些學生對於這個問題的解釋比較輕率;有些學生則只把真正要好的朋友認定為朋友。足球隊員彼此都把全隊每個人都當成朋友,但這卻不代表,班上所有的足球隊員人緣都特別好。

 

氣泡粉與企業顧問

我們必須調整一下判斷依據。把許多同學都視為好朋友的人,其箭頭可信度比起把少數同學認定為朋友的學生,要來得低。我們可以如此想像,每個孩子都得到一小包氣泡粉,他必須把這包粉平分給所有好朋友。如果有人說他有三位好友,每位朋友就會得到三分之一包的氣泡粉。擁有十位朋友的人,他的每位朋友就都只得到一點點。在所有學生把氣泡粉分配完畢之後,有些孩子得到許多,有些則少些。如此便能測量出孩子人緣的好壞。

 

那麼,結果看起來如何呢?每位足球隊員都從其他隊友那裡得到一點點氣泡粉。但如果每位足球隊員都把所有隊友視為朋友,最後每位隊員又都會重新得到一整包氣泡粉。三個朋友組成的「團」,則從其他兩位朋友各得到半包氣泡粉,這加總起來也是一整包氣泡粉。因此現在關鍵差別會出現在,如果有人也從其他團體得到氣泡粉,或是在同個團體中得到比其他人更多的氣泡粉。氣泡粉判斷依據對於我的人緣,顧及到了兩個觀點。第一,有多少同學認為我是他們的朋友。第二,我自己又與多少人分享友誼【聽起來像一個實用的人緣判斷依據,而且只要氣泡粉就可以算得清楚】。

 

這是一個判斷學生人緣好壞的理想依據嗎?我認為,家長會說是。教師是否應該使用這個判斷依據評估學生的社會能力呢?其實他們早就這麼做了。因為,即使沒有進行這項實驗,班上最基本的網絡結構多多少少已經存在於師生的印象之中了。應用客觀的數學方法進行的社會能力評鑑,有任何不妥嗎?如果想要否決它不予使用,更理想的判斷依據會是怎樣呢?

 

有其他適用於網絡的判斷依據。我們再做另一項調查,這次在辦公室。我們訪問每位員工,他們願意聽從或接受誰的建議。我們再次使用箭頭圖,並嘗試從網絡中讀出誰真的具影響力。如果許多箭頭都指向一位員工,就表示他擁有強大的影響力。相反地,如果許多箭頭都離開一位員工,則表示他誰的話都聽,因此我們將他的箭頭可信度評估得稍微低一些。到這裡,小學的氣泡粉判斷依據仍然適用,不過還是有什麼地方怪怪的。警衛認為我很重要,與一位具有影響力的同事認為我很重要,兩者是不一樣的。相較於一個沒有實權的人給我的箭頭,一個富權威的同事給我的箭頭,讓我擁有比較多權力。所以,箭頭應該相對地擁有強度不同的評估。我們可以把這個效力問題與氣泡粉判斷依據結合嗎?我們想做的事聽起來有點像在繞圈圈。在知道某位員工具有多少權力以前,我們必須知道聽從他意見的同事本身擁有多少權力【聽起來不只像在繞圈圈,根本就是在繞圈圈】。不過,在網絡裡是不需要害怕繞圈圈啦。

 

解決辦法是一位負責分發氣泡粉的企業顧問。他已經事先知道公司裡真實的權力分配結構,並按照此結構分發氣泡粉。我們可以檢驗看看他的分法配是否有意義,我們可以這麼做:員工和小學生一樣把自己的氣泡粉分發出去。但唯一的不同在於,在學校裡,一開始每個人都擁有同樣多的氣泡粉;在公司裡,則按照顧問猜測誰的權力比較大,這些人從一開始就擁有比較多的氣泡粉,其他人則相反。當大家都把氣泡粉分完後,如果最後的結果是每個人都得到和一開始同樣多的量,就表示整個分配是正確的,這被稱做「穩定分配」,因為按照小學實驗規則,其分配並無任何改變。數學家針對這種穩定分配已經思考良久,並且發展出不同的演算法來計算它們。

 

家長會

演算法是技術性的細節。更有趣的問題則往往一點都不數學:我們有理想的權力分配判斷依據嗎?這個評估結果有什麼用處呢?可以找到地下老闆嗎?如果真有一位企業顧問來訪,並進行這樣的評估,是否會很有趣?這個新的評斷依據也適用於小學實驗嗎?班上的人氣王得到的人緣箭頭,不應該比任何一種箭頭都來得有價值嗎?家長可會不太高興,因為「每個孩子都一樣重要。」【在我的學生時期,班上總是有比別人重要的學生】。身為數學家,我無法有什麼意見。不管是辦公室還是學校,這個判斷依據並不是非用不可的。如果中國剩餘定理適合做橋墩的話,那麼這樣一個判斷依據,特別是對每位學生的評估,就與生髮水相當類似:你可以使用它,但不該對結果有錯誤期待。

 

在家長會的討論中,這個判斷依據至少有三個明顯的問題:我們用以翻譯成箭頭的問題,其實給予受訪者非常大的詮釋空間。贊成這方法的人(在家長會中應該會出現)會欣然同意,在評估網絡時也應該把因為詮釋空間很大所造成的差異與拉扯考量進去。

 

第二個問題與讓這一切開始的那句話有關。「這個網路的結構,展現了複雜人際心理特徵。」看見圖的人通常會先傾向於相信它,不過這個圖真的能讓每個人都得到可信度高的評估嗎?

 

最大的問題是一開始的笨問題:誰是人緣最好的學生?網絡,並不是完美的學校現實寫照。不過它至少展現了一部分的多元性,學生可以參與實驗或不參與。相反地,每個以人緣好壞樹立起階級順序的方法絕對太過單一。誰要是把網絡變成順序,就糟蹋了資訊。

 

一個笨問題不會有聰明的判斷依據。這個問題之所以笨,是笨在我們持續問笨問題:最好的大學是哪一所?誰是最棒的科學家?誰是最厲害的醫生?哪些是最夯的書?哪些網頁最有趣?我們人類就愛問這種問題。你只能在一所大學註冊,大學的每個系所只能任命一位科學家當教授,只有一位專家可以為你進行手術。人就是只能一個,或是最多只能看最前面那幾筆搜尋引擎找到的結果。

 

演算法星球: 七天導覽行程,一次弄懂演算法

arrow
arrow
    全站熱搜

    讀書共和國 發表在 痞客邦 留言(0) 人氣()