唯有理解才能開啟自由的關係
曹家榮／世新大學社會心理學系助理教授

加拿大傳播學者，同時也是媒介理論宗師的麥克魯漢曾說過，在判斷各種科技帶來的轉變與影響之前，我們需要先就其本身進行理解。唯有如此，我們才可能避免如白日夢遊般，被科技炫目的表象所惑。在面對今天經常被稱為「黑箱」的演算法時，這半世紀前的箴言仍十分受用。
本書的作者大衛．桑普特可以說正是在類似的動機下，企圖帶領讀者更清楚地理解究竟演算法做了什麼？在桑普特看來，老是要把演算法想成「黑箱」，或是比做生人勿近的武器，也許能提醒我們小心演算法的危害，但卻無法讓我們「理解」得更多。但唯有透過理解演算法，我們才可能避免成為演算法的俘虜。中譯本將本書中的Outnumbered譯為「數俘」，讀來因此也深具意味。
本書由三個部分組成，第一個部分討論演算法如何分析我們，第二個部分討論演算法如何影響我們，最後第三個部分則問，以演算法為基礎的AI是否將成為我們？三個部分分別探討了這幾年相當重要的幾個議題：劍橋分析事件、Facebook的情緒實驗、為什麼川普會跌破眾人眼鏡當選、Facebook是造就同溫層現象的罪魁禍首嗎、AI有性別歧視嗎、AI是否將成為人？正閱讀著本文的你，也許會問：「這很多人談過了不是？」不，這本書也許跟你想的不一樣。我誠摯地建議你，跟我一起看下去。

演算法真的懂我嗎？

你大概曾經跟我有相似的經驗，上一秒正在跟朋友聊著假期該去哪裡玩，下一秒打開Facebook就發現相關旅遊去處的廣告。這時候我們通常會有兩種反應，一種是開心地想「哇！Facebook真懂我！」，另一種則是「哇！Facebook是不是在偷聽我說話！」。前者大概可以說是一種天真的樂觀主義者，後者則很像是某種科技恐懼的症狀。但Facebook到底是真的懂我，還是偷偷竊聽我的壞蛋呢？桑普特指出，其實都不是。
Facebook到底做了什麼？回到對於Facebook推薦廣告演算法的剖析，桑普特說明了這背後其實就是以所謂「主成分分析」方法運算出的結果。也就是說，Facebook的演算法透過收集使用者所有的「按讚」之後，便可以建構出用以描繪使用者的數百個不同的維度，藉此來「了解」使用者。
這聽起來是不是相當神奇，所以Facebook真的懂我嗎？這個問題很重要，特別是如果你聽過「劍橋分析」這家公司的話。2018年3月，一家名為「劍橋分析」的數據分析公司因不當取得大量Facebook用戶資料而登上新聞版面。但在此之前，這家公司可是因為宣稱川普的勝選都歸功於他們而聲名大噪。在2016年的一場會議演講上，劍橋分析公司的執行長亞歷山大．尼克斯說，他們有辦法能夠「預測美國每一位成年人的人格」，進而針對不同人格特質的人投放不同的競選廣告。亞歷山大．尼克斯暗示，這就是川普勝選的秘密武器。
但是，Facebook的演算法真的懂它的使用者，甚至還可以預測其人格特質嗎？藉由拆解劍橋分析公司的演算法，桑普特給出了否定的答案。其中討論的細節我想留給各位去閱讀，但我確實挺同意作者有點揶揄地將劍橋分析改名為「劍橋牛皮」（Cambridge Hyperbolytica）公司。如果稍微「劇透」一點的話，關鍵大概就在於：我們多大程度能將有某程度機率上的相關，看作是可預測的因果關係？
演算法是否真的能用來分析、弄懂一個人，還涉及另一個重要的議題，也就是：它是否能公平地評斷每一個人——特別是在一些攸關個人生存與生活處境的問題上？桑普特在此探討的案例，也是過去批評演算法的許多書裡曾討論過的，犯罪風險評估模型。但有別於僅是批評透過演算法來評估犯罪風險會有所偏誤，他更進一步說明了，其實關鍵在於，當我們要用演算法評估生存處境、條件、背景總是有差異的人群時，偏誤是不可能消除的。換言之，我們不應抱持的是，「演算法必然公平」這種幻想。甚至，也許該反過來思考，如果演算法能夠更精準地判斷某一弱勢群體的風險狀態，即便犧牲一點對優勢群體判斷的準確性，這是否會是一種值得嘗試的作法？

Facebook能操弄我？

劍橋公司是吹牛皮的，但Google、Amazon、Facebook這類平台可以透過演算法來影響、甚至操弄我們，總是真的了吧？近幾年，從川普勝選、英國脫歐等重大事件，甚至台灣社會過去經歷的幾次大選、公投，我們都看到了網路的過濾氣泡與同溫層效應如何導致嚴重的後果。然而，桑普特依然不輕率地如此認為，一切還得待我們理解其中的演算法後再下評判。
例如，大概很多人都曾聽過那惡名昭彰的「Facebook情緒實驗」。不少人可能還可以說上兩句：Facebook的資料科學家違反研究倫理，在未經用戶同意下進行動態消息的訊息操弄，進而影響了使用者。若先擱置研究倫理的問題，桑普特指出，當我們實際去看這篇論文便會發現，其實這個實驗結果顯示的是：操弄動態消息對用戶的情緒「幾乎沒有影響」。換言之，這又是另一個吹牛皮的實驗，這篇論文以〈經由社群網路進行大規模情緒感染的實驗證據〉這樣聳動的標題誤導了讀者。
談到這裡，你心中可能會想，所以這傢伙是要說演算法根本沒那麼厲害？或甚至覺得，他根本是在想方設法替演算法「脫罪」吧。不，雖然我也不見得全然同意作者的觀點，但回到作者撰寫本書的初衷，我相信重點是，如何透過理解演算法進而讓自己免於成為「數字的俘虜」。這裡所謂數字的俘虜，其實更廣義地說便是，不加反思地接受了演算法或隱或顯地餵給我們的資訊。
譬如說，大概比較「無關痛癢」的像是，你在網路書店上買了本書，然後就看到網頁下方顯示「其他買了這本書的人也買了……」，於是你又買了更多的書。我必須承認，對我而言有時這確實挺方便的。我想要找某個主題的書，與其大海撈針地從搜尋結果裡一本一本看，這種「推薦」可以讓我很快地知道其他人也買了哪些同一主題的書。桑普特把產生這類效果的演算法稱為「也喜歡」。他在書中建構了一套簡化版本的「也喜歡」演算法模型，並藉此說明這類演算法的問題。問題在於，我以為其他人也跟我一樣仔細檢視後才買下某一主題的幾本「好書」，但實際上，「也喜歡」演算法的運算基礎根本不是「作品好壞」。更常見的情況反而是，某些書在一開始或隨機或因某些行銷手法被購買了，它就越可能成為被推薦的書籍，進而形成一種失控的回饋。於是，若我不檢視便購買了那些書，就等於讓自己成了桑普特所說的，掉進了演算法的「數俘」之中。
買錯書頂多是浪費錢，但如果接收到「錯誤資訊」呢？桑普特在書中也討論了近年來演算法操弄導致的「過濾泡泡」現象。今天，我們多半會認為Facebook這類社群媒體的演算法會導致過濾泡泡，進而形成今日人們憂心的同溫層現象。但情況真的有如此嚴重嗎？桑普特一方面透過自己建構模型，另一方面也訪談了許多相關問題的研究者，得出的結論大略是這樣的：首先，Facebook的演算法從簡化的模型來看，確實會形成過濾泡泡。但由於真實世界中使用者的「好友」實際上歧異性更大，因此過濾效應雖存在但並無想像中的嚴重。最後，也是我認為桑普特的討論中最重要的一點是，如果你讓自己的生活完全「鎖」在社群媒體的泡泡中，而不再從傳統或其他媒體接收資訊，那麼，你就真的越可能被演算法的過濾泡泡所「數俘」。

AI將要成為人？

在本書的最後一部分，問題也來到了近年來眾人矚目的焦點：以演算法為基礎的「人工智慧」（AI）是否將要成為人，甚或取代人？你現在大概猜得到桑普特的答案應該是否定的。他甚至主張，現今人工智慧的發展程度若與各種生物相比，大概只能說接近「肚子裡的壞菌」的層次而已。且不論這種比較是否令人信服，重點是，為什麼？AI到底現在能做什麼、又做不到什麼？
桑普特的討論中有幾個對我而言特別有意義的例子。像是，AI到底會不會有「性別歧視」這個問題。一方面，去年你可能跟我一樣也注意到一個新聞，微軟開發了一個聊天機器人，結果它竟然十足是個性別歧視者與種族主義者。另一方面，也有太多研究指出，像是Google搜尋有性別歧視、Amazon透過AI檢視應徵者履歷時也有性別歧視。這到底是怎麼回事？按理來說，演算法不就「只是」數學運算嗎？為什麼會「像人一樣」不斷引發這類爭議？
桑普特的解釋簡單來說是這樣：與性別歧視相似的問題背後涉及了自然語言處理的演算法。他以史丹佛自然語言處理團隊開發的GloVe演算法為例說明運作過程。GloVe在處理資料時，會將每個語詞置放在數百個維度空間的一個點上，藉此，每個語詞之間就會形成不同遠近距離的相對關係。換言之，我們要注意到，演算法不是真的「懂」語言，而只是在測量位於多維度空間中不同位置上的詞語之間的距離而已。
在訪談英國巴斯大學資訊科學家裘安娜時，桑普特總結的一句話我認為最具啟發性，他說：「演算法只是將我們的文化如何使用語詞量化而已」。這句話的意思是：有性別、種族以及各種歧視問題的，其實是我們人類自身。因為這類自然語言處理的演算法，往往是透過所謂「非監督式學習」來進行訓練。也就是說，演算法在學習的過程中，不會有人去確認它學了些什麼並給予回饋。因此，只要我們的文化無法去除各種歧視，那麼演算法永遠都只能透過內嵌著歧視的文本資料進行學習，然後再複製整個歧視的結構。
這種只能「學習」資料內嵌的文化模式、價值與知識的演算法，恐怕很難說是「有智慧」的。桑普特接著也以文本創作、打電動為例繼續說明：演算法也許真的能展現出令人驚豔的能力，像是可以「寫小說」、可以打敗世界棋王等等，但是要說演算法已經「像人」一樣會做這些事，恐怕還言之過早。一個關鍵的問題在於，桑普特主張，不管是由上而下設計的演算法，還是由下而上設計的演算法，只要演算法還無法像一般動物那樣，將自身已有的知識外推到其他現象上，那麼AI要成為人就還有一大段路要走。
最後，要說我最認同桑普特這本書的一個觀點是什麼，那絕對是他引述英國萊斯特德蒙福特大學教授凱薩琳的這句話：「真正的威脅不在於電腦智能大幅提升，而是我們使用現有的工具只造福少數人，而非改善多數人的生活，只想著為超級富豪提供管家，而非解決廣大人民的問題」。作為社會學家，我深信演算法與AI不僅僅是科技議題，更是影響了我們生存與生活處境的社會議題。

第一部：分析我們

　第一章：尋找班克斯（Banksy）

　第二章：來點噪音

　第三章：友誼的成分

　第四章：一百個維度的你

　第五章：劍橋牛皮公司

　第六章：不可能的無偏見

　第七章：資料煉金師

第二部：影響我們

　第八章：席佛和芸芸眾生

　第九章：我們「也喜歡」網路

　第十章：人氣競賽

　第十一章：泡影世界

　第十二章：足球很重要

　第十三章：誰看假新聞？

第三部：成為我們

　第十四章：學會性別歧視

　第十五章：小數間的唯一想法

　第十六章：玩《太空侵略者》電爆你

　第十七章：細菌腦

　第十八章：回到現實

演算法的一百道陰影：從Facebook到Google，...

Outnumbered: From Facebook and Google to fake news and filter-bubbles - the algorithms that control our lives

演算法的一百道陰影：從Facebook到Google，假新聞與過濾泡泡，完整說明解析、影響、形塑我們的演算法

Outnumbered: From Facebook and Google to fake news and filter-bubbles - the algorithms that control our lives

認識TAAZE

合作提案

顧客服務