演算法為我們的道德下定義、秤量我們的情緒表現、掏空我們的民主體制
――迎接演算法美麗新世界,我們如何在機器時代當個人?――★Amazon年度百大好書!英國皇家學會科學圖書獎決選作品!
★出版前即高價售出多國版權,最受矚目的演算法書籍之一!
★訪談演算法的創造者和演算結果的接受者,收錄大量故事和實例研究!
▍ 各界讚譽推薦
丁彥允 ∣ 喜門史塔雷克創辦人兼總經理
王國禎 ∣ 國立交通大學資訊工程學系教授
王傑智 ∣ 國立交通大學電機工程學系教授、工業技術研究院機械與機電系統研究所數位長
李友專 ∣ 臺北醫學大學醫學科技學院特聘教授兼院長
林守德 ∣ 國立臺灣大學資訊工程學系教授、教育部人工智慧技術及應用人才培育計畫辦公室主任
林福來 ∣ 臺灣師範大學名譽教授
洪文玲 ∣ 台灣科技與社會研究學會理事長
許素朱 ∣ 國立清華大學藝術學院院長暨科技藝術研究中心主任
張智皓 ∣ 《今天學哲學了沒》作者
郭榮彥 ∣ Lawsnote創辦人、律師
陳適安 ∣ 台北榮總醫院副院長
趙坤茂 ∣ 國立臺灣大學資訊工程學系教授
劉士達 ∣ 國立清華大學科技藝術研究中心科技創新組組長、藝術學院科技藝術跨域學士班講師
鄭國威 ∣ 泛科知識公司知識長
盧鴻興 ∣ 國立交通大學統計學研究所教授
▍ 該讀哪本書、該走哪條路,演算法說了算!但演算法真的比它將統治的人類更優秀?■ 當人工智慧遇上天然呆,什麼時候該相信機器、什麼時候該信任自己的判斷?
■ 有些熱門商品擺明就是廢、有些保證火紅,演算法能不能發掘出當紅炸子雞?
■ 演算法對犯罪率的預測大幅超越人類法官,可以用演算法來保障社會正義嗎?
■ 人類的感覺是否能夠用演算法來量化,我們能否接受自己的情緒受到操縱?
■ 演算法代表我們做出改變人生的抉擇,AI時代的權力究竟掌握在誰手上?
▍ 演算法就在我們的醫院、我們的法庭、我們的車輛裡你被控涉嫌犯罪。比較希望誰來決定你的命運——人類,或是演算法?
演算法比較前後一致,比較不容易判斷失誤。但能在宣判之前聽你說真心話的,是人類。
你需要移植肝臟才能活命。希望誰來決定器官分配?
演算法可以幫器官捐贈者找到合適的病患,可能挽救更多的生命。但它說不定會把你排到名單的後頭去。
你正想買一輛無人駕駛車。有一輛車的程式設計是在車禍時盡可能多救幾條命,另一輛則保證把自己車上乘客的性命列為優先。你選哪一輛?
歡迎來到演算法的時代,這個故事是關於一個不太遙遠的未來,機器統治至高無上,進行各種重大決策——不管是醫療保健、運輸、金融、安全、我們看什麼、我們去哪裡,甚至是要把誰送去坐牢。那麼,我們應該依賴機器到何種程度?我們想要什麼樣的未來?
著名數學家漢娜.弗萊帶領我們踏上的這趟旅程,是關於我們周遭無所不在的演算法,其善、其惡、其徹頭徹尾的醜陋。在本書中,她掀開演算法內在的運作、展示其力量、揭露其極限,並檢視演算法是否真的較其正要取代的人類更為進步。
▍ 對本書的讚譽本書是市面上科學寫作的珍寶。漢娜.弗萊以具說服力的敘述和魅力風格,概括電腦演算法的數學要點,並闡明這些數學如何改變諸如醫療保健、司法、運輸和藝術等領域。在我們這個日益為數據所驅動的世界,她是睿智的導覽員,帶我們看見這個世界的優勢與可怖。
――艾利克斯.貝洛斯(Alex Bellos) ∣ 《數字奇航》(Alex’s Adventures in Numberland)作者
本書是針對我們周遭無所不在的演算法,一部輕快活潑又親近易讀的指南。
――喬丹.艾倫伯格(Jordan Ellenberg) ∣ 威斯康辛大學麥迪遜分校數學教授、《數學教你不犯錯》(How Not to Be Wrong)作者
以前,電腦是工具,接著是玩具;現在,它在我們周遭隨處可見。在這個令人不知所措的新世界,找不到比漢娜.弗萊更棒的導覽員,她的這部著作隨處可見機智、敘事精采且極其透徹的洞見。太棒了!
――提姆.哈福特(Tim Harford) ∣ 《親愛的臥底經濟學家》(The Undercover Economist)和《轉角遇見經濟學》(Fifty Things that Made the Modern Economy)作者、電視及廣播節目主持人
本書是緊張刺激、節奏明快的閱讀經驗,你將被激怒、受到挑釁和挑戰。眾多經過縝密研究的例證,揭露我們生存其中的驚人新世界,而目的曖昧不明的黑箱決策,正在決定我們個人與集體的命運。歡迎來到大數據的現代世界,你滿有可能被惡搞了。
――凱西.歐尼爾(Cathy O’Neil) ∣ 《大數據的傲慢與偏見》(Weapons of Math Destruction)作者
每一個不假思索地將我們的命運交託給演算法的人,都應該閱讀漢娜.弗萊精湛又令人愉悅的召喚之作。因為你知道嗎,機器決定的未來可能恰違背我們人類的最佳利益。
――大衛.羅文(David Rowan) ∣ 英國版 《連線》雜誌(Wired)創始主編
敘事熟稔精妙、睿智且筆調輕鬆,漢娜.弗萊對於我們如何在人工智慧時代生存的精采探討,將在未來若干年的吧檯邊、餐桌旁激盪出更多論辯。
――亞當.拉塞福(Adam Rutherford) ∣ 英國演化生物學家、科普作家
漢娜.弗萊是這個星球上最棒的解說者之一。在本書中,她著手處理一項需要認真思考的議題,以其明晰的筆法、迷人的故事,以及一貫的幽默感和令人愉悅的風格,娓娓道來。
――史蒂芬.斯托蓋茨(Steven Strogatz) ∣ 康乃爾大學數學教授、《X的奇幻旅程》(The Joy of x)作者
弗萊以令人耳目一新的簡明文筆,說明人工智慧、機器學習和複雜的演算法的真正涵義,對劍橋分析醜聞、無人駕駛車和其他許多讓人不安的現代現象提供一些簡潔的解釋。
――凱蒂.蓋絲特(Katy Guest) ∣ 《衛報》(The Guardian)
對不熟悉人工智慧技術面向的讀者來說,本書提供了演算法如何運作的最佳通俗解說。
――《科學》期刊(Science)
風格獨具、深思熟慮又一絲不苟的持平記述,說明日漸支配我們生活的軟體能做到和無法做到的事……一部出色易讀的導覽,從一個故事輕鬆轉換到另一個故事,不讓讀者覺得棘手。
――奧利佛.穆迪(Oliver Moody) ∣ 《泰晤士報》(The Times)
作者簡介:
漢娜.弗萊Hannah Fry
倫敦大學學院(University College London)城市數學副教授。每天的工作是運用數學模型來研究人類行為模式,曾與政府部門、警方、醫療保健分析師和超市合作。
在TED上的演講累積數百萬人次觀看,並為BBC和英國公共廣播電視服務網(PBS)製作過多部電視紀錄片;主持BBC長期播出的科學性播客節目《拉塞福與弗萊的好奇事件簿》(The Curious Cases of Rutherford & Fry)。
著有《數學的戀愛應用題》(The Mathematics of Love)等書。
譯者簡介:
林志懋
臺灣大學物理系肄業、臺灣大學哲學系畢業,曾任職雜誌社文稿編輯、出版社編輯,現專職翻譯。譯有《叔本華》、《伏爾泰》、《天賜美味》、《阿基米德的浴缸》、《數學巨人哥德爾》、《艾可博士的36道推理謎題》、《所謂的知識分子》(合譯)、《光的故事》、《萬物的尺度》(合譯)、《知識超人:埃及大冒險》、《補腦全書》、《培養自律的小孩》、《公尺的誕生》(合譯)、《巴西,如斯壯麗》、《萬物運動大歷史》、《酒杯裡的謀殺》、《愚昧者》(合譯)、《打敗NASA上太空》。
章節試閱
◎多重世界
在所有形式的娛樂活動中,我們都把熱門度當成品質的代表物在用。舉例來說,二○○七年有一項研究,審視了《紐約時報》暢銷書排行榜對於一本書的公眾知名度有何影響。該項研究作者艾倫.索倫森(Alan Sorensen)藉由探討排行榜編製方式的特異慣例,尋找那些原本應該依其實際銷售上榜,卻因時間延誤及意外疏忽而未上榜的書籍銷售成功的軌跡,並與那些真正上榜的書籍進行比較。他發現一個戲劇化的效應:光是上榜就讓銷售平均增加百分之十三至百分之十四,第一次出書的作家則增加百分之五十七的銷售。
我們運用越多平台來看有哪些東西熱門——暢銷書排行榜、亞馬遜排名、爛番茄評分、Spotify排行榜——社會認同所造成的影響就會越大。當拋給我們的選項數以百萬計,加上行銷手段、知名度、媒體炒作和評論讚賞全都在爭取你的注目,效應更進一步放大。
這一切都意味著,有時可怕的音樂也能登頂。這不是只有我在憤世嫉俗。一九九○年代,英國有兩位充分了解此一事實的音樂製作人,謠傳他們打賭誰能把爛到不可能再爛的歌曲弄上排行榜。據說,這場賭局的結果是一個叫做Vanilla的女子樂團,她們初登場的歌〈No way no way, mah na mah na〉,是以著名的布偶電視節目歌曲改編而成。這個樂團的演出成果只能寬容地描述為是在唱歌沒錯,一件看起來像是用微軟小畫家做出來的藝術作品,一段大有助於拿下歷來最糟表演獎的行銷影片。但Vanilla有強大的盟友。由於幾家雜誌的專題報導,以及上BBC的電視節目《流行金榜》(Top of the Pops)亮相,這首歌還是成功登上排行榜第十四名(原注:可惜本書格式不適於節錄音樂,因為我真的希望讓你們聽聽這首歌爛到多好笑。你們會去Google一下吧?)。
老實說,這個樂團的成功很短命。到了她們的第二支單曲,熱門程度已經開始衰退。她們從未發表第三支單曲。這一切的確像是在暗示,社會認同並非唯一有作用的因素——真的就像「音樂實驗室」(Music Lab)團隊的後續實驗所證明的。
他們第二項研究的設計大致和第一次相同。但這次為了測試從熱門度的感受變成自證預言(self-fulfilling prophecy,譯注:指人們先入為主的判斷將或多或少影響人們的行為,亦即我們會在不經意間使自己的預言成為現實)到何種程度,研究人員增加了一項轉折。每個世界的排行榜一有機會穩定下來,他們就暫停實驗,把排行榜上下翻轉過來。樂手網頁的新來訪客看到排行榜榜首列在底下,而墊底的輸家一副登頂菁英的樣子。
訪客的下載總次數幾乎是立刻往下掉。一旦排頭的音樂缺乏吸引力,人們對整個網站的音樂都興趣缺缺。此時居排行榜頂端的冷門歌曲下載衰退最為顯著。另一方面,在底下發愁的好歌表現比在榜頂時要差,但還是比先前落居榜尾的那些歌要好。如果科學家讓實驗進行得夠久,最佳歌曲會恢復熱門度。結論是:市場不受特定狀態所限。運氣和品質都發揮了作用。
回到現實——只有一個世界的資料量可做為依據——對於音樂實驗室的實驗發現,有一個直截了當的解讀。品質重要,而且與熱門度並不相同。最佳歌曲恢復熱門度,證明有些音樂先天就是「比較好」。在光譜這端,魅力迷人的藝術家所表演的動人歌曲,應當是(至少在理論上是)注定要成功。但其中的蹊蹺是:反之不必然成立。不是只因為某樣物事成功,就代表它有高品質。
你到底怎麼定義品質,那完全是另一回事,我們待會兒再來談。但對某些人來說,品質本身不一定重要。如果你是唱片公司、電影製片或出版社,棘手的問題在於:你能不能事先找出保證會成功的東西?演算法能不能發掘出當紅炸子雞?
◎獵尋當紅炸子雞
投資電影是一門有風險的生意。賺錢的電影很少,大多數勉強打平,慘賠是這個圈子的常態。這是一門輸贏很大的生意:當製作一部電影的成本衝上以千萬、以億計,產品需求預測失敗的代價,會是災難等級的高昂。
這是迪士尼從二○一二年上映的電影《異星戰場:強卡特戰記》(John Carter)艱苦學到的教訓。製片廠投入三點五億美元製作這部電影,認定這部片應該和《玩具總動員》、《海底總動員》之類並駕齊驅,成為他們下一部搖錢大作。沒看過嗎?我也沒有。這部電影沒能抓住大眾的想像力,一口氣賠了兩億美元,導致迪士尼製片廠負責人請辭。
好萊塢要人一直都能接受一件事:就是沒辦法準確預測電影能否賣座成功。這是本能主宰一切的國度。在那些票房可能慘賠的電影上賭一把,正是這項工作的一環。一九七八年,美國電影協會主席兼執行長傑克.瓦倫蒂(Jack Valenti)說道:「沒有人能告訴你一部電影在市場上會怎麼樣。沒有人能,直到這部影片在關燈後的戲院裡開演、光點在銀幕與觀眾之間飛騰。」五年後的一九八三年,《公主新娘》和《虎豹小霸王》幕後劇作家威廉.高德曼(William Goldman)說得更簡潔:「不管是啥都沒人知道。」
然而,正如我們在本書通篇所見,現代演算法能如例行公事般預測乍看不可預測之事。為什麼電影就該與眾不同?你可以測量電影的成功,以收入、以影評接受度。你可以測量與電影結構和情節有關的各種因素:主演卡司、類型、預算、片長、情節安排等等。所以,何不應用同樣這些科技,試著找到寶物?揭露哪些影片注定票房大賣?
這已經成了近年來眾多科學研究的野心所向,企圖深入網路電影資料庫(IMDb)或爛番茄這類網站所蒐集、挑選的龐大豐富資訊。而且——或許並不讓人意外——有許多令人感興趣的洞見隱藏在這些資料裡。
以二○一三年由薩密特.斯里尼瓦森(Sameet Sreenivasan)所進行的研究來說吧。他了解到,藉由要求用戶給影片標記情節關鍵字,IMDb創造出驚人詳細的描述詞目錄,可以顯示出我們的電影品味隨時間有何種演進。在他進行研究期間,IMDb的目錄裡已有超過兩百萬部影片,橫跨超過一個世紀,每一部都有多重情節標記。有些關鍵字是對電影的高階描述,像是「組織犯罪」或「父子關係」;有些則與地點相關,像是「紐約市曼哈頓」,或是關於具體的情節重點,像是「用槍指著」或「綁在椅子上」。
這些關鍵字本身顯示,我們對某些情節元素的興趣往往會突然激增;想想二戰影片或處理墮胎主題的電影。突然間,類似主題很快就會接連有大量作品發表,然後平靜一陣子。把這些標記放在一起考量,讓斯里尼瓦森能夠給每一部電影上映當時的新鮮感打分數——一個介於0到1之間的數字——可以和票房成績做個對比。
如果特定的情節重點或關鍵——像是女性裸露或組織犯罪——在之前的電影中經常見到,關鍵字會讓這部電影在新鮮感方面拿到低分。但任何原創的情節特色——比方說,像是一九七○年代動作片引進的東方武術——會在這項特色第一次出現於銀幕時拿到新鮮感高分。
結果證明,我們和新鮮感之間有一種複雜的關係。平均來說,一部電影的新鮮感得分越高,票房的表現就越好。但只能好到某個程度。越過那道新鮮感門檻,有一道懸崖在等著;任何得分超過零點八的影片,賺到的票房收入會如落崖直墜般急遽大減。斯里尼瓦森的研究證明了社會科學家長久以來所懷疑的:平庸令我們不喜,但完全陌生也讓我們生厭。最佳影片就落在「新」和「不太新」之間窄窄的最佳平衡區內。
新鮮感分數或許是一個有用的方法,可協助製片廠避免幫大爛片背書,但如果你想知道個別影片命運如何,幫助就不大了。對此,歐洲有一組研究人員的工作成果可能比較有用。他們發現,在電影上映前那一個月,該影片在維基百科條目頁面上的編輯次數,和最後的票房斬獲有某種關聯性。條目編輯往往是與電影上映沒有關係的人所為——純粹是典型的電影迷給該頁面增加資訊而已。編輯次數越多,意味著伴隨電影上映而來的興奮情緒越高昂,進而使得票房收入越好。
整體而言,他們的研究模型略有預測能力:研究的三百一十二部影片中,他們以百分之七十以上的準確率,正確預測其中七十部影片的票房收入。但一部影片表現越好,以及維基百科頁面上所做的編輯次數越多,可供研究小組做為依據的資料就越多,而他們所做的預測越精準。對於六部高獲利影片票房斬獲的正確預測,達到百分之九十九的準確率。
這些研究有知性上的趣味,但一個模型只在影片上映前一個月有效,對於投資者沒有太大用處。何不轉而正面處理問題,採計在此過程初期已經知道的所有因素——類型、領銜演員的名氣、年齡分級(輔導級、十二歲以上等等)——並運用機器學習演算法,來預測一部影片是否會熱賣?
有一項從二○○五年開始的研究就是這麼做,運用類神經網路,嘗試在戲院上映之前很久便預測影片的表現。為了讓事情盡可能簡化,研究論文的作者排除對精確預測收入的嘗試,改為試著將電影分為九種類別,從全面慘賠到破表熱賣。不幸的是,即使有了這道簡化問題的步驟,成果仍有很大的改進空間。類神經網路的表現優於以前嘗試過的任何統計技巧,但對電影表現的分類仍然只做到平均百分之三十六點九的正確性。收入超過兩億美元的頂級類別好一點,以百分之四十七點三的正確率,辨識出那些真正破表熱賣的影片。但投資者很謹慎。演算法挑選為注定熱賣的影片,大約有百分之十最後賺不到兩千萬美元——照好萊塢的標準,這是個令人一掬同情淚的數字。
之後其他研究嘗試過要改進這些預測,但還沒有一個做出效果顯著的躍進。所有證據都指向同一個方向;除非你有早期觀眾反應的資料,熱門度大致上是不可預測的。說到要從成堆影片中挑出賣座片,高德曼說得對:不管是啥都沒人知道。
◎品質量化
所以說,熱門度的預測很複雜。要從我們大家都喜歡,拆解出我們為什麼喜歡,並非易事。這給創意領域的演算法提出了一個滿大的問題。因為如果你無法運用熱門度來告訴自己什麼是「好的」,那麼你又如何能對品質進行測量呢?
這一點很重要:如果我們希望演算法具有任何一種內在於藝術之中的自主性——無論是創作新作品,或是對我們自己創作的藝術提出有意義的洞見——我們都會需要對品質做某種測量來做為依據。必須有一種客觀方法為演算法指出正確的方向,一種可以回溯的「正確答案」,就像是「這簇細胞是癌性」或「被告繼續犯罪」在藝術上的類比。沒有這東西,要進步便困難重重。如果我們沒辦法定義我們所謂的「好」,就沒辦法設計出譜寫或尋找「好」歌的演算法。
不幸的是,試圖找出品質的客觀衡量標準時,我們遇上一個遠溯至柏拉圖且深具爭議性的哲學問題。一個已經爭論超過兩千年的主題:你如何判斷藝術的美學價值?
有些哲學家如萊布尼茲主張,如果有可以讓我們全都一致同意為美的對象,比方說米開朗基羅的大衛雕像或莫札特的《落淚之日》,那就應該有某種可定義、可衡量的美之本質,使得某一件藝術品在客觀上較另一件為佳。
但另一方面,所有人都一致同意是相當罕見的。有些哲學家如休姆則主張,美在於觀者之眼(俗稱「情人眼裡出西施」)。舉例來說,想想安迪.沃荷,他的作品帶給某些人強而有力的美感體驗,其他人則覺得,就藝術而言,與一個湯罐頭不分軒輊。
還有些哲學家——康德也名列其中——曾說過,真理介於這兩者之間。我們對美的判斷不全屬主觀,也不可能全然客觀。這些判斷同時是感官的、情緒的且知性的——而且最重要的是,可以視觀者心態而隨時間改變。
此一觀念當然有證據支持。班克西(Banksy)的粉絲或許還記得二○一三年他是怎麼在紐約中央公園設攤位,匿名販售原創黑白噴畫,每件六十美元。攤位夾在其他販售常見觀光紀念品的成排攤位中間,所以這個標價牌一定讓那些路過的人覺得很貴。過了幾個小時,才有人決定要買。這天的收入總計四百二十美元。一年之後,在倫敦一場拍賣會上,另一位買家認為,這同一件藝術作品的美學價值高到足以誘使他們花上六萬八千英鎊(當時約十一萬五千美元左右),就買一幅畫。
不可否認,並非每個人都喜歡班克西(英國科幻驚悚單元劇《黑鏡》﹝Black Mirror﹞創作者查理.布魯克﹝Charlie Brooker﹞曾說他是「一個呆頭,﹝他的﹞作品在白痴看來是聰明到讓人眼花啦」)。所以,你或許會主張這個故事只證明班克西的作品並無內在的品質,只是靠著通俗炒作(及社會認同),才催出那些高到讓人噴淚的價格。但在無可否認的高品質藝術形式方面,也已經看出我們美學判斷的反覆無常。
我最喜歡的例子是《華盛頓郵報》在二○○七年所進行的一項實驗。該報向國際知名小提琴家約夏.貝爾(Joshua Bell)提出請求,在他門票售罄的各音樂廳表演行程之外加開一場音樂會。貝爾帶上他的三百五十萬美元史特拉底瓦里小提琴,在早上的尖峰時間來到華盛頓特區一處地鐵站的電扶梯頂,放了一頂帽子在地上收賞錢,表演了四十三分鐘。正如《華盛頓郵報》所言,這是「全世界最頂尖的古典音樂家之一,以歷來所製作最有價值的其中一把小提琴,演奏幾首歷來所譜寫最優雅的音樂」。結果呢?有七個人停下來聽了一會兒,超過一千多人直接走了過去。到他表演結束時,貝爾的帽子裡收到少得可憐的三十二美元十七美分。
我們所認為的「好」,也在改變。某些古典樂類型的品味對時代的變遷適應得異常良好,但同樣的說法無法套用在其他藝術形式上。倫敦帝國學院演化生物學教授阿曼德.萊洛(Armand Leroi)研究過流行樂的演化,從分析中找到我們品味改變的清楚證據。「人們對於枯燥乏味有一個先天的門檻。當人們需要新事物時,就會有一種緊張關係逐漸形成。」
以一九八○年代後期風靡流行樂界的鼓機和合成器為例——風靡到排行榜上的音樂多樣性急遽減少。「每一首聽起來都像早期的瑪丹娜,或是杜蘭杜蘭的某些作品,」萊洛說明道:「所以,或許你會說:『很好,我們已經達到流行樂的顛峰了。這就是顛峰所在,終極的格式已經找到了。』」只不過,當然囉,這個格式還沒找到。不久之後,隨著嘻哈音樂的到來,排行榜的音樂多樣性再次爆發。引發轉變的嘻哈有什麼特殊之處嗎?我問萊洛。「我不這麼認為。也有可能是別的什麼,只不過正好是嘻哈。美國消費者對此有所回應並說道:『哦,這可是新花樣,再多給我們一些吧。』」
重點在於:即使有某種客觀判準使得某件藝術作品優於另一件,只要脈絡淵源在我們對藝術的美學欣賞中仍扮演某種角色,就不可能創造出用之於所有時代、所有地域皆成立的美學品質確實標準。無論你施展了何種統計學技巧,或是人工智慧手法,或是機器學習演算法,試圖用數字來掌握卓越藝術的本質,那就像是用你的手去抓煙霧一般。
但演算法需要「某種東西」才能進行。所以,一旦你剔除了熱門度和內在品質,剩下來唯一能夠量化的東西是:與以往曾出現事物之相似性的度量標準。
利用對相似性的衡量,還是有很多可為之處。說到推薦引擎,像是Netflix和Spotify建立的那些,相似性理當是理想的衡量標準。兩家公司都有辦法協助用戶找出新的影片或歌曲,而且做為訂閱服務供應商,兩家都有準確預測用戶喜好的誘因。他們不能以現在流行什麼做為他們演算法的依據,否則用戶會遭到小賈斯汀和《電影版粉紅豬小妹》(Peppa Pig The Movie)的推薦訊息疲勞轟炸。他們也不能以品質的任何一種代表物為依據,像是評論文章之類,因為如果他們這麼做,首頁會被學院派無聊到令人打瞌睡的討論給淹沒。這種時候所有人想做的,其實是在上了漫長的一天班之後,踢掉他們的鞋子,用一部驚悚爛片麻痺自己,或是盯著加拿大演員雷恩.葛斯林(Ryan Gosling)看上兩個小時。
相較之下,相似性讓演算法得以直截了當將焦點對準個人的喜好。他們都聽些什麼、他們都看些什麼、他們一次又一次回來找什麼?從這裡出發,你可以利用IMDb、維基百科、音樂部落格或雜誌文章,抽出與每一首歌、每一個藝術家或每一部電影有關的一系列關鍵字。這樣做出整套的編目,接下來的步驟很簡單,就是尋找並推薦其他有相似標記的歌曲和影片。除此之外,接著你還可以找出其他喜歡類似電影和歌曲的用戶,看看他們還喜歡哪些歌曲和影片,然後推薦給你的用戶。
Spotify或Netflix從來沒打算提供完美的歌曲或影片,他們對完美沒什麼興趣。Spotify Discover並未承諾找出地球上那唯一一組、注定與你的品味和心情完全無瑕契合的樂團。推薦演算法只提供好到保證不會令你失望的歌曲和影片,提供你一種無害的方式來消磨時間。偶爾會提出你絕對喜歡的東西,但這有點像是那種意義下的冷讀法(cold reading,譯注:占卜師或靈媒未事先蒐集相關資訊,而是現場從解讀對象的肢體動作、衣著、髮型或交談內容等線索做出猜測)。你只需要偶爾來一顆好球,感受一下發現新音樂的幸運,這些引擎並不需要永遠都對。
相似性在推薦引擎上的運作非常完美。但當你要求演算法創作藝術,卻沒有提供純屬品質的衡量標準,事情開始變得有趣起來。如果演算法對於藝術唯一的理解就是以往有過什麼,那麼它還能有創意嗎?
◎多重世界
在所有形式的娛樂活動中,我們都把熱門度當成品質的代表物在用。舉例來說,二○○七年有一項研究,審視了《紐約時報》暢銷書排行榜對於一本書的公眾知名度有何影響。該項研究作者艾倫.索倫森(Alan Sorensen)藉由探討排行榜編製方式的特異慣例,尋找那些原本應該依其實際銷售上榜,卻因時間延誤及意外疏忽而未上榜的書籍銷售成功的軌跡,並與那些真正上榜的書籍進行比較。他發現一個戲劇化的效應:光是上榜就讓銷售平均增加百分之十三至百分之十四,第一次出書的作家則增加百分之五十七的銷售。
我們運用越多平台來看有哪...
目錄
關於書名的一個註解
導論
【第一章 權力】
回歸基本面/盲目信任/人工智慧遇上天然呆/何時否決/權力鬥爭
【第二章 資料】
聚沙成塔/目標市場/西部蠻荒/劍橋分析/精細操弄/給我評比
【第三章 司法】
一致性的難題/正義方程式/問問觀眾/人類vs機器/尋找黑武士/機器的偏差/艱難的決定/總結
【第四章 醫療】
模式獵手/視物機器/AI盟友/修女研究/預測的力量/數位診斷/親愛的,這是最基本的/麻煩的資料/隱私問題/基因洩天機/最大的善?
【第五章 車輛】
我周遭有什麼?/貝牧師的大教堂/所以,你的無人駕駛車應該去撞行人來救你的命嗎?/違反道路規則/公司寶寶/自動化的反諷/寄予厚望
【第六章 犯罪】
山貓行動與草坪灑水器/未來圖表/標示與助長/犯罪預報機/預言付諸實現/你以為你是誰?/看見分身/百萬分之一?/取得平衡/複雜難解的取捨
【第七章 藝術】
多重世界/獵尋當紅炸子雞/品質量化/「傑出的藝術家模仿,偉大的藝術家盜竊」——畢卡索
【結語】
人類加上機器
謝辭
注釋
關於書名的一個註解
導論
【第一章 權力】
回歸基本面/盲目信任/人工智慧遇上天然呆/何時否決/權力鬥爭
【第二章 資料】
聚沙成塔/目標市場/西部蠻荒/劍橋分析/精細操弄/給我評比
【第三章 司法】
一致性的難題/正義方程式/問問觀眾/人類vs機器/尋找黑武士/機器的偏差/艱難的決定/總結
【第四章 醫療】
模式獵手/視物機器/AI盟友/修女研究/預測的力量/數位診斷/親愛的,這是最基本的/麻煩的資料/隱私問題/基因洩天機/最大的善?
【第五章 車輛】
我周遭有什麼?/貝牧師的大教堂/所...