★《紐約時報》暢銷書
★2014年《富比士》推薦書單
★2014年全國公共電台最佳圖書
★2014年環球郵報最佳圖書
★2014年彭博社最佳圖書
★入圍洛杉磯時報圖書獎
★2014年英國獨立報網路和技術最佳圖書
★2015年誠品書店、博客來外文書趨勢類推薦書單
《華爾街日報》、《金融時報》、《赫芬頓郵報》、《時代》、《富比士》、《紐約客》……
多家媒體一致推薦報導,引爆國際媒體高度矚目與討論
你沒見過的大數據另一面,
美國知名社交網站創辦人用數學證實:
我們其實是這樣那樣的人。
臉書、推特、Reddit、T umblr、Instagram……等社交網站
一躍為新一代的人口學家。
大膽創新關於人類行為的調查,一場醞釀中的革命正在發生!
一般談到大數據只談商機和操控。
其實,巨量數據正透露出人類以為四下無人時,我們是什麼樣子,
我們想的、說的、做的,其實都不一樣。
這個傳統問卷調查問不出的真相,來自大數據中,人們最真實、最不設防的心聲。
當我們以為每天只是過著自己的小日子,
每一個行為,最後都匯集到數據裡,成為大數據裡的一部分。
美國著名網站OkCupid創辦人魯德透過經營交友網站,
得到一般研究無法取得的巨量數據,而且真實,
因為在交友網站上,人們只依自己的想法行事,誠實透露好惡,
藉由統計分析,解讀用戶創造出來的資料,
用廣大的樣本數來證實一般人會有的猜想,或者破解常見的迷思。
本書觀察到在網路時代,數據所帶出的真相:
1.男人偏愛二十歲出頭的嫩妹,這是胡亂栽贓還是信口開河?數據證實,這是真的!女人過了21歲以後,在擇偶市場就開始走下坡。
2.缺陷是一股強大力量!與其當個芸芸眾生,還不如勇敢做自己。
「出醜效應」告訴你,有特色才讓你更出色。
3.使用推特會讓人類的寫作能力下降?大數據說,反而提升了用戶的寫作程度。
4.亞洲女性受到所有種族男性的高度青睞;白人和拉美裔男性和女性都比較受歡迎,不過,亞洲男性和黑人,受歡迎的程度偏低。種族偏見一直都在,即使嘴裡不承認,但潛意識則不然。
5.女性美不美,影響的不只是在交友網站上的人氣度,從網路數據顯示,外貌就是一切,不僅影響工作面試,連工作表現評等也與外貌有關。
6.為什麼女人……會變心?為什麼男人……要說謊?
為什麼穆斯林……恨美國?為什麼亞洲人……看起來都很像?
這些搜尋紀錄讓Google聽到了我們所有人的告白、關注與祕密。
萬事問Google,問出的不只是答案,還暴露了你的內心。
7.按讚洩漏的訊息,遠比你想像得多。
一個人按讚的模式還能拿來預測智商:這個模型能夠精準預測某人的標準智商測驗得分,而且一個問題都不用問。
8.活人獻祭不是過去野蠻時代才有。一名高中女生納瓦茲發的一則無腦貼文,讓我們見識到在網路上是如何地失控擴散,不到24小時,就在740萬人眼前遭到辱罵,普通鄉民逐漸演變為酸民、暴民,大家爭相上前補刀。
9.同性戀者是後天養成的嗎?大數據考查出美國各州都有穩定比例的同性戀人口。而同性戀是否願意出櫃,與當地的接受度有關,被迫躲在祕密裡的人,會在Google搜尋表態,因為Google是最沒有社會壓力的地方。
本書透過魯德生動有趣的敘述,每個數據都各自有話要說,為我們展示人類的行為、看到整體人性。現在,數據科學家成為新的人類學家,數據能透露的訊息,遠比我們想像中多,因此許多社會或政治上的爭辯,也可透過數據證實,而非以訛傳訛或自以為是,也因為透過分析數據,我們得以看出人類的心理,建構人類的故事。
作者簡介:
克里斯汀.魯德Christian Rudder
克里斯汀.魯德是交友網站OkCupid的共同創辦人暨總裁,也是人氣部落格OkTrends的作者。1998年畢業於哈佛大學數學系,曾擔任SparkNotes創意總監,上過國家廣播公司(NBC)的《日線》(Dateline)及美國國家公共廣播電台(NPR)的《面面俱到》(All Things Considere)等節目,作品也得到《紐約時報》、《紐約客》等等媒體熱烈討論。目前他與妻女住在布魯克林。
譯者簡介:
林俊宏
師範大學翻譯研究所碩士。
喜好電影、音樂、閱讀、閒晃,
覺得把話講清楚比什麼都重要。
譯有《大數據》、《英語的祕密家譜》、《建築為何重要》、
《大科學》、《群的智慧》、《天空的女兒》等書。
現就讀於師大譯研所博士班。
各界推薦
得獎紀錄:
★《紐約時報》暢銷書
★2014年《富比士》推薦書單
★2014年全國公共電台最佳圖書
★2014年環球郵報最佳圖書
★2014年彭博社最佳圖書
★入圍洛杉磯時報圖書獎
★2014年英國獨立報網路和技術最佳圖書
★2015年誠品書店、博客來外文書趨勢類推薦書單
得獎紀錄:★《紐約時報》暢銷書
★2014年《富比士》推薦書單
★2014年全國公共電台最佳圖書
★2014年環球郵報最佳圖書
★2014年彭博社最佳圖書
★入圍洛杉磯時報圖書獎
★2014年英國獨立報網路和技術最佳圖書
★2015年誠品書店、博客來外文書趨勢類推薦書單
章節試閱
其實,人不懂自己的心
在微網誌平台 Tumblr 上,有個知名的「來自地獄的客戶」(Clients from Hell),任何人都可以上這個微網誌,抱怨自己在服 務業碰上的恐怖故事。上面有各種愚蠢無知的故事,而且每幾個 小時就有新貼文。像下面就是一則典型貼文,出自一位平面設計師:
客 戶:這張圖片可以加標題嗎? 設計師:可是已經有圖片說明了。
客 戶:加上去的話,讀者沒看到說明也能看標題啊。
設計師:可是,平常哪會要同一張照片又有標題又有圖說呢?
客 戶:是也有道理啦,不然把圖說那裡加個標題好了。
目前我在這個微網誌上看到最愛的一句客戶金句是:「我不喜歡這張圖片的恐龍,看起來實在太假了。不能換張真的恐龍照片嗎?」雖然在這個部落格貼文的人主要是平面設計師,但看到這裡如此人氣滿滿,可見有個舉世皆同的真理:大家都討厭自己的客戶。
當然這裡講的不是特定對象,而是整體來說,客戶就像一群暴民,該小心以對。如果有哪個人告訴你沒這回事,不管他是街角賣杯子蛋糕的老闆,或是董事會裡的執行長,絕對是在說謊。我們之所以這麼討厭客戶,部分原因也在於那些「xx永遠是對的」說法;沒有誰真的喜歡看到別人有那麼大的權力。然而,造成這些無奈的最大原因,在於大家不瞭解、也說不出自己的實際需求。正如賈伯斯所言:「在你秀給他們看之前,消費者根本不知道自己想要什麼。」但他沒說的是,特別是在高科技產業,要「秀給他們看」基本上就像在沙灘上蒙眼劈西瓜,只不過叫著要你往左或往右的人,大概有幾百萬人。
如果你是汽車製造商,而消費者不喜歡你們車子的某些地方,他們多半會以很間接的方式告訴你:不買。在歷史上,車廠和消費者之間,從來就沒有什麼開放的管道可以討論像是杯架該不該是綠色,或方向盤該不該做成正方形之類的事(反正轉彎不是大多都九十度嗎?)。正因如此,傳統公司才會投入許多經費 進行市場研究。他們必須想得比消費者更深更遠才行,否則等到問題是從公司帳面上浮現,那就太遲了。
然而製作網站可就不同了:如果有個天馬行空的點子,只要寄封電子郵件給公司同事就行。假如使用者對某項功能就是不買帳,網站也能立刻察覺通知。在這裡,追蹤測量是即時完成、鉅細靡遺、無所不在。不管是谷歌、臉書、LinkedIn 或是YouTube,只要你在自己最愛的網站上看到什麼新玩意而且點了進去,你就該知道會有某個人(可能戴著耳機,還嚼著多力多滋)眼前的計數器又往上跳了一位。像這樣的資料太過豐富,真的可以把人搞瘋:道格拉斯.鮑曼(Douglas Bowman)曾經名列谷歌最優秀的設計師之一,谷歌的視覺設計團隊也由他一手打造,但他最後就是覺得整件事已經搞得太吹毛求疵,於是決定走人。像當時為了一個按鈕,谷歌無法在兩種不同深淺的藍色之間做出選擇,結果最後決定把由深到淺的四十一種色調全部丟上線,再看哪個表現最好。在德爾菲(Delphi)阿波羅神殿的基石 上,刻著「認識你自己」這條教諭。不過就像是其他那些古代傳下來的至理名言,只要電腦一開,大家全都忘了。
如果不知道客戶喜歡車子有什麼配備、網站介面該長怎樣,這些問題可以交給商學院或設計工作室來解決,而我有興趣的,是人「不懂自己的心」這件事。在社會科學領域,早就知道人類會說一套做一套,不足為奇,但我手上這個難得的機會,是能看到人連實際做事都能有兩套。而會出現這種情況,則是因為我也 不知道他們究竟想要的是什麼。
∞
二○一三年一月十五日,OkCupid 宣布當天是「愛情盲目日」,暫時移除了網站上的所有大頭照,為期數小時。當時除了想來點新鮮的,也是要為我們同時推出的另一項服務打廣告。系統師在早上九點準時讓計畫開始:
可以看到整個對話量簡直跌入絕望的深淵,這可不是天天見得到!當時 OkCupid想推動的新服務是一項行動應用程式,叫做「瘋狂盲目約會」(Crazy Blind Date, CBD),只要在手機螢幕上按幾下,系統就會幫你和人配對,並安排近期內在附近的地點雙方見個面。應用程式的介面只讓雙方決定是否同意,而在正式見面之前,並沒有任何能夠直接聯絡的管道。你能得到關於對方的唯一資訊,就是對方的姓,還有一個經過打亂重組的縮圖。
最後,這項服務黯然收場。雖然有超過二十五萬人下載,但因為使用者還是習慣先看到臉再見面,最後效果並不好。總是有這種例子,設想的時候完美無比,等到成品出來卻是一敗塗地。這個應用程式有點像是把前面那個「愛情盲目日」活動辦得更久,而且沒辦法關掉開關。推出不過短短幾個月後,我們就關閉了CBD這項服務,但在它加入其他上天堂的應用程式之前(想必它們在天堂一切均安),大約有一萬人用這個程式與從未謀面或談話的人見面,一起喝杯啤酒或咖啡。總之,到現場碰運氣就是了。
因為有了數據,所以得以檢視既有概念
因為有了這些勇猛無畏的試用者,咱們這個應用程式也為世界留下了一套絕世罕有的資料集。CBD 不只知道會員A和會員B實際見了面,還能知道他們對彼此的意見。每次約會之後,CBD 就會像是個愛管閒事的室友一樣去詢問結果如何。由於大部分的CBD使用者也都有OkCupid帳戶,於是我們能將這些資料與各種人口背景資訊交叉參照。忽然之間,我們就有了真人互動的紀錄,能與手中龐大的數位互動資料互相結合。而把這兩個資料來源合併之後,就有了一項了不起的新發現:兩個人的長相,對於約會是否會成功幾乎沒有任何影響。不管哪個人比較好看、好看多少(就算一個好看到爆表、一個是醜到跌倒也一 樣),大家會給約會正面評價的機率都維持在一定的水準。外表,真的並不重要。這項由真正約會所取得的資料,把我在過去十年間,經營交友網站的所有概念一夕推翻。
我們來看一下數字,看看所謂的外表吸引力是否會影響約會的滿意度。舉例來說,自認自己長相只有1分的男性,如果跟自認長相10分的女性約會,約會的滿意度會是怎樣的呢?
我們可以發現,如果女生長相是六分,男生和她約會是否感到高興,會和自己的長相密切相關。如果他自己是個一分,代表這次約會他賺到了,可能興奮得很。但如果他的外表有十分,則是另一回事。從我們分析的數據中顯示,男女外表的差異值就像是用公平抽籤,呈現自然分布的走勢。而且也沒有什麼證據顯示有人故意鑽系統的漏洞(像是先想辦法把照片組回去原樣知道對方長相,或者當天到約會場地之後如果覺得不如預期,就趁別人還沒認出自己之前趕快逃跑)。
CBD 的兩個資料集告訴我們,其實大家對於約會另一方的 外貌並沒有那麼在意。女方對約會的滿意度有75%,男方更有85%。雖然略有起伏,但基本上可以視為干擾而忽略。像這樣不在意外表的情況,與OkCupid呈現的資料大相逕庭。為了說明這點,我把上面女方實際約會後的滿意度(即紅色數字)挑出來,與同樣這些女性在OkCupid上回覆私訊的比率相比較。為了便於對照,圖中以直線顯示差異的平均值:
男性的比較圖也與這個圖相當類似,而且特別再聲明一下,上面用來畫出這兩條線的資料,是同一組女性。黑線代表她們在 OkCupid 上的經驗,紅線則是 CBD 的經驗。簡而言之,還沒見面之前,在線上好像大家都很挑;但等到真正見面之後,外表似乎就不再重要。
這種先看外表的膚淺現象無處不在,而且背後的利益委實不小。舉例來說,美國最大的鎮痛解熱藥品牌是泰諾(Tylenol),但你知道它和食品零售業克羅格公司(Kroger)自有品牌的學名藥乙酰氨基酚(acetaminophen)有什麼區別嗎?只差在盒子而已。除非你吃藥是像蟒蛇一樣連盒子一起吞,否則學名藥的成分 和品牌藥一模一樣,實在沒有必要為了名字去買貴上一倍的品牌藥。只不過,我家臥室梳妝台上也有一大罐紅色的泰諾就是了。
「愛情盲目日」實驗告訴我們的事
當然,標籤與人有關的時候,最能引起我們注意。講到這種 表面上的門當戶對,自稱是民主黨和共和黨的這兩群人,在 OkCupid 主要分群之中是最合不來的,甚至連清教徒和無神論者 都比他們能彼此相容。我之所以知道,是因為OkCupid會問許多 配對問題,內容包山包海,一般用戶大概會回答到三百題左右。 你可以決定每道題目的重要性,也可以指定某些答案是挑選約會 對象的必要條件(或淘汰條件)。雖然看來整個機制嚴謹精密, 但講到政治的情況,這套系統並不管用。如果先不管標籤,而是 看看究竟誰會傳私訊給誰、誰又會回覆(最後也就會真正約 會),會發現真正能決定彼此是否適合的因素在於是否關心政 治,而非特定的黨派或是信念。我們在二○一一年用整個夏天做了一場實驗,證實了這一點。 用戶回答這些配對問題時常常有點誇張,把所有選項都標成「必要」,結果簡直就是在列核對清單,告訴整個世界:我要找 的女人必須愛狗、不抽煙,是個不可知論者和自由主義者,不能 有過小孩,而且當然在床上也要很行。然而,有些問題乍看不起 眼,卻很能看出兩人是否合適,例如「你喜不喜歡恐怖片?」、「有沒有自己出國旅行過?」如果第一次約會沒有靈感,問問這 些可不賴。在 OkCupid 促成的長期伴侶當中,大約有 75% 對這 些問題的回答會達到一致,可能兩人都「是 」,或兩人都 「否」。對於那些看來比較重要、了不起的事(例如信仰、政 治,當然也包括外表),人們通常會過度強調。然而,這些事情 真正的重要性,其實遠不及大家想像得高,甚至,有時一點也不重要。
雖然那次「愛情盲目日」落得慘澹收場,卻讓我們真正看到人在缺乏資訊時會怎麼做。在一切不變、但撤下大頭照的情形下,我們開始的是一項與網站平常做法大不相同的即時實驗。在為時七小時的時間內,用戶都無法取得過去資料,顯示出 OkCupid能為用戶提供的最重要資訊:其他人的長相。
有些結果不出所料。當時用戶送出私訊時,不會有一般的偏見,或是種族及外表造成的偏差。看不到,就沒辦法批評判斷。但在那些「盲目」送出的 30,333 封私訊中,最後有 8,912 封得到回覆,回覆率足足比平常高出大約40%。而且對於那些願意在一無所知之下往來的人來說,事情的發展也很令人訝異。那些在沒照片的時候也願意交談的配對,有24%甚至是在照片重新開啟之前,就已經交換了聯絡資訊。「愛情盲目日」的真正活動時間只有短短七小時,一般來說,七小時內能成功交換聯絡資訊的數量僅有這個數字的一半。所以,在這種連對方長相都沒見過的時候,不只私訊比較容易得到回覆,甚至連交換電話號碼和電子郵件的比率也比較高。
然而,如果在我們下午四點恢復照片的時候,雙方還處於剛開始聊天、正在起步的狀況,效果就正好相反。就像是原本兩個人在黑暗中交往,但突然燈光亮了起來;而且從資料裡看得出來,他們開始變得有點不安。那些跨越照片恢復時間的私訊對話串,在照片恢復之後的繼續往來封數平均為四.四封。但如果和控制組對照,會發現本來應該繼續往來的平均封數是五.六封。而這些被「亮燈」的私訊串,最後會交換聯絡方式的比例也相應降低。
交友網站的目的就是要提供各種工具和資訊,讓人達成各種單身能做的事,像是上床、約會、找伴、結婚之類。網站清楚列出諸如身高、政治觀點、照片、文字等等內容,分類簡單,搜尋容易,希望有助於用戶下判斷,滿足願望。然而,雖然像這樣挑三撿四、品頭論足可能確實很有趣,但在我看來,也可能對尋求真愛幫了倒忙。人們會從我們提供的資訊做出選擇,但這只是因為他們可以這麼做,卻不見得真的就該這麼做。
我不禁想到,想必有很多人會因為某些預設的條件就被拒於千里之外,但這些條件到了真實生活很可能根本不重要。進一步來說,會不會網路就像改變了許多其他事情一樣,也使得愛情變得有所不同?請容我表達一下內心深處一個可能聽來很潑冷水的想法:在網上,你一定可以找到自己「想要」的東西。但講到你真正「需要」的東西,可就難找得多了。
其實,人不懂自己的心
在微網誌平台 Tumblr 上,有個知名的「來自地獄的客戶」(Clients from Hell),任何人都可以上這個微網誌,抱怨自己在服 務業碰上的恐怖故事。上面有各種愚蠢無知的故事,而且每幾個 小時就有新貼文。像下面就是一則典型貼文,出自一位平面設計師:
客 戶:這張圖片可以加標題嗎? 設計師:可是已經有圖片說明了。
客 戶:加上去的話,讀者沒看到說明也能看標題啊。
設計師:可是,平常哪會要同一張照片又有標題又有圖說呢?
客 戶:是也有道理啦,不然把圖說那裡加個標題好了。
目前我在這個微網誌上看到最愛...
推薦序
〔推薦序〕
最有趣的大數據提問,最誠實的數位田野調查
黃貞祥
清華大學分子與細胞生物研究所暨生命科學系助理教授
「know thyself」(γνῶθι σεαυτόν,認識你自己),相傳是刻在希臘德爾斐的阿波羅神廟的三句箴言之一,也是其中最有名的一句。
臉書剛風行時,許多朋友除了玩開心農場,另一個上臉書的目的是玩心理測驗,是為了更瞭解自己,還是讓朋友來瞭解呢?然而,因為種種的社會規範,我們即使是在做暱名或自己才看得到答案的心理測驗,可能心中想的和表現出的,是一個自己希望成為的人,而非真實的自己。
萬萬沒想到,在臉書背後玩大數據的資料科學家,可能早就能從我們按讚的模式,判斷出一個人是外內還是內向,是開放還是保守,是否是異性戀或是同性戀等等,彷彿那些演算法,比我們自己還瞭解自己。
沒外人真正清楚臉書等社群網站背後真正且完整的商業動機和模式,不過收集大數據來瞭解人類的行為,肯定是其中一項,這是司馬昭之心。至少,有個交友網站OkCupid的創立,除了讓無數寂寞難耐的男女能夠找到人生另一半,另一個目的就是為了寫這本書吧,真是一魚二吃啊。
不否認,我也是OkCupid的註冊會員,當時是讀了一本書說,有個交友網站能用各種問題來判斷兩人是否適合交往,裡頭可供會員回答幾百個問題,從嗜愛興趣到生活習慣和宗教政治都有,可是其中最準確的居然是喜不喜歡看恐怖片(我不愛)等等看似無關緊要的小問題。
身為一個好奇心旺盛的人,我當然立馬去試,一口氣回答了上百個問題,可是送出異性的訊息大多石沉大海……後來就興趣缺缺了。沒想到,在OkCupid成立十年來龐大的資料,卻讓資料科學家發崛出一大堆極為有興趣的現象。這本書就是OkCupid的創始者之一克里斯汀.魯德 (Christian Rudder)的現身說法。玩大數據的大企業不少,包括谷歌、蘋果、亞馬遜、臉書等等都是箇中佼佼者,只是大多數資料是商業機密,像克里斯汀.魯德成立一個部落格OkTrends,用一手資料來討論並出書的不多。
從大數據瞭解我們的行為,只是個開始
《大數據下的人類行為觀察學:為什麼人們說的和做的不一樣?》不僅稀有,也還真是本令人愛不釋手的好書,克里斯汀.魯德的寫作功力和他創業及資料分析的功力一樣不凡。我一口氣讀完還感到意猶未盡,書中談到的各種現象,就發生在我們這個有社群媒體的特殊時代,裡頭揭露的各種人類行為,令人感到即熟悉又陌生,熟悉的是你我就是參與者,陌生的是眾人組成的行為模式,往往有些出人意表,意味著你我當常常嘴裏說一套,可是身體卻很老實。
從OkCupid的五百萬會員使用模式中,哈佛數學系畢業的克里斯汀.魯德挖掘出一批又一批資料,在書中畫了一個又一個簡單易懂的圖表,揭示了求偶過程中,人類隱而不宣的各種有趣行為。這樣躲在背後,趁使用者不注意時偷偷觀察各種社會學、心理學、人類學現象,就像是生物學家在野外做田野調查,而非把動物關在實驗室裏頭操作。
克里斯汀.魯德看來泡在大數據中是無時無刻都樂在其中,他旺盛的好奇心,問了一個又一個大家都很感興趣,也隱約以為知道答案,然而卻無從下手的好問題。書中分為三部分探討「我們為何互相吸引」、「我們又為何互相排斥」和「我們為什麼是現在這樣子?」。
書中五花八門的問題包括:男人和女人喜歡哪個年紀的異性呢?缺陷也能為人加分?推特讓寫作能力下降?跨種族的吸引力是如何?外貌究竟有多重要?我們怎麼描述自己?怎麼樣的社交網路有助穩固婚姻關係?還有多少同性戀者未出櫃?同性戀者的比例和居住地區有關嗎?犯眾怒的下場會是?
這些問題不單單是有趣而已,這些問題的答案,也會是重要的公共政策之參考。《大數據下的人類行為觀察學》舉了不少實例,指出好些社會或政治上的爭辯,其實可以透過真實的數據來探究,而非以訛傳訛或自以為是。
例如,準確預測出同性戀者在人口中的比例,是個嚴肅的政治問題,大數據考查出美國各州都有穩定比例的同性戀人口,與各州政治宗教氣氛無關,這也意味著同性戀非後天養成的。很有趣但也可悲的,在美國保守的州,更多已婚婦女上谷歌查詢的是她們老公是否是同性戀,比查詢是否偷吃的還多。可喜的是,從大數據來判斷,美國至少對非白人當總統和接受同性婚姻等等事上,是真的愈來愈開明了。
雖然大數據時代中知識就是力量,可是臉書和谷歌都能夠操縱我們閱聽的資訊,我們也不該完全放心大數據的力量,也不能盡信大數據。即使大數據告訴我們的是準確無誤的,瞭解我們的行為只是個開始而已。科技始終該來自人性,我們在這時候更該問題,是身為人的價值和意義為何?而非隨波逐流地讓科技來決定我們該如何生活和看待世界。
〔推薦序〕
由量化到質性的大數據行為分析
簡禎富
國立清華大學 清華講座教授
科技部「IC產業同盟」計畫暨「清華-台積電卓越製造中心」主持人
現代生活已離不開網路和資訊科技,但凡走過必留下痕跡,所有使用者在網頁上點擊、停留、交流和社群活動而被自動儲存的巨量資料,創造直接分析大數據以檢視人類行為的契機。本書作者克里斯汀.魯德(Christian Rudder)畢業於哈佛大學數學系,為交友網站OkCupid的共同創辦人,他結合大數據分析技術與領域知識,分析線上交友網站的第一手資料和深度的文字探勘(text mining),提出與傳統愛情專家不一樣的情感分析模式,並以實際案例介紹大數據分析的實質應用,並以簡單明瞭的視覺化方法提出各種洞察與解釋。作者認為,相較於臉書以現實生活人際網絡形成的社群,線上交友網站相對封閉與注重隱私,使用者比較能跳脫社會壓力,而依自己的態度和期望發表意見,不必擔心聊天內容出現在好友動態軸裡,承受他人七嘴八舌的評論。因此,交友網站使用者的表現反而更能反映出真實的個人偏好。例如:本書分析交友網站資料發現種族歧視仍普遍存在社會之中。
隨著軟硬體計算能力和雲網端的發展、處理結構和非結構化巨量資料的能力的進步,以及智能化大數據分析模式的研究,大數據應用的趨勢已經由量化到質性的分析,例如,本書對於人類行為大數據的觀察和分析應用。我們研究團隊亦透過產學合作計畫,從人力資源的巨量資料分析員工績效表現與其背景、招募管道等因子的關係,改變高科技產業人才遴選決策;此外,在某些職務,經內部推薦管道招募而來的人才表現相對外部招募為佳。根據這些數據分析結果,即可擬定相關決策建議,例如:與相關大學科系建立產學合作研究與實習機制等,以吸引「志同道合」人才;或是設計激勵獎金機制,鼓勵員工進行內部推薦,提升人才招募效率與品質。另外,我們也分析人力銀行的巨量資料,以分析未來類似學經歷的求職新鮮人,卻有不同的待遇,以找出對各種背景、不同領域的有效「加值能力」,避免社會新鮮人自我投資的資源分散和損失。
各國產業結構和社會文化迥異下,所需發展的大數據產業和應用也不盡相同。台灣長期以大量生產、規模經濟的製造模式,在「工業4.0」、物聯網和客製化時代將不再適用,而世界各國都普遍面臨因為自動化和機械人而加劇的貧富差距和年輕人就業供需不等問題。台灣應善用目前在「工業3.0」的供應鏈管理、整合能力和彈性應變的優勢,發展導入具智慧製造和聰明生產服務的「工業3.5」策略,搶先在優勢產業領域與利基市場建立破壞性創新,以人性化的大數據分析和人機協同的智能系統,因應無人化的工業4.0對台灣產業和人類社會的挑戰。然而,在透過大數據發掘潛在未知的人類行為和社群模式時,一方面可以確認一些猜想、破除一些假設;另一方面,網路行為累積的大數據的分析和應用,也可能會創造新的迷思和社會問題,如網路上的造神、霸凌和難以「洗心革面」的難題。
〔推薦序〕
最有趣的大數據提問,最誠實的數位田野調查
黃貞祥
清華大學分子與細胞生物研究所暨生命科學系助理教授
「know thyself」(γνῶθι σεαυτόν,認識你自己),相傳是刻在希臘德爾斐的阿波羅神廟的三句箴言之一,也是其中最有名的一句。
臉書剛風行時,許多朋友除了玩開心農場,另一個上臉書的目的是玩心理測驗,是為了更瞭解自己,還是讓朋友來瞭解呢?然而,因為種種的社會規範,我們即使是在做暱名或自己才看得到答案的心理測驗,可能心中想的和表現出的,是一個自己希望成為的人,而非真實的自己。
萬萬沒想到,...
目錄
引言
第1部分 我們為何互相吸引
1. 伍德森定律:男人偏愛年輕美眉
2. 大眾品味,就敗在太過平凡無聊
3. 牆上的字
4. 人際關係維繫強度和怎麼連結有關係
5. 其實,人不懂自己的心
第2部分 我們又為何互相排斥
6. 干擾因子
7. 對美貌神話的崇拜
8. 讓使用者自己開口說出心裡話
9. 憤怒的日子:透過打壓別人抬高自己
第3部分 我們為什麼是現在這樣子?
10. 在亞裔裡算是高的
11. 資料看到的社會痛苦指數:當有人必須隱藏自己性向時
12. 知道你的位置
13. 我們的品牌,可能是你的生活
14. 數位麵包屑
尾聲
本書資料說明
附註
致謝
引言
第1部分 我們為何互相吸引
1. 伍德森定律:男人偏愛年輕美眉
2. 大眾品味,就敗在太過平凡無聊
3. 牆上的字
4. 人際關係維繫強度和怎麼連結有關係
5. 其實,人不懂自己的心
第2部分 我們又為何互相排斥
6. 干擾因子
7. 對美貌神話的崇拜
8. 讓使用者自己開口說出心裡話
9. 憤怒的日子:透過打壓別人抬高自己
第3部分 我們為什麼是現在這樣子?
10. 在亞裔裡算是高的
11. 資料看到的社會痛苦指數:當有人必須隱藏自己性向時
12. 知道你的位置
13. 我們的品牌,可能是你的生活
14. 數位麵包屑
尾聲...