★為什麼越分析越失焦?
數據科學是為了解決問題,
但錯誤的決策通常都源於一連串的分析、解讀,
問題到底出在哪裡?
其實,大數據分析沒那麼神奇,說穿了不過是一種精神,
方向對了,可應用的面向相當廣闊。
本書教你用5D框架建立正確思維,打造獲利方程式。
1. Demand(需求)
開始分析作業前,請先「定義」需要解開的難題為何。舉例來說,喝慣A牌啤酒的消費者,忽然轉投向B牌的懷抱,業者想知道的是,如何提高品牌與消費者之間的互動率,但你卻一味研究起轉換率……。當心!像這樣在起點就跑錯了方向,又如何能成功抵達終點。
2. Design(設計)
也就是描繪輪廓:計算→視覺化報告→假說驗證→預測建模。以手搖飲料店為例,從消費金額、年齡層與性別,可推敲出商業現場的實際狀況;而驗證不同的假說(例如A:男性的消費單價較高/B:女性的消費頻率較高),也會發展出不同的決策模式。
3. Data(資料)
資料量大,不代表具備絕對優勢,與其聚焦在屬性資料,不如也蒐集「行為資料」。假設分析超商洋芋片的購買狀況,得出40~49歲女性是消費主力,是否可做出她們是目標客群的判斷,因而以輕熟女喜愛的口味為強銷目標?那如果真正的客群其實是兒童(媽媽買給孩子)呢?策略無疑大翻轉。這並不代表數據無用,而是此份消費紀錄不適合做為分析素材(不夠完善)。
4. Develop(開發)
商品叫好卻不叫座,矛頭該指向哪裡?廣告投放在符合目標客群的媒體上,但卻回應率低迷,甚至給人CP值不高的印象?明明使用了AI自動分析工具,得出精準度極高的預測結果,卻還是搞不清楚什麼因素才有助提高營業額?這表示你的考量尚缺全面性,突破開發困境就要利用「三力」,眉角都在本書裡。
5. Deploy(部署)
資料分析的結果要能「活用於現場」,讓人完整消化後「展開行動」,才有價值可言。分析人員要能以第一線銷售人員的觀點看待事物,並且共享資源。當團隊成員將框架化為共通語言時,才能確認內容是否具有說服力,並提供建議,為團隊打造好的循環。
商業世界瞬息萬變,數位化浪潮勢不可擋,
重點不在分析技術,而是「解決需求」!
因此,你不需要成為資料科學家,但務必懂一點資料分析。
本書從源頭為你建立正確思維,讓資料成為溝通橋梁,助你成功變現。
——專業推薦——
彭其捷|資料視覺化專家
作者簡介:
木田浩理Hiromasa Kida
(三井住友海上火災保險 數位戰略部‧首席資料科學家)
一九七九年出生。慶應義塾大學總和政策學部/慶應義塾大學研究所政策、媒體研究科畢業。曾任職於NTT東日本、SPSS/日本IBM、亞馬遜日本、百貨公司、通信販售企業等,自二○一八年五月於三井住友海上火災保險任職至今。在各式各樣不同的業界累積業務和資料分析的經驗。根據顧客的觀點進行CRM和市場行銷分析,專攻運用資料開發新市場。
伊藤豪Takeshi Ito
(三井住友海上火災保險 數位戰略部‧首席資料科學家)
一九八一年出生。早稻田大學商學部畢業。任職於SPSS/日本IBM約十年左右,擁有軟體業務和資料分析相關顧問經驗。之後轉職至通信販售企業負責資料分析,跨足顧客、市場和廣告等各項領域的資料分析,同時也負責CRM和商品改善。自二○一九年任職至現在。
高階勇人Yuto Takakai
(三井住友海上火災保險 數位戰略部‧資深資料科學家)
一九八一年出生。二○○七年自早稻田大學研究所文學研究科心理學科畢業後,進入構造計畫研究所。擁有資料分析相關顧問經驗。以顧客的角度,歷經製造業、通信業、自治團體和大學等,各種不同業界的資料分析。此外,也曾參加行動經濟學等領域的學會發表。自二○一八年任職至今。
山田紘史Hirofumi Yamada
(三井住友海上火災保險 數位戰略部‧資深資料科學家)
一九八五年出生。二○一○年自中央大學研究所理工學研究科畢業後,進入Dentsu e-marketing One Inc.(現為 Dentsu Digital Inc.)。負責活用市場行銷領域的資料驗證策略成效。之後也曾任職於市場行銷顧問公司,以及自由接案分析師。自二○一九年任職至今。
譯者簡介:
金鐘範
淡江大學日文系畢業,曾於日本京都同志社大學留學一年。因遇見乙一《夏天、煙火、我的屍體》而愛上閱讀,愛上日本小說。現為兼職譯者。
章節試閱
■找不到Demand(需求)?
這是我任職於提供零售商店服務的公司時發生的故事。這家公司比競爭對手更早打入市場提供服務,合作的連鎖店家規模也非常大,所以銷售情況相對穩定。然而,這半年來,營業額卻忽然急速下降,和去年相比呈現衰退的趨勢。即使詢問負責人原因,卻也只得到「這半年不論價格或是銷售方法都沒有任何改變」的答案。因此,商品負責人才會選擇委託資料分析團隊提供建議。
「營業額真的是突然急速下降。我們完全摸不著頭緒,所以想請你們幫忙調查。如果能知道原因,就能早點展開對策了。」從商品負責人手中拿到的資料裡,包括過去的銷售資料、顧客情報,以及販售的店家相關情報。正當我在思考該如何運用這些資料進行分析時,收到了商品負責人寄來的郵件。信上寫著「高層提出了『會不會是這個原因』造成的假說,所以我們自己也思考了各式各樣不同的原因」,信中條列出好幾項「假說」。郵件結尾表示「請運用我們提供的資料,驗證這些假說是否正確」。在這當下,委託的方向已經從「找出營業額下降的原因」,變成「驗證假說是否成立」。
郵件裡提到了幾個假說,例如「周邊人口稀少,競爭對手多,商店的地理位置差」、「或許是因為商品的招牌太舊,所以被撤下來了」、「已經沒有消費者需要這項商品」,或是「因為和商店的改裝時間撞期,所以無法販售該商品」等等。他們希望我們能利用取得的資料驗證以上的假說。
這些假說都可以先進行蒐集資料後,再統整報告,藉此判斷上述的負面因子是不是導致營業額下滑的原因。但因為店家分佈在全國各地,若要全部都調查一次,必須花上不少時間和精力。如果想調查顧客的需求,還必須確實進行問卷調查。
再者,這些「假說」幾乎都不是近期才發生的改變,即使可以視為「營業額下降的理由」,卻無法成為「營業額急速衰退的原因」。「營業額急速衰退」理應還有其他「課題」需要面對。
首先,我們統計了營業額資料和商店資料,運用儀表板將資料視覺化。雖然能看出
每個區域和商店個別的狀況,但因為這半年幾乎全國每間店的營業額都呈現衰退,所以無法從中得知營業額下降的原因。至於關於「假說」的部分,我們也針對公司內外部資料進行了調查,並實際走訪幾間商店和競爭店家,確認與「假設」是否吻合。
基本上進行這項作業時必須反向推敲,以「如果我是客人」的角度思索。例如「什麼時候我會需要這項服務」、「應該用什麼方法搜尋我需要的服務」,以及「根據什麼理由選擇需要的服務內容」。另外,也可以詢問和該服務的目標客群相似的親朋好友意見,或是運用社群軟體和部落格等方式蒐集普羅大眾的看法。
我們發現消費者對於該服務的認知度並不高。實際在瀏覽器輸入關鍵字後,競爭對手的排名順序明顯較高。運用專門的工具查詢自家公司和對手公司的網站進站數以及造訪路徑等,出現的結果如預期般令人擔憂。競爭公司的網站進站數正在急速上升。主要原因是他們強化行銷宣傳力道。反觀自家公司,不僅網頁進站數急速下降,甚至連行銷宣傳的力度也十分不足。
簡單來說,雖然競爭公司是較晚進入市場,提供的服務也與我們相同,但是對方加強行銷宣傳吸引顧客,於是導致使用我們公司的消費者減少,營業額隨之下降。總之,針對營業額減少的「問題」,我們所面臨的「課題」是「自家公司的行銷宣傳力道不夠,所以無法吸引顧客上門。」得知原因後會發現,其實理由非常單純。雖然負責人的反應是「什麼啊,原來是這個原因」,但如果當初依照假說針對「店家的地理位置」和「招牌的有無」進行調查,我認為並無法找出真正的答案。
■不知道Design(設計)應該如何著手
在Design(設計)的失敗經歷中,我們已經向各位介紹過廣告效果測量的
資料分析專案經歷,接下來繼續說該案例後續的發展。在那段過程中,我們製作了預測廣告及行銷宣傳活動會對營業額產生什麼影響的分析模組,並試圖對其效果進行定量預測。然而,因為需要耗費大量經費,再加上廣告方針改變,專案因此終止。當時我們將這則故事分類視為失敗的案例。
後來,公司因為要投放廣告,所以仍然需要預測成效,專案也因此重啟。於是負責的部門自行比對電視廣告播出之前和之後營業額的成長率,記錄點擊網頁廣告使用者的後續行為,並追蹤點擊轉換率,以預測廣告成效。經過一番努力後,該部門成功得出電視廣告和數位廣告各自的成效,但是無法預測跨領域的效果。
例如「是否能讓消費者在看過電視廣告後,主動上網搜尋,最後到實體店面購買」。因此當經營高層詢問「這個電視廣告播出後,最後賺了多少錢」時,公司內沒有人能回答得出來。雖然動員全公司執行的廣告效果測量專案曾一度以失敗收場,但這一次因為需求的難度提高,所以再次委託資料分析團隊負責。
「請針對各個廣告的效果進行定量預測」、「不分頻道種類,預測全公司所有商品類別」和「未來會把這個數值當作基準,作為全公司的關鍵績效指標」等要求。要求的目標本質上其實和上次失敗的專案大同小異,唯一的差別是這次我們改變了方法。我們沒有突然召集所有相關人員請他們提供資料、製作分析模組,「現有的測量方法有沒有問題?」「其他面臨同樣問題的企業是如何解決?」以及「有沒有運用新技術解決問題的相關案例」等等,首先我們做的事情是蒐集情報。接著再利用手邊的資料和工具做出原型,試圖想像出最後成品的樣貌。
以預測一般廣告(包含策略)成效的方法來說,可以調查廣告播出前後的差異性。另外,還有研究公司的固定樣本調查(針對接觸的廣告、公司網站的瀏覽次數,以及購買的商品,在一定時間內進行調查及量測成效的方法)等方法。以前項的方法來看,如果廣告播出前後的(廣告以外)條件不一致,就無法產生正確測量效果。甚至也可能因為不同狀況導致廣告播出後營業額下降,造成「負面效果」產生。另外,雖然固定樣本調查的方法需要追蹤每一個人的行動表現,資料粒度非常細,但也沒有細緻到能追蹤使用者偶然在電車上看到的垂掛廣告,或是報紙內的宣傳單等隨機的狀況。因此,也難以運用於橫跨線上和線下的情況。
為此我們採用第三個方法:每天蒐集各式各樣不同的資料進行統計分析。雖然資料的粒度稍粗,但無論是電視廣告、宣傳單,或是雜誌上刊登的報導,都能同時列入分析範圍。我們認為只要將氣候條件、自家公司是否有進行宣傳活動,以及競爭公司的動向等所有正負面條件都加入分析,再製作預測模組就能十拿九穩。於是,我們先將手邊蒐集到的資料和現有的資料全都放進統計分析軟體,製作出簡單的分析模組。
我們首次召集包含經營高層在內的主要成員,向他們報告並說明這次的分析專案內容。這次運用的分析方法能以「天」為單位,定量表示每個廣告和各項策略的效果,只要提供現場獨自管理的資料,就能再將預測的精準度向上提升。除此之外,我們也向客戶提案出建議,讓他們知道「倘若未來公司全體都需要使用這套分析模組,我們希望需要分析資料時,不是每次都委託資料分析團隊協助,而是導入能簡單操作的專門工具,每個成員都能自行進行分析」。工具的選擇,是以「能夠在短時間內完成分析,以及負責人可以自行手動操作並思考策略」為優先條件。對於這項建議,參加者回饋的意見是「如果能夠簡單的做到資料分析,當然沒有問題」,所以對於導入工具這件事,大致上可說是獲得大家的同意。
這一次的經驗讓我們體會到,必須在Design階段調查面臨的「課題」和盡可能蒐集「資料」,並選擇共同認定最合適的「分析方法」,思考如何在最後做到「標準化」。方可順利的取得預算,獲得相關人員的協助。
■這樣取得Data(資料),才是對的
這是Data(資料)失敗經歷的後續故事。在該章節提到,雖然能夠透過分析顧客的屬性資料,得出廣告宣傳郵件的名單列表,但因為用於分析的顧客「屬性資料」不夠齊全,最後並未達成預期效果。儘管已經知道這間公司的顧客情報十分不足,也盡可能蒐集顧客的職業、興趣和居住地等相關情報,但仍然難以蒐集完整。這一點,站在顧客的立場來看,除非有極大的正面誘因,不願意透露也是無可厚非。
於是,我們回到最初的起點,嘗試思考我們是為了什麼理由蒐集資料。思考後發現,與其聚焦在「屬性資料」,應該再更深入探究顧客在購買商品前有什麼樣的反應,蒐集「行為資料」更具參考價值,因此我們將焦點從屬性資料轉移到行為資料。
瀏覽網站商品介紹頁面的訪問者很多,只要使用專門工具,即可取得使用者的訪問資料。雖說這些資料中,只能鎖定一至兩成(以前曾經消費過)的顧客,但總比不運用任何資料來得好,因此也決定整理出每個顧客的行為表現當作情報使用。首先,先從「是否曾經造訪過網站」開始,接著則是「瀏覽哪一頁商品頁面」、「總共造訪過幾次」、「從什麼時候開始造訪」,漸漸提高資料的細緻程度,將顧客的行為資料化。
深入探究這些行為資料後可以發現,確實行為表現是因人而異,同時也逐漸能看出這些行為和購買行為間的關聯性。此外,我們也因此能夠思索「為什麼這位顧客要買這項商品?」並根據消費者的年齡或職業類型,推斷其購買商品的原因。甚至例如有些顧客是因為廣告內容中提到「能解決○○的問題」,就一頭熱的相信「○○就是促成購買的原因」。
但瀏覽過顧客服務中心留存的對話紀錄和電子商務網站的評論後發現,即便是一樣的商品,每個消費者也並非基於相同的理由購買。既然有「覺得看起來不錯」就購買的人,當然也有懷著「聊勝於無」心態的消費者。同時我們也得知購買後覺得商品很好,因而幫親朋好友購買的消費者人數比預期還多。這種「心理資料」才是銷售預測最需要的部分。
於是,我們決定詢問顧客「購買原因」。這項需求會增加顧客服務中心的系統操作流程,為了避免增加員工負擔,我們改善了系統的操作介面,讓他們可以運用簡單的步驟選擇我們事先準備好的幾個選項。這些選項是來自過去的對話紀錄,我們將這些內容進行文本分析之後,再把主要原因分組歸類後篩選而成。雖然剛開始一直無法提高回收率,導致顧客服務中心怨聲四起,但一段時日之後,漸漸有了成果,最後成功詢問出「購買原因」的比例高達九成以上。除此之外,我們也利用購買後的調查問卷蒐集資料,順利掌握購買後的「滿意度」。透過上述方法,我們成功的在短時間內取得大量可用資料。
藉由蒐集顧客的「行為資料」和「心理資料」,能夠更精準描繪出每位顧客的樣貌。活用這些資料重新製作出的分析模組,便能夠大大提升廣告宣傳郵件和電話行銷的成效。
此外,這些資料不只能夠提高分析的精準度和顧客關係管理策略的效率,甚至牽涉更大的成果效益。只要一取得「購買原因」和「滿意度」的相關資料,我們會馬上使用商業智慧(Business Intelligence,BI)工具,將內容彙整於儀表板,再寄信通知全體員工。其實員工對於廣告的訊息訴求沒有太多認知,也不太理解,透過上述方法和公司全體共享情報,能夠讓員工知道消費者購買商品的理由可能和當初預想的原因完全不同,而這些情報不僅能作為調整行銷宣傳方法的參考,同時還能靈活運用於新商品開發。
■找不到Demand(需求)?
這是我任職於提供零售商店服務的公司時發生的故事。這家公司比競爭對手更早打入市場提供服務,合作的連鎖店家規模也非常大,所以銷售情況相對穩定。然而,這半年來,營業額卻忽然急速下降,和去年相比呈現衰退的趨勢。即使詢問負責人原因,卻也只得到「這半年不論價格或是銷售方法都沒有任何改變」的答案。因此,商品負責人才會選擇委託資料分析團隊提供建議。
「營業額真的是突然急速下降。我們完全摸不著頭緒,所以想請你們幫忙調查。如果能知道原因,就能早點展開對策了。」從商品負責人手中拿到的...
作者序
前言/不需要成為「資料科學家」也沒關係
三十歲、文組科系,非IT背景出身、業務。這是十年前我(木田)身上所貼的標籤。當時的我是一名「統計軟體」的業務。我本身並不是統計學的專家,只是湊巧負責的商品是「統計軟體」。在「大數據」一詞尚未普及的時代,我在因緣際會下對「資料分析」產生興趣,於是開始自學統計方法及資料分析。現在的我是一名資料科學家,任職於損害保險公司──三井住友海上火災保險株式會社。
雖說我是恰巧踏入「資料分析」的世界,然而以十年前的環境與技術,根本無法想像「資料的重要性」會成為一個重要觀念。
■不論是誰,都有機會成為「資料分析」的專家
如今的社會被各式各樣的數據、資料所圍繞,整個環境面臨了巨大的變化,不僅「AI」、「機器學習」、「深度學習」這幾個關鍵字充斥於日常的商業對話,眾多書籍及雜誌更是將資料分析視為「改變商業的魔法」。
我也聽聞許多商務人士開始學習程式設計(傑出資料分析的必備能力),或是重新學習數學(資料分析的基礎)。擁有卓越AI技能的理組背景者更是求職市場上的大熱門,掌握資料分析能力的人才在轉職時能談到更高的薪酬。就業市場遭遇到空前的理科人才荒,甚至連知名大企業也難以搶到掌握並能善用高端技術的「超級菁英」。
即使處於這種情況,經營高層依然不會輕言放棄。「把資料科學家給我找來!」或是「給我組個資料分析小組!」或許現在手握本書的各位,也是被下達這種指令的其中一人。
■「資料分析」的關鍵與技術無關?
或許有一天,閱讀本書的讀者們,會突然成為率領資料分析團隊的負責人,或是成為資料分析團隊的一員,在這個時代,這並非不可能的事。
當事情發生時,我想以自身經驗鼓勵大家,即便並非相關領域或事業出身,也請千萬不要放棄。倘若各位讀者曾在商場打滾,這些累積的經驗在資料分析領域將成為一大助力。本書正是以「有一天我突然成為資料分析團隊的率領者,或是成為資料分析團隊的一員」為主旨所撰寫的養成指南。
一般而言,AI或是資料分析被認定為「理科背景者」的範疇。而實際上對數學有一定程度把握的人,確實在資料分析領域會有較傑出的表現。然而「資料分析」的重點是「應用在商業實務上」,但「擅於分析」和「將分析結果運用在商業上」這兩件事並不一定能夠同時成立。在日復一日的工作中,身為文組背景資料科學家的我,深深領悟到:「作為一名資料分析家,商業能力絕對是必須的」。
接下來介紹一項非常有趣的調查。這項調查是由一般社團法人資料科學家協會(地點:東京都港區,代表理事:草野隆史,以下簡稱資料科學家協會)在二○二○年四月公布的《國內企業資料科學家僱用現況調查》。
● 調查結果摘要
1.僱用資料科學家的企業佔二九%。
2.計畫僱用資料科學家的企業中,有五八%的企業未達成目標僱用人數。
3.計畫增加僱用資料科學家的企業中,有四一%的企業需要擅於解決商業課題的人才。
4.在未來想招聘的資料科學家類型方面,有四○%的企業需要行銷人才、三六%需要工程師人才、二四%需要分析師人才。
根據第3點和第4點的調查結果,我們可以發現,相較於資料科學家,其實企業更需要的是具備商業能力的人才。而這份能力就是「透過資料分析所推演出的觀點(全新的見解和發現),提高企業營業額和利益的力量」。若想達成上述目標,「邏輯思維」、「解決問題的能力」、「行銷戰略」、「經營戰略」,以及「溝通能力」和「提案能力」是更加不可或缺的技能。
站在公司人資部門立場,應該會抱怨「光是僱用理科人才就已經很困難,還想找到同時具備資料分析和商業能力的人才根本是不可能」。的確,兼具資料分析及商業能力的人才真的是鳳毛麟角。
值得關注的是,近幾年越是積極採用資料分析人才的企業,越容易發生人才錯置的問題。「雖然聘雇了資料科學家,但卻不知道如何運用而傷透腦筋」,或是「僱用的資料科學家沒多久就辭職了」,這類情況時有耳聞。簡言之,即便找來了會程式設計、擅長統計學,或是數學專家的人才,也並非就此一帆風順。
■「能將資料運用於獲利上的資料分析人才」才是正解
「理組背景是首要僱用條件」的時代已經結束了。現在企業需要的是:適合自家公司商業目標的「資料分析人才」,最佳人選正是公司的在職員工。若以這個角度看,文組或理組出身差異不大,只要擁有業務或行銷的相關經驗,曾經思考過顧客對於自家產品或服務的需求,就已站上起跑線。除此之外,只需要掌握若干資料分析能力,就能對應大多數企業的內部需求。
話雖如此,抱持著「資料分析應該也不是那麼容易學會吧」的想法也是無可厚非。然而,資料分析工具進步速度飛快,以往資料分析必備技能之一的程式設計能力,現在也能透過使用GUI圖形使用者介面(Graphical User Interface)達成。「資料分析民主化」的推進勢不可擋。現在正是跨越文組及理組限制,任何人都能成為資料分析人才的時代。坦白說,企業所需要的並不是「資料分析能力超群的資料科學家」,我們沒有必要成為資料科學家,只要成為「能將資料運用於商業上的資料分析人才」即可。
目前正以勢如破竹的氣勢,搶攻市佔的日本話題平價時尚品牌WORKMAN正是最好的例子。該企業全力投入培育資料分析人才,讓具備商業頭腦、業務出身的資料分析師在職場上大放異彩。
■打破技術困境的方法
若是某天各位讀者突然成為資料分析團隊的領導者,或是成為資料分析團隊的一員,我相信大家肯定會非常困惑該從何處開始著手。進到書店,我們能看見滿坑滿谷「Python入門」、「資料分析入門」這類專為初學者打造的資料分析教學書,但卻找不到任何關於製作實際商務資料分析組織的方法,或是介紹面臨困境時解決方案的書籍,也幾乎看不到任何闡述資料分析師應具備何種商務能力的書。然而,若要運用於商業上,我們就必須知道這些訣竅。
本書並未針對詳細的資料分析技術進行介紹,所以即便閱讀本書也無法立刻成為一名資料分析師。本書的重點在於「當各位被任命為資料分析負責人,或是率領資料分析團隊時該如何思考」的方法。具體而言,則是精進資料分析技能時應具備的「思考法的框架」,以及我運用該框架所導出的「資料人才培育理論」。上述重點是身為作者的我們(木田、伊藤、高階、山田)根據自身經歷和失敗經驗所孕育出的產物。
我以成為一名資料科學家為目標,並自學資料分析技能,至今管理了無數資料分析團隊。當時的我面臨許多不同的困境,一路不停的摸索推敲再各個擊破。如今回想起來,其中也經歷過許多失敗。相信各位讀者在未來也會遇見困難,但只要閱讀本書,就會知道往後將有哪些障礙等在前方,也能知道突破難關的方法。
■「5D框架」是什麼?
我們四位作者至今在許多不同的企業負責資料分析專案,其中有失敗也有成功的經驗。我們從這些經驗中彙整出「不會失敗」的方法論,並建立出一套名為「5D框架」的體系。
接下來想先介紹幾個例子,讓各位讀者能稍微體會到5D框架的概念。至於詳細內容則將會於本書的第2章進行介紹。「料理」時常被用來比喻資料分析,從圖0-1可以發現,資訊分析流程和料理十分雷同,即是烹煮」「資料」這份食材,向顧客提供餐點(資料),並請對方享用。
料理並不單純只是烹飪食材,將餐點送上餐桌即可。若餐點不能讓對方感受到喜悅,就無法被稱為「美味的料理」。除了要在食材選擇及調理方法下足工夫外,最重要的是充分了解對方想要什麼。若想提供完美的料理,必備的要素和步驟是不可或缺的。若是在任一步驟敷衍了事,或是弄錯步驟順序,就會變成「難吃的料理」。
資料分析也是如此。為了避免製作出「無法吸收的資料」,必須按部就班完成,共有五個既定的步驟。這每個步驟的名稱都是英文字母「D」開頭,因此稱為「5D框架」:
1.Demand(需求)
2.Design(設計)
3.Data(資料)
4.Develop(開發)
5.Deploy(部署)
接著依序介紹五個步驟的內容。
1.Demand(需求):詢問需求
料理是為了讓人享用而製作。既然要讓對方品嚐,理所當然要詢問對方想要吃什麼樣的料理,或是確認對方當下的心情(狀況)。有些人會明確指定一種料理,也有人會講出曖昧不明的需求。即使對方回答「吃什麼都可以喔」,事實上並不是什麼都可以,必須確認對方可以接受的料理類型。
資料分析和製作料理相同,工作的起點是從詢問對方的需求開始,先找出對方所面臨的「問題」,或是成為路障的「課題」。同時也必須在這個時間點事先確認我們所提供的幫助是否確實適當無疑。
2.Design(設計):描繪整體輪廓
以料理為例,當聽完對方的需求後,接著會開始思索「要製作什麼樣的料理呢?」首先,所有食材並非都唾手可得,也會有時間上的限制。再者,自己也不是每道料理都能信手捻來。因此,我們必須估算「依照現在的狀況,能在時間內做出哪些料理」,同時也需要思考什麼時候將餐點端上桌,該安排對方在哪裡享用等等。而上述的內容,都必須在取得對方的同意後,才能開始製作。
資料分析也一樣,必須思考「能在有限的時間內,使用取得的資料分析出什麼樣的結果」以及「運用這份分析結果,可以解決什麼樣的課題」。將這問題考量完畢後,就可描繪出整體的輪廓。將輪廓圖展示給對方確認,獲得對方的同意後,便能開始著手進行分析作業。
3.Data(資料):蒐集資料
當然,製作料理時不可或缺的就是食材。除了食材本身之外,也必須留意它的分量以及品質。只需要一項食材的料理極為稀少,大部分料理都是運用許多不同的食材組合製作而成。食材的品質是製作美味料理的必要關鍵之一,烹調方法也是至關重要。同時還需要注意保鮮,光是保持食材的鮮度就得耗費心力及金錢成本。
資料分析也是如此。蒐集有用的資料並不簡單,讓資料隨時保持在最新狀態更是需要耗費成本。資料和食材一樣,都不是免費的東西。
4.Develop(開發):分析資料
料理是門深奧的學問,依照食材不同會有最適合該食材的調理方法(食譜),也會有相對應的技術和器具(工具)。只要順序、作法或是器具的使用方法有所閃失,就有可能糟蹋了得來不易的食材。「燒烤」或是「燉煮」等烹調方法,還需要耗費時間進行事前準備。
著手資料分析前,需要將資料加工,做好事前準備,再選擇適合資料和目的的解析手法進行分析。若事前準備做得不夠充分,或是方法錯誤,將無法得到預期的結果。為此,資料分析師的知識和經驗顯得格外重要。此外,也有許多工具能從旁輔助。善用工具不僅能縮短分析時間,分析出的結果也大部分比人工作業準確。
5.Deploy(部署):展示資料
料理完成後,接著要端上餐桌請對方享用。除了需要依照事先決定的時間點和分量提供外,還得將當下的氣氛、氛圍等一併納入考量。這時或許情況已經和一開始的狀況有所不同。既然料理都製作完成了,當然會希望對方全部吃光,滿足顧客的味蕾。以餐廳為例,必然會希望將顧客變為常客,還希望他能將餐廳介紹給其他人,吸引更多顧客來店光臨。
資料分析也是一樣。報告完分析結果後,必須讓對方理解結果內容,並使其採取必要的行動。有時候也會以「儀表板」或「預測系統」的方式,讓分析結果一目瞭然。若無法讓對方展開行動就無法解決「課題」。唯有在對方完整「消化」我們所提供的分析結果,並展開「行動」,資料分析專案才算大功告成。
5D框架的五個階段環環相扣,若欠缺其中任一項都有可能導致分析專案以失敗收場。反之,只要依照順序確實執行,不論文組背景或理組背景,任何人都能以極高的成功率正確執行分析專案。
■閱讀本書的方法
第1章將以故事的形式,分享作者們的成功和失敗經驗,也會提及未來各位讀者將會遇見的關卡。閱讀完本章節,即可提升經驗值;第2章會詳細說明何謂5D框架;而第3章則會總結組織導入5D框架的方式。
基本上本書的閱讀方式是從第1章開始依序閱讀,但也推薦各位讀者讀完整本後再重新閱讀第1章。也就是先了解5D框架後,再重讀第1章的失敗經驗,在閱讀的過程中可以針對「哪些地方容易碰到困境?」「該怎麼做才能避免遇到瓶頸?」找出屬於自己的解方。
想要盡早掌握5D框架概略的讀者,可以從第2章開始,最後再閱讀第1章。而身分為資料分析團隊領導者的讀者們,若是想知道「培育分析團隊的方法」,則建議從第3章開始,接著再閱讀第1章和第2章。我相信透過上述的閱讀順序,可以對培育方法有更深入的了解。
本書讀者群不限理科或文科背景,無論你是一心一意踏入資料科學家行列,或是臨危受命,非不得已的踏入資料科學家行列,都很適合閱讀這本書。在這混亂的世界中,倘若本書能成為各位站在職涯分叉路口上,替各位點亮「資料分析」這條道路的明燈,便是我至高的榮耀。
作者代表 木田
二○二○年十月
前言/不需要成為「資料科學家」也沒關係
三十歲、文組科系,非IT背景出身、業務。這是十年前我(木田)身上所貼的標籤。當時的我是一名「統計軟體」的業務。我本身並不是統計學的專家,只是湊巧負責的商品是「統計軟體」。在「大數據」一詞尚未普及的時代,我在因緣際會下對「資料分析」產生興趣,於是開始自學統計方法及資料分析。現在的我是一名資料科學家,任職於損害保險公司──三井住友海上火災保險株式會社。
雖說我是恰巧踏入「資料分析」的世界,然而以十年前的環境與技術,根本無法想像「資料的重要性」會成為一個...
目錄
前 言 不需要成為「資料科學家」也沒關係
第1章 提升經驗值——失敗案例和成功作法
企業碰到什麼問題?
是哪裡出問題?預期內的失敗與失敗的原因
沒那麼難?成功的做法與成功的理由
讓「分析」的技術,活用於「現場」的辦法
第2章 實踐5D框架
Demand(需求)
Design(設計)
Data(資料)
Develop(開發)
Deploy(部署)
第3章 5D框架資料分析人才育成術
企業在煩什麼?
能讓管理階層、領導階層理解的5D
什麼樣類型的人適合資料分析的相關工作?
商業數據翻譯師——將資料變現的關鍵人物
後 記
前 言 不需要成為「資料科學家」也沒關係
第1章 提升經驗值——失敗案例和成功作法
企業碰到什麼問題?
是哪裡出問題?預期內的失敗與失敗的原因
沒那麼難?成功的做法與成功的理由
讓「分析」的技術,活用於「現場」的辦法
第2章 實踐5D框架
Demand(需求)
Design(設計)
Data(資料)
Develop(開發)
Deploy(部署)
第3章 5D框架資料分析人才育成術
企業在煩什麼?
能讓管理階層、領導階層理解的5D
什麼樣類型的人適合資料分析的相關工作?
商業數據翻譯師——將資料變現的關鍵人物
後 記
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。