顛覆商業智慧邏輯思維
適用於所有人的直覺式視覺化分析
Tableau最佳入門書,從理論、語法到應用實務,循序漸進教學。
內容多元豐富,包括資料庫處理、地理資訊處理、數位鑑識分析和大數據分析等。
適用於大學部和研究所之相關資訊系所學生、老師或研究人員;以及個人、公司、政府機關或研究機構等資料分析人員。
程式設計 × 跨領域應用軟體結合使用 × 真實資料 = 洞悉商業智慧
本書以Tableau為核心,試圖將量性和質性資料,透過程式設計及其他相關應用軟體的結合與交互使用,再套入實際資料分析結果。內容包括Tableau運作機制的介紹;撰寫程式完成更細膩的問題洞察,產出有價值的「智慧」;了解視覺化的操作原理與其相對應程式碼;以及完成商業智慧、文字採礦、資料採礦、數位鑑識和大數據等跨領域的結合應用。
書中引導讀者上機實作,可真正體驗到:(1)以Tableau為上機實作的核心,如何透過它的運作機制處理巨量資料,且可在極短時間內來完成。(2)透過Tableau洞察問題的所在,用統計分析來檢定這種洞察、影響因子和解釋,並以資料探礦獲取潛在價值的知識。(3)Tableau跨領域的結合應用是具有交互操作與其實質效果的。
作者簡介:
吳國清
現職
中央警察大學資訊管理學系專任教授
中央警察大學鑑識科學研究委員會委員
學歷
國立成功大學工程科學研究所
經歷
中央警察大學資訊管理學系主任兼所長
中央警察大學鑑識科學研究委員會委員兼物理類鑑定小組召集人
中央警察大學治安犯罪與情資分析實驗室主持人
國家高考/特考考試典試委員、命題委員、口試委員
臺灣各級法院委託中央警察大學數位證據鑑定委員
各界推薦
名人推薦:
沈金祥/前行政院內政部資訊中心主任
陳毓潔/卓越動力資訊股份有限公司董事長
林永清/國立澎湖科技大學資訊管理學系系主任
名人推薦:沈金祥/前行政院內政部資訊中心主任
陳毓潔/卓越動力資訊股份有限公司董事長
林永清/國立澎湖科技大學資訊管理學系系主任
章節試閱
第10章 Tableau 與資料庫處理
本章概要
10.1 認識關聯式資料庫
10.2 安裝SQL Server資料庫
10.3 Tableau連線到SQL Server
10.4 建立關聯資料與統計分析
10.5 Tableau與資料庫處理
10.6 關聯與引用欄位
10.7 總結
當完成學習與上機實作後,你將可以
1. 認識關聯式資料庫
2. 建立與使用多個資料表的關聯
3. 學會Tableau與資料庫處理
4. 學會SQL和Tableau的相關函數使用
5. 將資料庫資料透過Tableau匯出供統計用
大家熟知的Tableau 軟體,一直被定位在以商業智慧為主的資料視覺化產品。其主要產品包括Tableau Desktop、Tableau Public 和Tableau Online。其中免費的Tableau Public 版本不提供SQL 連接(Connectivity)與資料庫應用。本章將以Tableau Desktop(含14 天試用版)產品,來探討如何與關聯式資料庫結合應用,包括Microsoft ACCESS 資料庫系統和Microsoft SQL Server 資料庫管理系統,這對於政府機關和民間企業數位轉型(Digital Transformation)(三轉:非數位→數位;實體→虛擬;檔案→資料庫)之後,透過資料處理與分析途徑,對提升政府服務品質、產業競爭力和產業經濟發展將會有所助益的。
10.1 認識關聯式資料庫
現今資料庫種類和資料模型表示呈現多樣化,主要包括關聯式資料庫(主流)、物件導向資料庫、分散式資料庫、NoSQL(Not Only SQL)資料庫、圖形資料庫⋯⋯等。資料庫管理系統(Database Management System, DBMS)是一種線上交易處理系統,為一與終端使用者、應用程式、資料庫和伺服器等互動的應用軟體,用於儲存、抓取(Capture)、處理、分析和管理資料。資料庫大都以結構化資料和明確的資料類型為主要特徵。具有關係型態資料庫的DBMS 被稱為關聯式資料庫管理系統(Relational Database Management Systems,RDBMS),它包含一個功能強大與共通標準的非程序導向結構化查詢語言(Structured Query Language, SQL),並已普遍應用在各種領域上。
一個關聯式資料庫由一個以上的資料表(Tables)所組成的。表中的列(Rows)被稱為紀錄(Records),表中的行(Columns)被稱為欄位(Fields)或屬性(Attributes)。一個包含兩個或多個關聯資料表(有PK 和FK 關係存
在)的資料庫被稱為關聯式資料庫,即存在相互關聯的資料。其實可將大家常用的Microsoft Excel 想像成一種無關聯的資料庫(含活頁簿和工作表)。在市場上,主要的RDBMS 產品,包括Oracle、MySQL、Microsoft SQL Server、PostgreSQL、IBM DB2 和SQLite 等等。
結構化查詢語言(SQL)是一種專為RDBMS 而設計的語言;同時也是一種針對運算資料(Manipulating Data)的宣告型語言(Declarative Language),以自動化方式存取資料庫內資料。SQL 功能包括新增、修改、更新和查詢資料庫中的資料,但也涉及到使用者的存取資料權限。
第10章 Tableau 與資料庫處理
本章概要
10.1 認識關聯式資料庫
10.2 安裝SQL Server資料庫
10.3 Tableau連線到SQL Server
10.4 建立關聯資料與統計分析
10.5 Tableau與資料庫處理
10.6 關聯與引用欄位
10.7 總結
當完成學習與上機實作後,你將可以
1. 認識關聯式資料庫
2. 建立與使用多個資料表的關聯
3. 學會Tableau與資料庫處理
4. 學會SQL和Tableau的相關函數使用
5. 將資料庫資料透過Tableau匯出供統計用
大家熟知的Tableau 軟體,一直被定位在以商業智慧為主的資料視覺化產品。其主要產品包括Tableau Desktop、Tabl...
推薦序
現今,大數據和商業智慧等領域應用,仍是政府機關和民間企業在提升組織競爭力上的關注重點。在大數據處理用資料可分成量性和質性。國內在量性(尤指結構化)資料之處理與分析上較為成熟,可是在質性(非結構化)資料方面仍有待提升,其最大技術瓶頸在於語意分析上。質性資料處理策略上可分成樣式(Patterns)和代碼(Codes)等,樣式偏向文字採礦的萃取(含斷詞與正規表示法、文字雲等),主要可供統計和資料採礦分析之用;而代碼偏向人為資訊縮減概念與賦予實質意義,並應用在質性研究領域上。
這本書探討範疇相當廣泛,並偏向資料科學。它主要以商業智慧為主要核心,去延伸到相關領域的交互應用。它強調「真實資料」對商業智慧的重要性與價值性,同時導入Tableau的「運作機制」概念與其程式設計技巧,這是國內外相關Tableau書籍和網路資料(含文字和視頻)所少見的,是此書的第一個亮點。此外,它亦企圖將商業智慧的洞察、文字採礦的樣式萃取、統計分析和資料採礦的決策法則相整合應用之,是此書的第二個亮點。最後,它以大數據分析最為結尾,它主要透過政府開放平台所提供的64萬多筆巨量酒駕案例資料,如何透過Tableau程式設計來進行文字採礦與統計分析等,是此書的第三個亮點。我期待未來質性資料處理的代碼策略能有所突破,並將結果導入商業智慧結合應用。如此一來,可預期對研究社會科學領域產生「質與量」的巨大影響,即使得「質性資料」和「量性資料」相整合在一起,減少了現今它們仍存在的鴻溝和分野。
吳教授是我多年好友,我們經常互動並討論統計與採礦議題。在互動過程中,彼此發現問題,並試圖解決它們,這對於知識領域增長幫助很大。這本書可說是他長久以來積極參與各項學術活動、不間斷的程式設計與實務應用等結晶,值得推薦給讀者們,讓大家知道商業智慧能為我們做什麼、如何去做和洞察現象等。相信大家閱讀此書和上機實作後,距離成為一位「資料科學家」或「資料科學分析師」就不遠了。
國立澎湖科技大學 資訊管理學系
系主任 林永清 教授
現今,大數據和商業智慧等領域應用,仍是政府機關和民間企業在提升組織競爭力上的關注重點。在大數據處理用資料可分成量性和質性。國內在量性(尤指結構化)資料之處理與分析上較為成熟,可是在質性(非結構化)資料方面仍有待提升,其最大技術瓶頸在於語意分析上。質性資料處理策略上可分成樣式(Patterns)和代碼(Codes)等,樣式偏向文字採礦的萃取(含斷詞與正規表示法、文字雲等),主要可供統計和資料採礦分析之用;而代碼偏向人為資訊縮減概念與賦予實質意義,並應用在質性研究領域上。
這本書探討範疇相當廣泛,並偏向資料科學。...
作者序
教育心理學者Tamara van Gog & Nikol Rummel(2010)認為「對於新手學習者來說,更多依賴於工作實例,對學習更有效,並且也更有效率。花費更少的時間和精力通常可以獲得更好的學習成果。」撰寫這本書理念即以實例學習認知觀點,來引導商業智慧軟體Tableau學習者的快速入門與如何應用於實務和學術上。
民國73年,作者完成第一支有關電子元件品管程式給某家小公司使用後,至今仍在撰寫各種領域的應用程式。期間學習與使用過不少的電腦語言和應用軟體,並開發完成一些實務與學術的應用程式和發表文章,包括大數據在內。
撰寫此書過程中,經歷了Tableau軟體的不同版本更新。以作者數十年程式設計經驗累積,透過Tableau運作機制,已找到舊版的一些錯蟲(Bugs),並發現新版的更正。作者始終認為每一種電腦語言和應用軟體,皆存在著它們的運作機制。然而,要找出這些機制,對於初學和有經驗使用者來說,仍是個挑戰。此外,國內外相關Tableau書籍和線上教材,乃以Tableau視覺化的人為操作與產出令人吸引的圖表為主,並已為Tableau推廣與應用做出卓越的貢獻。
當讀者閱讀此書時,便會發現它的邏輯思維、撰寫風格、內容範疇與現有市面Tableau書籍有所差異。它是以Tableau為核心,試圖將量性和質性資料,透過程式設計,及應用軟體的結合與交互使用,再以實際真實資料來加以實現之。其內容包括Tableau運作機制的介紹;撰寫程式來完成更細膩的問題洞察,以產出更有價值的「智慧」;了解視覺化的操作原理與其相對應程式碼;以及Tableau如何與其他相關領域應用軟體的結合應用等。這本書是以初學者角度,政府開放資料作為範例,電腦上機實作為導向。從資料收集開始,以Tableau為中介,如何進行文字採礦和資料採礦,以及統計分析,到最後實務性的統計意義解釋等。它所涉及的基礎知識領域包括離散數學、程式語言、統計、機器學習、資料庫、地理資訊、數位鑑識與大數據分析等。基於此,此書也很適合於企業、政府和學術等機構和人士所採用。
本書得以順利出版,首先要感謝中央警察大學和中國科技大學,長久以來提供很好教學、研究環境和所需電腦設備。其次,非常感謝五南圖書出版公司侯家嵐主編熱心協助出書和編輯部人員為編輯與校對所作的辛勞。還有,令我銘感五內的三位資訊科技先進——沈金祥主任、陳毓潔董事長和林永清主任,長期對作者在教學、研究上的協助與指導。最後,要感謝家人在撰寫此書期間的生活照料與精神寄託。知識是建立在不斷追求與容忍錯誤基礎上累積的,故而期待讀者們從批判觀點來檢視與指正此書的錯誤,使商業智慧更具有知識與商業的價值。
作者 吳國清
教育心理學者Tamara van Gog & Nikol Rummel(2010)認為「對於新手學習者來說,更多依賴於工作實例,對學習更有效,並且也更有效率。花費更少的時間和精力通常可以獲得更好的學習成果。」撰寫這本書理念即以實例學習認知觀點,來引導商業智慧軟體Tableau學習者的快速入門與如何應用於實務和學術上。
民國73年,作者完成第一支有關電子元件品管程式給某家小公司使用後,至今仍在撰寫各種領域的應用程式。期間學習與使用過不少的電腦語言和應用軟體,並開發完成一些實務與學術的應用程式和發表文章,包括大數據在內。
撰寫此書過程中,經...
目錄
第1章 Tableau使用入門
第2章 Tableau理論基礎
第3章 Tableau程式設計基礎
第4章 基本計算
第5章 表計算
第6章 資料層級計算——FIXED
第7章 資料層級計算——INCLUDE
第8章 資料層級計算——EXCLUDE
第9章 Tableau語法
第10章 Tableau與資料庫處理
第11章 Tableau與地理資訊處理
第12章 Tableau與數位鑑識分析
第13章 Tableau與大數據分析
第1章 Tableau使用入門
第2章 Tableau理論基礎
第3章 Tableau程式設計基礎
第4章 基本計算
第5章 表計算
第6章 資料層級計算——FIXED
第7章 資料層級計算——INCLUDE
第8章 資料層級計算——EXCLUDE
第9章 Tableau語法
第10章 Tableau與資料庫處理
第11章 Tableau與地理資訊處理
第12章 Tableau與數位鑑識分析
第13章 Tableau與大數據分析
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。