~馬雲:「現代極端缺乏大數據人才」~
統計學是科學的文法,更是「大數據時代」穩操勝券的基本功。
「我有信心,本書可謂史上最簡單明瞭的統計學書籍!」——作者 栗原伸一【本書特色】
◎開創學習統計學的「最小阻力之路」:
鎖定「學校或公司需要統計分析,自己卻不知從何著手」、「雖讀過基本入門書籍,實際分析時卻不知該選哪種手法」讀者群,提供「極簡運用法」。
◎11大章節,從基礎到運用層層遞進:
從【機率分配】➔【信賴區間估計】➔【假設檢定】➔【變異數分析與多重比較】➔【貝氏統計學與大數據】……共11大章節,從基礎到應用,創造學習統計學的最短路徑。
◎圖鑑式內頁,將抽象觀念畫作具象解析:
透過大量的圖表和插圖,將難以理解的觀念化作具象圖解,配合補充專欄全面性架構基礎知識,紮穩飛越前的地基。
【審定推薦】「本書內容充實,不僅是描述性統計、推論性統計,甚至是貝氏統計也包在內,書中也介紹R軟體的使用方法,全書以插圖方式呈現,閱讀時生動有趣不會感到乏味,書中介紹的統計處理的方法與其步驟也搭配實例說明,頗為清晰明確,分析結果的解讀分法也簡明易懂,容易學以致用,本書對初學者可說是一本不可多得的入門書,對學過統計學的人來說也是很好的使用參考手冊,期盼本書能帶給您學習的樂趣與滿足感。」——陳耀茂
前些日子,紐約時報送給即將畢業的大學生一篇報導,標題如下:
「今天我只對即將畢業的你們說一句話,那就是『統計』。」
Google首席經濟分析師提及「今後十年最有吸引力的工作將是Statistician(統計專家)。」
馬雲說:「中國極端缺乏大數據人才。」
事實上眾所周知包含Google在內,
全球頂尖企業如微軟、IBM等早已展開相關人材的爭奪戰。
物聯網、雲端運算、大數據分析等技術的結合,揭開新時代的序曲,
而奠定這一切的統計學,確實是未來10年的最熱技能。
將場景轉回現在,試想在公事中,是否經常碰到類似問題:
.為什麼A項開發案如石沉大海,B項卻一擊即中?
.為什麼甲款商品庫存堆積如山,乙款卻長銷熱賣?
.為什麼有些人投資有去無回,有些人卻穩操勝券?
以統計學邏輯來看,暢銷、長銷、爆紅、超高點閱率等名詞,和「運氣」完全脫鉤。
統計專家在以「常理」判斷,做出決定前,
以科學數據免除被「表象」、「套路」帶走的陷阱,
用數字明確回答:成功經驗到底是否可信?哪裡可能是隱蔽的陷阱?失敗的原因為何?
平均數/離散分位數/變異數/釣鐘型分配/常態分配/Poisson分配/
替代常態分配/信賴區間/虛無假設/對立假設/獨立雙樣本/不劣性試驗/
重複檢定/魏克生符號檢定/迴歸分析/殘差分析/多元迴歸分析……
以上提及的名詞,就是能確實分析,找出通往成功階梯的工具。
本書透過簡明圖解,釐清統計學背後的科學機制,掌握從數據中獲取真知的技巧。
由日本兩位大學教授聯手,以清晰而簡單的圖象化教學層層遞進:
【敘述統計學】➔【機率分配】➔【推論統計學】➔【信賴區間估計】➔【假設檢定】
【變異數分析與多重比較】➔【無母數分析方法】……
共11大章節,鎖定「學校或公司需要統計分析,自己卻不知從何著手」、
「雖讀過基本入門書籍,實際分析時卻不知該選哪種手法」等目標讀者群,
為其提供最容易消化的方法,開創學習統計學「最小阻力之路」。
作者簡介:
▌栗原伸一(Kurihara Shinichi)
【序章、第3章、第4章、第5章、第6章、第7章、第8章、第11章(貝氏統計學)、附錄B、偉人傳】
1966年 生於茨城縣水戶市
1996年 東京農工大學大學院博士課程修了博士(農學)
1997年 千葉大學園藝學部助手
2015年起 同大學大學院園藝學研究科教授
專攻農村計畫與政策評估,近年來參與多項食品安全性消費者意識調查研究。授課除了統計學外,也有計量經濟學和消費者行為論等課程。
▌丸山敦史(Maruyama Atsushi)
【第1章、第2章、第9章、第10章、第11章(大數據)、附錄A】
1972年 生於長野縣長野市
1996年 千葉大學大學院園藝學研究科碩士課程修了
2001年 千葉大學取得博士(學術)學位
2007年起 同大學大學院園藝學研究科准教授
專攻農業經濟學。運用計量經濟學手法,研究領域遍及農業生產、環境評估等。授課除統計學外,也有經濟數學和消費者行動論等課程。
譯者簡介:
▌審定簡介 陳耀茂
1972年日本政府獎學金公費留日
國立日本電氣通信大學經營工學工學碩士、博士
東海大學企管系暨管理研究所教授,目前(退休)兼任教授
曾擔任中華民國品質學會理事、國家品質獎評審委員、全國團結圈活動競賽評審委員等。
出版著作有:《商品企劃七工具(中衛發展中心)》、《工程統計學》、《醫護統計與SPSS》、《醫護統計與AMOS》、《EXCEL品質管理》、《工業調查與資料分析》等。
▌李貞慧
臺大工商管理學系畢業,日本國立九州大學經濟學碩士,取得中國生產力中心第十屆中日同步口譯人才培訓研習班結業證書,擅長中日對譯,目前專職從事醫學、核能、光電、機械設備、電機工程、金融商業、美容等口筆譯工作。
譯有《一人開公司也能搞定的財務管理實務》、《工作一定要用到的統計》。
目錄
.序章何謂統計學?
.何謂統計學?
.統計學可以做的事
第1章 敘述統計學
.1.1 各種平均數
.1.2 資料的離散① 分位數與變異數
.1.3 資料的離散② 變異係數
.1.4 變數相關性① 相關係數
.1.5 變數相關性② 等級相關
第2章 機率分配
.2.1 機率與機率分配
.2.2 機率均等的分配均勻分配
.2.3 擲硬幣的分配二項分配
.2.4 吊鐘型分配常態分配
.2.5 無尺度的分配標準常態分配
.2.6 知道資料的位置σ區間
.2.7 分配的形態偏態與峰度
.2.8 很少見的分配 波瓦生分配
.2.9 同時處理複數資料χ2分配
.2.10 χ2值的比F分配
.2.11 替代常態分配t分配
第3章 推論統計學
.3.1 由樣本掌握母體特徵推論統計學
.3.2 巧妙推論母數不偏估計
.3.3 未受限的資料數量自由度
.3.4 樣本統計量的分配① 平均數的分配
.3.5 樣本統計量的分配② 比例的分配
.3.6 樣本統計量的分配③ 變異數的分配
.3.7 樣本統計量的分配④ 相關係數的分配
.3.8 偏離真值 系統誤差與偶然誤差
.3.9 樣本平均數相關的二大定理大數法則與中央極限定理
第4章 信賴區間估計
.4.1 有範圍的估計① 母體平均數的信賴區間
.4.2 有範圍的估計② 母體比例的信賴區間
.4.3 有範圍的估計③ 母體變異數的信賴區間
.4.4 有範圍的估計④ 母體相關係數的信賴區間
.4.5 模擬估計母數拔靴法
第5章 假設檢定
.5.1 判斷是否有差異假設檢定
.5.2 二大假設虛無假設和對立假設
.5.3 假設檢定的步驟
.5.4 特定值(母體平均數)和樣本平均數的檢定
.5.5 假設檢定的二大錯誤型一誤差和型二誤差
.5.6 特定值(母體比例)和樣本比例的檢定
.5.7 特定值(母體變異數)和樣本變異數的檢定
.5.8 真有相關關係嗎?不相關的檢定
.5.9 平均數差異檢定① 獨立雙樣本
.5.10 平均數差異檢定② 成對雙樣本
.5.11 比例差異檢定獨立雙樣本
.5.12 驗證沒有比較差不劣性試驗
第6章 變異數分析與多重比較
.6.1 用實驗確認效果單因子變異數分析
.6.2 多樣本的變異數同質性檢定Bartlett檢定
.6.3 考慮個體差異重複量數單因子變異數分析
.6.4 找出交互作用雙因子變異數分析
.6.5 不可重複檢定多重檢定
.6.6 重複檢定(多重比較法)①
.Bonferroni法和Scheffe法
.6.7 重複檢定(多重比較法)②
.Tukey法和Tukey-kramer法
.6.8 重複檢定(多重比較法)③ Dunnett法
第7章 無母數分析方法
.7.1 不取決於分配的檢定無母數分析方法
.7.2 質化資料檢定獨立性檢定(皮爾生χ2檢定)
.7.3 2×2交叉表檢定費雪精確性檢定
.7.4 獨立雙樣本的等級資料檢定
曼恩-惠尼U檢定
.7.5 成對雙樣本的等級資料檢定符號檢定
.7.6 成對雙樣本量化資料無母數檢定
魏克生符號檢定
.7.7 獨立多樣本等級資料檢定
K-W二氏檢定
.7.8 成對多樣本等級資料檢定弗里曼檢定
第8章 實驗設計法
.8.1 費雪實驗設計三原則① 重複
.8.2 費雪實驗設計三原則② 隨機
.8.3 費雪實驗設計三原則③ 局部控制
.8.4 各種實驗配置
.8.5 減少實驗次數直交表實驗法
.8.6 直交表實驗法應用① 品質工程(參數設計)
.8.7 直交表實驗法應用② 聯合分析
.8.8 如何決定樣本大小檢定力分析
第9章 迴歸分析
.9.1 尋找原因與結果的關係迴歸分析
.9.2 將資料套用到公式最小平方法
.9.3 評估迴歸線精度判定係數
.9.4 評估迴歸線斜率t檢定
.9.5 檢討分析合宜程度殘差分析
.9.6 複數原因時的迴歸分析多元迴歸分析
.9.7 自變數之間的問題多元共線性
.9.8 選擇有效的自變數變數選擇法
.9.9 說明質化資料差異的變異① 虛擬截距
.9.10 說明質化資料差異的變異② 虛擬斜率
.9.11 二元變數的迴歸分析普羅比迴歸分析
.9.12 分析到事件發生為止的時間① 存活曲線
.9.13 分析到事件發生為止的時間② 存活曲線比較
.9.14 分析到事件發生為止的時間③ Cox比例風險模式
第10章 多變量分析
.10.1 匯集資訊主成分分析
.10.2 發現潛在要因因素分析
.10.3 敘述因果結構結構方程模式(SEM)分析
.10.4 分類個體集群分析
.10.5 分析質化資料關聯性對應分析
第11章 貝氏統計學與大數據
.11.1 活用知識和經驗的統計學貝氏統計學
.11.2 萬能公式貝氏定理
.11.3 由結果回溯原因事後機率
.11.4 用新資料更為正確貝氏修正
.11.5 大數據分析① 何謂大數據
.11.6 大數據分析② 關聯分析
.11.7 大數據分析③ 趨勢預測和SNS分析
.附錄A
.附錄B
.索引
.作者簡介
【專欄】
.統計學的歷史
.標準分數
.各種機率分配的關係
.敘述統計學中的樣本和母體
.Excel的E是錯誤(Error)的E?
.Excel的函數
.為什麼不驗證要主張的假設呢?
.p值至上主義再見
.極少見的不相關和切斷效果
.一開始就是Welch檢定?
.正確的繪圖法
.平方和的種類
.一開始就當成只有二組OK嗎?(以及最佳多重比較法的選擇方法)
.何種量化資料可用無母數分析方法?
.就算有離群值也想用有母數分析!
.另一種估計方法(最大概似法)
.輸出結果的判讀方法(彙整)
.表面上的關係
.羅吉特迴歸分析
.各式統計分析軟體
.應該用哪種分析方法?
.乳癌檢查爭論
【偉人傳】
.偉人傳① 卡爾.皮爾生
.偉人傳② 法蘭西斯.高爾頓
.偉人傳③ 凱特勒
.偉人傳④ 南丁格爾
.偉人傳⑤ 尼曼與皮爾生
.偉人傳⑥ 羅納.愛默.費雪
.偉人傳⑦ 法蘭克.魏克生
.偉人傳⑧ 托馬斯.貝葉斯
.序章何謂統計學?
.何謂統計學?
.統計學可以做的事
第1章 敘述統計學
.1.1 各種平均數
.1.2 資料的離散① 分位數與變異數
.1.3 資料的離散② 變異係數
.1.4 變數相關性① 相關係數
.1.5 變數相關性② 等級相關
第2章 機率分配
.2.1 機率與機率分配
.2.2 機率均等的分配均勻分配
.2.3 擲硬幣的分配二項分配
.2.4 吊鐘型分配常態分配
.2.5 無尺度的分配標準常態分配
.2.6 知道資料的位置σ區間
.2.7 分配的形態偏態與峰度
.2.8 很少見的分配 波瓦生分配
.2.9 同時處理複數資料χ2分配
...