~大數據時代,用統計學為你的履歷加分~
推薦給所有勇於跨領域、學習新知的專業職場人!
【本書特色】
◎專書彙整113個廣泛應用於各領域的統計學公式和定理,讓需要統計學的人學習更有效率。
◎每一節以五顆星標示「難易度」、「實用性」與「考試機率」,重點觀念一目瞭然。
◎獨立專欄列舉實例,讓初學者快速掌握統計學在日常生活的實際應用。
生活在互聯網的時代,統計學的知識在所有的領域都不可或缺。
尤其是商業領域,統計學在「市場行銷」、「企業決策」、「人工智慧」、「關鍵字檢索」等各個領域都受到廣泛的運用。
但是統計學的知識,有其嚴謹的定義和使用框架。
儘管我們在學生時代學過基本的統計方法,比如平均數、中位數、標準差、機率,但是實際面對市場調查或財務報表時,往往也不知道該如何運用這些數據幫助我們分析現況、對未來下決策。
實際上,即使是經常在實務中應用統計方法的人,往往在接手全新的專案時,便沒辦法比照舊有方法,導致所學知識派不上用場。即使想認真學習,也常因為統計學是一門專業科目,若非花費大筆報名費用參加課程,便是得尋覓坊間參考書自行鑽研,而在學習上浪費大量的時間。
本書正是為所有想學習統計學的人,提供最有效率的學習途徑。
書中彙整重要的公式、定理、統計方法和理論,以跨頁形式歸納基本內容,並透過生活實例示範該統計方法的應用範疇。
本書架構根據應用類型,分為以下11個大類別:
●敘述統計▸▸你認為國民的所得平均值是多少?這個數值能代表你的所得嗎?
●相關關係▸▸取一個數值,表現工作時數與睡眠時數的相關性
●機率▸▸能從過去的中獎結果,預測下次的中獎號碼?
●機率分布▸▸五次推銷,能夠成功簽約的機率是多少?
●估計▸▸節目收視率差1%,這樣的差距算大嗎?
●檢定▸▸想證明新藥是否有療效,證據就是檢定
●無母數檢定▸▸東京某醫科大學的錄取率,是否存在性別差異?
●迴歸分析▸▸一個公式,就能預測高級葡萄酒的價格
●變異數分析與多重比較法▸▸輕鬆排定工讀生的排班表
●多變量分析▸▸透過結構分析調整組織,使人才能夠適得其所
●貝氏統計▸▸信箱過濾器簡單區分垃圾郵件的方法
從國高中學習的「資料整理」與「機率和統計」,
到大學或專業科目深究的「估計」、「檢定」、「迴歸分析」與「多變量分析」,
乃至於大數據時代不可或缺的「貝氏統計」。
本書涵蓋目前統計學所有的應用領域,並以大百科的檢索條目般一一羅列,有助於初學者掌握整體的面貌。
據說特斯拉的創始人伊隆・馬斯克,在9歲時就讀完整部大英百科全書。
本書作為統計學的百科全書,儘管不能保證各位在創業時,業績能像火箭一飛沖天,但絕對能讓你成為具備統計觀的一流商務人士。
在資訊愈來愈多樣、數量不斷增加且產生速度飛快的未來,唯有運用統計學,才能幫助我們的命運進行貝氏更新。
作者簡介:
石井俊全
1965年生於東京。東京大學建築系畢業,取得東京工業大學數學系碩士學位。現為「大人的數學教室 和」講師。
主要著作有《算数だけで統計学!》、《まずはこの一冊から 意味がわかる統計学》、《まずはこの一冊から 意味がわかる多変量解析》、《1冊でマスター 大学の統計学》、《1冊でマスター 大学の微分積分》、《1冊でマスター 大学の線形代数》、《線性代數不過如此!》等多部書籍。
目錄
◎序言
◎本書的特點和使用方法
▍Chapter 1 敘述統計
▸統計學的歷史
▸資料整理不可或缺的敘述統計
01資料尺度
・度量水平分為四種
・史蒂文斯冪次定律
02次數分配表和直方圖
・首先將資料整理成次數分配表
・根據次數分配表製作直方圖
・用直方圖找出虛報資料
03柏拉圖
・根據相對次數、累積相對次數分配表製作柏拉圖
・用柏拉圖分析生產不合格產品的原因
04上下標和sigma符號
・可以製作大量文字
・使用Σ符號,就能簡短地表示總和
05平均、變異數、標準差
・平均值和變異數的意義
・用變異係數比較兩組資料的分散程度
06次數分配表與平均值、變異數
・利用組值計算平均值和變異數
・真實值和利用次數分配表計算的值有誤差
07代表值
・平均實際上有各種類型
・中位數有兩種模式
・直方圖讓眾數一目瞭然
・對於所得平均值沒有實際感受的理由
08變數的標準化
・製作標準化的變數(standardized variable)
・偏差值使用標準化
09偏度、峰度
・偏度(skewness)是表示直方圖偏態的指標
・峰度(kurtosis)是表示直方圖高度的指標
・似乎比常態分布更能發現異常
10四分位數、盒鬚圖
・試著計算四分位數
・根據直方圖可以畫出盒鬚圖(box-and-whisker plot)
11交叉表
・熟悉行列、表側、表頭、周邊次數、總次數等用語
・用三重交叉表營造良好的職場氛圍
12圓餅圖、橫條圖、折線圖
・試著解讀圖表
・南丁格爾用獨創的圖表控訴糟糕的衛生環境
13散佈圖
・首先試著標記在散佈圖上
・利用散佈圖制定全球戰略
・用散佈圖矩陣預測女性的升遷
・有錢人活得久
14羅倫茲曲線
・利用零用錢的資料繪製羅倫茲曲線
・用吉尼係數預測國家的穩定性
15 Q-Q圖
・用常態Q-Q圖將偏離常態分布的偏差可視化
・利用常態Q-Q圖,確認是否可以視為常態分布
column 從莖葉圖解讀資料的代表值
▍Chapter 2 相關關係
▸什麼是相關?
▸相關關係必須注意的事項
01皮爾森相關係數
・用相關係數判斷量的資料的相關性
・相關係數與散佈圖
・別忘了回到散佈圖
02斯皮爾曼等級相關係數
・斯皮爾曼等級相關係數的解釋
・試求斯皮爾曼等級相關係數
・找出工作時間與睡眠時間的關係
03肯德爾等級相關係數
・肯德爾等級相關係數的解釋
・有相同等級時調整分母
・利用肯德爾等級相關係數找出工作時間和睡眠時間的相關性
04克雷莫V係數
・V值為1時相關性高,為0時相關性低
・年輕人和中年人對於音樂的愛好不同嗎?
05相關係數的估計和檢定
・估計的公式十分複雜⋯⋯
・透過無相關檢定確認是否存在相關關係
・調查各公司銷售額相關關係的信賴水準
06自我相關係數
・自我相關係數的計算機制和解釋
・時間序列模型{Yt}的自我共變異數
・用相關圖找出銷售額的週期性
column 有許多可疑的相關
▍Chapter 3 機率
▸源自賭博的機率歷史
▸古典機率論的完成
▸統計學和機率論的發展,奠定數理統計學的基礎
01事件與機率
・機率的基本知識和事件的意義
・以骰子為例,試著思考機率和事件
・撲克牌型的機率
02取捨原理
・取捨原理的證明
・計算順利交換禮物時的機率
03離散型隨機變數
・離散型隨機變數的例子:擲硬幣出現正面的次數
・試著把彩券製成機率分布的表格
04連續型隨機變數
・連續型隨機變數的例子:時鐘指針停止的位置
・量子力學的領域存在著肉眼可見的機率密度函數
05累積分布函數
・計算累積分布函數的方法
・試著用累積分布函數來表示30年內發生地震的機率
06期望值、變異數
・計算彩券的期望值
・計算飛鏢得分的期望值
・想靠賭博發財,就要認識賠率
・金融商品的價格是根據期望值決定
・利用平均值和變異數模型成為億萬富翁
07獨立事件和獨立隨機變數
・區分獨立事件和非獨立事件
・隨機挑選卡片時,十位數和個位數是獨立的嗎?
・預測樂透號碼購買,只是在浪費錢
08隨機變數的和與積
・組合隨機變數,計算獎金的期望值
09二維隨機變數(離散型)
・即使是無相關也未必獨立
・A先生是會被金錢誘惑的勢利眼嗎?
10二維隨機變數(連續型)
・解釋邊際機率密度函數
・計算飛鏢遊戲的獎金期望值
11期望值和變異數的公式
・隨機變數之和的期望值,等於各隨機變數期望值之和
・買幾盒牛奶糖才能完成收集
12大數法則、中央極限定理
・保證機率的大數法則
・大樣本在中央極限定理中被視為常態分布
・損害保險公司不會倒閉的原因要歸功於大數法則
13柴比雪夫不等式
・柴比雪夫不等式的意義
・大數法則的證明
column 計算班級裡有兩人同一天生日的機率
▍Chapter 4 機率分布
▸機率分布有很多種類的原因
▸特別重要的四個機率分布
01伯努利分布、二項分布
・n愈大,愈近似常態分布
・利用二項分布計算五次推銷中成功簽約X件的機率
02幾何分布、負二項分布
・s+1次以後的成功機率與歷史無關
・稱為負二項分布的原因
・「抽中中獎籤為止的次數」的真正意義
03卜瓦松分布
・與罕見現象次數相關的機率分布
・卜瓦松極限定理
・日常生活中隨處可見卜瓦松分布
04超幾何分布
・理解超幾何分布的公式
・n愈大,愈近似二項分布和卜瓦松分布
・N愈小,有限母體校正愈有效
・估計某種生物棲息數量的方法
05均勻分布、指數分布
・指數分布是無記憶性的連續型機率分布
・利用指數分布計算20年內發生地震的機率
06常態分布
・有不少服從常態分布的例子
・利用高爾頓板實際感受一下常態分布
07 χ²分布、t分布、F分布(概述)
・從樣本瞭解母體時所需的分布
・針對蘋果的重量進行推論統計
08 χ²分布、t分布、F分布(詳述)
・觀察定義式,想像它代表什麼樣的統計量
・t分布的特徵司徒頓化
・F(m, n)和F(n, m)的關係很有用
09韋伯分布、柏拉圖分布、對數常態分布
・什麼是生存函數和風險函數?
・適用於所得、股價和人壽保險的價格
10多項分布
・計算邊際機率質量函數和共變異數
・行駛在國道246號,遇到4次紅燈、5次綠燈、6次黃燈的機率
11多維常態分布
・寫出二維的情況
・計算平均值、變異數、共變異數⋯⋯
・接待高爾夫利用二維常態分布來克服
column 用軟體計算機率分布的值
▍Chapter 5 估計
▸推論統計是指根據資料進行預測和判斷
▸大樣本理論與小樣本理論
▸不偏變異數和樣本變異數
01抽出放回和抽出不放回
・只要母體夠大,即使是抽出不放回,也可以視為獨立
・計算樣本平均數的期望值和變異數
・想成為職業賭徒,就要以抽出不放回的方式來一決高下
02抽樣方法
・隨機進行抽樣
・利用分層抽樣抑制變異數
・從前用骰子,現在靠軟體?將隨機發揮到極致吧
03最大概似法
・選擇概似度最大的θ(模型)
・利用最大概似法估計上門推銷的成交機率
04區間估計的結構
・考慮抽樣造成偏差的區間估計
・有△%的機率落入區間的說法謬誤
05常態母體的母體平均數區間估計
・區間估計的原理
・試著估計蘋果重量平均值的區間
06母體比例的區間估計
・最好也理解母體比例估計的結構
・收視率調查中的1%差距算大嗎?
07估計量的評價基準
・不偏性(期望值成為估計的母數)
・有效性(不偏估計量中變異數愈小愈好)
・一致性(取極限作為母數)
・充分性(機率視估計量決定,而不是由母數決定)
08不偏估計量
・確認母體平均數、母體變異數的不偏估計量
・勝算(Odds)沒有不偏估計量
・高斯-馬可夫定理所呈現的最佳線性不偏估計量
column 容易混淆的標準差和標準誤差的差別
▍Chapter 6 檢定
▸檢定的學習方法
▸內曼和皮爾森建立的假設檢定
01檢定的原理和步驟
・檢定歲末的抽獎是否有詐
・注意接受(採納)虛無假設時的解釋
02檢定統計量
・記憶中的全國平均值是正確的嗎?
・什麼是雙尾檢定、單尾檢定?
03檢定的錯誤
・計算型一和型二錯誤的機率
04常態母體的母體平均數檢定
・檢定母體平均數時的檢定統計量計算方法
・檢定左右來回跳躍的全國平均值
05常態母體的母體變異數檢定
・檢定母體變異數時的檢定統計量計算方法
・檢定全國握力統計的變異數
06母體平均數差的檢定(1)
・檢定母體平均數差時的檢定統計量計算方法
・檢定「兩所大學的平均分數有差異」是否顯著
07母體平均數差的檢定(2)
・貝倫斯-費雪問題非常棘手
・針對「兩所大學的平均分數存在差異」進行Welch's t檢定
・利用單一樣本資料差的檢定求得減肥效果
08母體比例差的檢定
・母體比例差的檢定原理
・檢定A市和B市汽車持有率的差異
・母體比例差的檢定與獨立性的檢定相同
09變異數同質性檢定
・用F分布檢定變異數比的變異數同質性檢定
・針對男女的考試結果進行變異數同質性檢定
column 醫療現場所進行的檢定
▍Chapter 7 無母數檢定
▸什麼是無母數檢定?
▸無母數檢定的種類
01適合度檢定
・檢定是否為公正的骰子
02獨立性檢定(2×2的交叉資料表)
・檢定入學考試對性別是否公平
・觀測次數較小時就修正檢定統計量
03獨立性檢定(k×l的交叉資料表)
・檢定不同世代喜歡的歌曲類型是否存在差異
04費雪精確檢定
・在已知總計的情況下,計算交叉資料表的機率
・根據少數對戰結果檢定力士的實力差距
05 McNemar檢定
・McNemar檢定是從忽略相同結果的方向來思考
・檢定銷售演講是否打動聽眾的心
06 Cochran的Q檢定
・檢定藝人的人氣是否存在差異
07 Mann-Whitney的U檢定
・檢定團隊的銷售業績是否存在差異
・與Wilcoxon等級和檢定的關係
08符號檢定
・利用符號檢定來檢定清潔劑的滿意度是否存在差異
・與Wilcoxon符號等級檢定的區別
09 Wilcoxon符號等級檢定
・用a或b來檢定都可以
・脈搏數在平靜下來後再測量會下降嗎?
10 Kruskal-Wallis檢定
・若樣本大小在14以下,就用表格查出拒絕域
・檢定藝人的好感度是否存在差異
11 Friedman檢定
・單一樣本單因子變異數分析的無母數版
・旅行社針對旅行企劃檢定四季好感度
column 統計學容易混淆的用語集
▍Chapter 8 迴歸分析
▸什麼是迴歸分析?
▸迴歸分析是具有外在效標的多變量分析
01單變量迴歸分析
・最小平方法是計算迴歸線式子的原理
・預測缺考的第7位新人的多益成績
02複迴歸分析
・從單變量迴歸到複迴歸
・測量迴歸方程式的準確度
・利用複迴歸分析來預測出租公寓的租金
03複相關係數和偏相關係數
・用複相關係數測量迴歸方程式的準確度
・利用偏相關係數找出偽相關
・利用偏相關係數找出偽相關,重新考慮變更配置
04多重共線性
・三維資料若存在多重共線性會變成什麼情況
・找出多重共線性的方法和回避方法
05單變量迴歸分析的區間估計
・迴歸線的區間估計結構
06邏輯式迴歸分析、Probit迴歸分析
・針對年收入與擁有房屋的相關性進行迴歸分析
・邏輯式迴歸與對數勝算有關聯
07一般線性模型和一般化線性模型(GLM)
・複迴歸分析和變異數分析也是一般線性模型的一種
・擴張一般線性模型的一般化線性模型
column 對葡萄酒價格進行複迴歸分析
▍Chapter 9 變異數分析與多重比較法
▸能以變異數分析和多重比較法解決的問題
▸利用多重比較法思考虛無假設族
01變異數分析(概述)
・根據變異(平方和)建立變異數比
・哪個地方的汽車配件銷售較佳?
02單因子變異數分析
・利用變異數分析檢定肥料效果的差異
・整理成變異數分析表
・確認變異數分析的模型
03雙因子變異數分析(無重複試驗)
・利用雙因子變異數分析(無重複試驗)尋找最佳日照和肥料的條件
・利用變異數分析檢定三組的平均值是否一致
・也可以視為單一樣本的單因子變異數分析
04雙因子變異數分析(有重複試驗)
・可以調查肥料和日照有無交互作用
・填寫變異數分析表,檢定有無交互作用
05費雪三原則
・用費雪三原則進行農業實驗
・預防安慰劑效應的檢定法
06正交陣列表
・使用正交陣列表可以有效地進行實驗
・在不考慮交互作用的情況下,用正交陣列表制定實驗計劃
・利用正交陣列表考慮交互作用,制定實驗計劃
・利用正交陣列表輕鬆製作工讀生的排班表
07 Bonferroni法和Holm法
・重複k次時將每次的顯著水準都設為k分之1的Bonferroni法
・彌補Bonferroni缺點的Holm法、Shaffer法
08 Scheffé法
・可以客製化虛無假設的Scheffé法
・只要在變異數分析被拒絕時使用即可
09 Tukey-Kramer法
・一次檢定哪兩個工廠存在差異
column 現代推論統計學的始祖──費雪
▍Chapter 10 多變量分析
▸什麼是多變量分析?
▸主成分分析和因子分析的方法完全相反
01主成分分析(概述)
・尋找使陰影長度的平方和最大的平面
・把咖啡豆品牌化
02主成分分析(詳述)
・二維資料的主成分分析
・貢獻率可說是資料的活用度
03判別分析(概述)
・產生函數來判斷未知資料屬於哪一組
・下個破產的信用合作社在哪裡!
04判別分析(詳述)
・線性判別函數的計算方式
05馬哈拉諾比斯距離
・根據馬哈拉諾比斯距離來判別的機制
・二維資料的判定,也可以只比較兩組資料
06數量化Ⅰ類、Ⅱ類
・使用質的資料作為解釋變數的數量化理論
・用反應變數進行判別的數量化Ⅱ類
07數量化Ⅲ類、對應分析
・斜向排列1
・數量化後重新排列
・中階管理職因為工作壓力太大而抽煙
08因子分析
・因子分析的使用方法
・對國外品牌進行因子分析
・因素負荷量不止一種
09共變異數結構分析
・設計路徑圖
・透過共變異數結構分析使人才適得其所
10階層式集群分析
・繪製樹形結構關係圖
・相似的人歸類在一起分配工作
11多元尺度法(MDS)
・簡潔表示個體間非相似度的多元尺度法
・用多元尺度法找出新的品牌定位
column 製作定位圖的方法
▍Chapter 11 貝氏統計
▸與我們的思考方式相近的貝氏統計
▸直到貝氏統計得到學術上的認可
01條件機率
・用文氏圖來理解條件機率
・計算通勤方法的條件機率
02單純貝氏分類器
・即使是條件機率,若為獨立,也可以用乘積表示
・什麼是簡單區分垃圾郵件的方法?
03貝氏定理
・用文氏圖理解貝氏定理成立的理由
・做好疾病檢查呈陽性時的心理準備
04貝氏更新(離散版)
・隨意回答的機率也是主觀機率
・新進飯店員工能透過貝氏更新來追蹤錯誤嗎?
05蒙提霍爾問題
・蒙提霍爾問題的常見解法
・實際上這個解法也未必正確
06貝氏更新(連續版)
・根據離散型的條件機率公式求連續型
・通過貝氏更新重新認識自我而成長的新進業務員
07共軛事前分布
・透過共軛事前分布的貝氏更新來確定目標的資深業務員
・把機率模型的形式和共軛事前分布製成表格
08 KL散度
・與熵的相關性
・KL散度的課題
・用KL散度選擇預測模型
09 AIC(赤池訊息量準則)
・AIC有助於找到好的模型
・參數多不一定是好的模型
10蒙地卡羅積分
・用蒙地卡羅法計算面積
・蒙地卡羅積分成立的理由
・MCMC負責貝氏統計的計算
11 Gibbs抽樣法
・Gibbs抽樣法的形象
・資料為高維時,Gibbs抽樣法很有用
12 Metropolis-Hastings演算法
・為何可以簡單地製作f(x)的樣本?
・a的取法也有需要想辦法的時候
13貝氏網路
・在昏睡狀態下出現頭痛症狀時,為轉移性癌的機率是多少?
・成為機器學習和人工智慧的模型
column 機器翻譯的機制
Appendix
1 標準常態分布表(右尾機率)
2 t分布表(右尾2.5%、5%點)
3 χ²分布表(右尾97.5%點、5%點、2.5%點)
4 F分布表(右尾5%點)
5 F分布表(右尾2.5%點)
6 Mann-Whitney的U檢定表(單尾機率2.5%點)
7 Wilcoxon符號等級檢定表(單尾2.5%點、5%點)
8 Friedman檢定表(單尾5%點)
9 Kruskal-Wallis檢定表(單尾5%點)
10 司徒頓化的範圍分布表(右尾5%點)
◎後記
◎索引
◎序言
◎本書的特點和使用方法
▍Chapter 1 敘述統計
▸統計學的歷史
▸資料整理不可或缺的敘述統計
01資料尺度
・度量水平分為四種
・史蒂文斯冪次定律
02次數分配表和直方圖
・首先將資料整理成次數分配表
・根據次數分配表製作直方圖
・用直方圖找出虛報資料
03柏拉圖
・根據相對次數、累積相對次數分配表製作柏拉圖
・用柏拉圖分析生產不合格產品的原因
04上下標和sigma符號
・可以製作大量文字
・使用Σ符號,就能簡短地表示總和
05平均、變異數、標準差
...
購物須知
電子書閱讀方式
您所購買的電子書,系統將自動儲存於「我的電子書櫃」,您可透過PC(Windows / Mac)、行動裝置(手機、平板),輕鬆閱讀。
- Windows / Mac 電腦
- 請先安裝瀏覽器,並以Chrome開啟我的電子書櫃後,點選『線上閱讀』,即可閱讀您已購買的電子書。建議使用 Chrome、Microsoft Edge有較佳的線上瀏覽效果。
- 手機/平板
- 請先安裝 電子書APP後,依照提示登入「會員中心」→「電子書管理」→「電子書APP通行碼/載具管理」,取得APP通行碼再登入APP,下載您所購買的電子書。完成下載後,點選任一書籍即可開始離線閱讀。 APP 適用版本:iOS 14.2 或以上版本,Android 6.0 以上版本。
注意事項:
使用讀冊生活電子書服務即為同意讀冊生活電子書服務條款。
下單後電子書可開啟閱讀的時間請參考:不同的付款方式,何時可開啟及閱讀電子書?
因版權保護,您在TAAZE所購買的電子書/雜誌僅能以TAAZE專屬的閱讀軟體開啟閱讀,無法以其他閱讀器或直接下載檔案。
退換貨說明:電子書、電子雜誌商品,恕不提供10天猶豫期退貨,若您對電子書閱讀有疑慮,建議您可於購買前先行試讀。並於訂購本商品前請務必詳閱電子書商品退換貨原則。