章節試閱
2-1 幾種常用的多變量分析方法
有關單變量:t 檢定、ANOVA 的範例解說,請見作者《STaTa 與高等統計分析》一書,該書內容包括描述性統計、樣本數的評估、變異數分析、相關分析、迴歸建模及診斷、重複測量⋯⋯。
一、常用統計技術
在各種計量方法中,只針對單一變數進行分析的方法稱為「單變量分析」(univariate analysis) ,比如用直方圖去分析某班學生數學的期末考成績的分布);同時分析兩個變數的方法稱為「雙變量分析」(bivariate analysis) ,這類的分析方法很多,比如用相關性分析(correlation) 去探討中學生的身高與體重的關係。用
簡單迴歸(simple regression) 或t 檢定去比較小學生的體重有沒有因為性別( 男、女兩組) 不同而異。用變異數分析analysis of variance (ANOVA) 去分析不同屬性組織( 營利、非營利與公立共3 組) 的組織績效是否有所不同⋯⋯。
多變量分析 (multivariate analysis) 是泛指同時分析兩個以上變數的計量分析方法。在實際的情況中,我們所關心的某種現象通常不只跟另一個變數有關係,比如會影響醫院績效的變數不只是醫院的屬性而已,可能還與醫院本身的經營策略、醫院所在地區、健保給付方式等有密切關係,因此多變量分析應該對實際的
研究工作較有幫助。不過多變量分析的數統推論與運算過程比較複雜,如果要靠人去進行相當費時費工,但在電腦時代這些繁複運算已不成問題,因此多變量分析漸漸被廣泛運用。
線性判別分析旨在運用於計算一組預測變數( 自變數) ,包括知識、價值、態度、環保行為的線性組合,對依變數( 間斷變數) 接受有機農產品更高售價之意願加以分類,並檢定其再分組的正確率。
2-1 幾種常用的多變量分析方法
有關單變量:t 檢定、ANOVA 的範例解說,請見作者《STaTa 與高等統計分析》一書,該書內容包括描述性統計、樣本數的評估、變異數分析、相關分析、迴歸建模及診斷、重複測量⋯⋯。
一、常用統計技術
在各種計量方法中,只針對單一變數進行分析的方法稱為「單變量分析」(univariate analysis) ,比如用直方圖去分析某班學生數學的期末考成績的分布);同時分析兩個變數的方法稱為「雙變量分析」(bivariate analysis) ,這類的分析方法很多,比如用相關性分析(correlation) 去探討中學生的身高與體重的關係。用...
作者序
混合模型(mixture model) 旨在密度估計、聚類資料(clustered data)、區別(discriminant) 分析,後來演變成「潛在類(unobserved classes) 迴歸預測」的工具。混合模型框架提供了一個方便且靈活的方法來模擬複雜的異質(heterogeneous) 資料庫( 如生物學研究中通常會出現的數據集),例如:細胞計數數據和微陣列數據分析、大型生物醫學數據集中減少維度、非對稱和非常態集群。
本書中多變量分析,包括平均數之假設檢定(hypothesis testing of means)、多變量變異數分析(multivariate analysis of variance, MANOVA)、多元迴歸分析(multiple regression analysis)、典型相關分析(canonical correlation analysis)、線性判別分析(discriminant analysis)、主成分分析(principal component analysis)、因素
分析(factor analysis)、集群分析(cluster analysis)、多元尺度法(multidimensionalscaling, MDS)。此外,結構方程模式 (structural equation modeling, SEM) 及階層線性模式(hierarchical linear model, HLM) 作者另有專書介紹。
多變量分析主要應用在生物學(biology)、經濟學(economics)、工程學(engineering)、遺傳學(genetics)、市場行銷(marketing)、醫學(medicine)、精神病學(psychiatry)、教育學、心理學、社會科學、人管、生產管理、經濟系、風險管理系、航運管理、財務金融、會計、公共衛生、工業工程和土木⋯⋯。
本書第0 章先介紹SAS、R 和SPSS 檔案,如何轉成STaTa 檔案使用格式,
坊間常見的41 種軟體及大型資料庫之檔案格式,都可轉至STaTa 來分析。STaTa也是大數據分析很好的工具。有鑒於STaTa 分析功能龐大,可說是地表最強統計軟體,故作者撰寫一系列STaTa 相關書籍,包括:
一、《STaTa 與高等統計分析》一書,該書內容包括描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量⋯⋯。
二、《STaTa 在結構方程模型及試題反應理論的應用》一書,該書內容包括路徑分析、結構方程模型、測量工具的信效度分析、因素分析⋯⋯。
三、《生物醫學統計:使用STaTa 分析》一書,該書內容包括類別資料分析( 無母數統計)、logistic 迴歸、存活分析、流行病(odds ratio) 的計算、篩檢工具與ROC 曲線、工具變數(2SLS)⋯⋯Cox 比例危險模型、Kaplan-Meier 存活模型、脆弱性之Cox 模型、參數存活分析(六種模型)、加速失敗時間模型、panel-data 存活模型、多層次存活模型⋯⋯。
四、《Meta 分析實作:使用Excel 與CMA 程式》一書,該書內容包括統合分析(meta-analysis)、勝算比(odds ratio)、風險比、四種有名效果量(ES) 公式之單位變換等。
五、《Panel-data 迴歸模型:STaTa 在廣義時間序列的應用》一書,該書內容包括多層次模型、GEE、工具變數(2SLS)、動態模型⋯⋯。
六、《STaTa 在財務金融與經濟分析的應用》一書,該書內容包括誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合⋯⋯。
七、《多層次模型(HLM) 及重複測量:使用STaTa》一書,該書內容包括線性多層次模型、vs. 離散型多層次模型、計數型多層次模型、存活分析之多層次模型、非線性多層次模型⋯⋯。
八、《模糊多準則評估法及統計》一書,該書內容包括AHP、ANP、TOPSIS、Fuzzy 理論、Fuzzy AHP⋯⋯理論與實作。
九、《邏輯斯迴歸及離散選擇模型:應用STaTa 統計》一書,該書內容包括邏輯斯迴歸、多元邏輯斯迴歸、配對資料的條件logistic 迴歸分析、multinomial
logistic regression、特定方案rank-ordered logistic 迴歸、零膨脹ordered probit regression迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logit model、離散選擇模型、多層次邏輯斯迴歸⋯⋯。
十、《有限混合模型(FMM):STaTa 分析(以EM algorithm 做潛在分類再迴歸分析)》一書,該書內容包括FMM:線性迴歸、FMM:次序迴歸、FMM:Logit 迴歸、FMM:多項Logit 迴歸、FMM:零膨脹迴歸、FMM:參數型存活迴歸⋯⋯理論與實作。
十一、《多變量統計之線性代數基礎:應用STaTa 分析》一書,該書內容包括平均數之假設檢定、多變量變異數分析(MANOVA)、多元迴歸分析、典型相關分析、線性判別分析(discriminant analysis)、主成分分析、因素分析(factor analysis)、集群分析(cluster analysis)、多元尺度法(multidimensional scaling, MDS)⋯⋯。
此外,研究者如何選擇正確的統計方法,如適當的估計與檢定方法、與統計概念等,都是實證研究中很重要的內涵,也是本書撰寫的目的。為了讓研究者能正確且精準使用STaTa 統計分析,本書內文儘量結合「理論、方法、統計」,期望能夠對產學界有拋磚引玉的效果。
最後,特別感謝全傑科技公司(http://www.softhome.com.tw) 提供STaTa 軟體,晚學才有機會撰寫STaTa 一系列書籍,以嘉惠學習者。
張紹勳 敬上
混合模型(mixture model) 旨在密度估計、聚類資料(clustered data)、區別(discriminant) 分析,後來演變成「潛在類(unobserved classes) 迴歸預測」的工具。混合模型框架提供了一個方便且靈活的方法來模擬複雜的異質(heterogeneous) 資料庫( 如生物學研究中通常會出現的數據集),例如:細胞計數數據和微陣列數據分析、大型生物醫學數據集中減少維度、非對稱和非常態集群。
本書中多變量分析,包括平均數之假設檢定(hypothesis testing of means)、多變量變異數分析(multivariate analysis of variance, MANOVA)、多元迴歸分析(multiple r...
目錄
自 序
Chapter00 STaTa 是地表最強的統計軟體
0-1 STaTa 是地表最強大的統計軟體
0-1-1 多變量統計(multivariate analysis) 之指令
0-1-2 單層次:連續vs. 類別依變數迴歸之種類
0-1-3 多層次模型(HLM) 及重複測量之STaTa 指令
0-1-4 STaTa panel-data 迴歸的種類
0-1-5 STaTa 流行病(epidemiologists) 之選擇表對應的指令
0-1-6 STaTa 存活分析的選擇表之對應指令
0-1-7 STaTa 縱貫面—時間序列之選擇表
0-1-8 邏輯斯迴歸及離散選擇模型之STaTa 選擇表
0-1-9 有限混合模型(finite mixtures models, FMM):EM algorithm
Chapter01 多變量:統計概念的基礎
1-1 認識數學符號
1-1-1 數學符號
1-1-2 希臘字符號
1-2 統計技術之分類
1-2-1 統計分析技術之分類
1-2-2 單變量vs. 多變量統計
1-3 單變量:統計學回顧
1-3-1 統計分析法
1-3-2 統計公式之重點整理
1-3-3 檢定與信賴區間之關係
1-4 多變量常態分布、樣本平均數、變異數和共變異數:統計基礎
1-4-1 多變量假定:常態分布之統計基礎
1-4-2 數據矩陣的列(row) 與行(column):多變量統計基礎
1-4-3 共變異數矩陣的性質:多變量統計基礎
1-4-4 樣本平均數、變異數和共變異數:統計基礎
1-5 單層次:各類型ANOVA 練習題
1-5-1 單層次:各類型ANOVA 練習題(anova 指令)
1-5-2 單層次:各類型MANOVA 練習題(manova 指令)
1-5-3 重複測量MANOVA 之練習題(manova, manovatest,ytransform() 指令)
1-6 評比敵對模型,適配指標有7 種
Chapter02 統計基礎:一個和二個母群體平均數之Hotelling’s T2 檢定
2-1 幾種常用的多變量分析方法
2-2 單變量:Student’s 分布及t-test 統計基礎
2-2-1 單變量:Student’s 分布
2-2-2 單變量:Student’s t 檢定(t-test)
2-3 單一獨立樣本平均數之Hotelling’s T2 檢定
2-3-1 多變量:Hotelling’s T2 檢定之概念
2-3-2 多變量:Hotelling’s T2 檢定範例
2-4 兩個獨立樣本平均數之Hotelling’s T2 檢定
2-5 配對組法及前測後測設計之T 檢定
2-5-1多變量配對組T 檢定(multivariate paired Hotelling's T-square)
2-5-2多變量配對組T 檢定(hotelling 指令)
2-6 單一組重複量數統計分析
2-6-1單一組重複測量(hotelling 指令) ≒混合設計二因子ANOVA(anova 指令)
2-6-2單變量:重複量數分析(anova 指令)
2-7 單變量:混合設計二因子
2-7-1單變量:混合設計Two way ANOVA( 交互作用)(anova 指令)
Chapter03 多變量變異數分析:獨立樣本(manova 指令)
3-1 t-檢定、ANOVA、判別分析、迴歸的關係 (ttest、oneway、reg、manova、discrim 指令)
3-2 多變量:One way 變異數分析(manova 指令)
3-2-1 One way 多變量變異數分析之概念
3-2-2 One way 多變量變異數分析(manova、oneway, scheffe、matlist() 指令)
3-2-3a 如何處理MANOVA ≠ ANOVA 顯著性結果不一致呢?1實驗組vs. 2 對照組(manova、tabstat, by()、manovatest, test()、margins、anova 指令)
3-2-3b MANOVA 顯著後之5 類追蹤分析(rwolf 外掛指令)
3-2-4 練習題:One way 多變量變異數分析:6 棵樹砧木之4成長數據(manova、lincom、test、mat list() 指令)
3-3 多變量:二因子變異數分析( 無交互作用)(manova、manovatest,test()指令)
3-3-1a 混合設計Two way 變異數分析≒實驗組—控制組「前測—後測」設計
3-3-1b Two way 多變量變異數分析(manova 指令、lincom事後比較)
3-3-2 練習題:二因子MANOVA( 交互作用)( 先manova;後margins、contrasts、predict 指令)
3-3-3 二因子混合設計ANOVA:廣義估計方程式(GEE) 分析
Panel-data:雌激素貼片治療產後憂鬱症的療效(xtgee 指令)
3-4 多變量:細格人數不等的二因子變異數分析(manova 指令、lincom事後比較)
3-5 三因子MANOVA( 交互作用)(manova、margins,predict(equation(y1))、contrast A@B#_eqns, mcompare(scheffe)指令)
3-5-1 Three-way MANOVA( 交互作用)(manova、margins,predict(equation(y1))、contrast A@B#_eqns, mcompare(scheffe) 指令)
3-5-2 練習題:Three-way MANOVA( 交互作用):塗層織品的磨損數據(manova 指令)
3-6 Nested( 階層/ 巢狀) 設計MANOVA(manova、manovatest、margins,within() expression() 指令)
3-7 階層(hierarchical) 設計MANOVA(manova 指令)
3-8 Latin 方格的多變量變異數分析:交互作用項給予平衡(manova 指令)
3-8-1拉丁方陣實驗設計之概念
3-8-2a單變數:拉丁方格實驗設計ANOVA(anova 指令)
3-8-2b單變數:拉丁方格實驗設計ANOVA[anova、contrast,mcompare(scheffe) 指令]
3-8-3多變數:拉丁方格設計MANOVA:去除交互作用項(manova 指令)
3-9 多變量:混合/split-plot 設計的變異數分析:二學程5班3種技能(manova 指令)
3-10 重複測量之隨機區組設計(randomized block) 設計:4 高粱品種種在5 塊地(manova、manovatest 指令)
Chapter 04 單層vs. 雙層次ANOVA 模型:重覆測量(repeated measures)
4-1 單層vs. 雙層:重複測量的混合效果模型(mixed effect model for repeated measure)
4-1-1 ANOVA 及無母數統計之分析流程圖
4-1-2 重複測量ANOVA 之F 檢定公式
4-1-3a 單層次:重複測量MANOVA( 無a 因子)(manova、manovatest、ytransform 指令)
4-1-3b 單層次:重複測量MANOVA(a 因子)(manova、
manovatest、ytransform 指令)
4-1-4 單層次:混合設計二因子ANOVA ≒單因子重複測量MANOVA(anova、contrast、margin、marginsplot 指令)
4-1-5 重複測量ANOVA 之主要效果 / 單純主要效果檢定(雙層xtmixed 或mixed vs. 單層anova 指令)
4-1-6 雙層次:二因子混合設計ANOVA (mixed 或xtmixed 指令)
Chapter 05 多變量共變數分析(multivariate analysis of covariance, mancova 指令)
5-1 單因子MANCOVA
5-1-1 單因子MANCOVA 之原理
5-1-2 單因子MANCOVA 之重點整理
5-2 單因子MANCOVA:3 個檢定(manova、manovatest 指令)
5-2-1 獨立樣本單因子多變量共變數分析(2 個共變量)(manova、manovatest、contrast、mat list() 指令)
5-2-2 單因子MANCOVA:3 個檢定(manova、manovatest、contrast 指令)
5-3 二因子多變量共變數分析(manova、manovatest 指令)
5-3-1 獨立樣本二因子多變量共變數分析( 無交互作用)(manova、manovatest 指令)
5-3-2 二因子MANCOVA 分析( 交互作用之單純主要效果比較)(manova、manovatest、margins、contrast 指令)
5-4 階層(hierarchical/ 巢狀nested) 設計二因子MANCOVA (manova、manovatest 指令)
Chapter06 典型相關分析(canonical correlation,canon 指令)
6-1 典型相關(canonical correlation) 之概念
6-2 單變量:相關係數之統計基礎
6-3 典型相關分析:範例(canonical correlation)(canon、canon, test()、estat correlations 指令)
6-3-1 典型相關分析(canonical correlation):5 項高中測驗對
項大學入學成績(canon、canon, test()、estat correlations)指令
6-3-2 典型相關分析(canonical correlation):3 項心理變數對4 項
學業成績(canon、canon, test()、estat correlations 指令)
Chapter07 判別分析/ 線性判別分析(discriminant analysis)
7-1 線性判別分析/ 判別分析(discriminant analysis) 之概念
7-1-1 貝葉斯(Bayes) 定理及分類(classification)
7-1-2 線性與二次分類方法
7-1-3 費雪(Fisher) 的判別分析與線性判別分析
7-2 線性判別分析:範例(discriminant analysis)(candisc, group()、scoreplot、loadingplot 指令)
7-2-1 線性判別分析:3 組高中生對3 種成就測驗(candisc,group()、scoreplot、loadingplot) 指令
7-2-2 判別/ 線性判別分析(discriminant analysis):3 個職位分類是否適合不同人格類型(candisc) 指令
7-2-3 練習題:典型線性判別分析:6 棵樹砧木之4 成長數據
(candisc 指令)
7-3 練習題:無母數線性判別分析:第k 近鄰(kth-nearest-neighbor) 區別分析(discrim knn 指令)
7-4 練習題:線性(linear) 線性判別分析(discrim lda 指令)
7-5 練習題:logistic 線性判別分析(discrim logistic 指令)
7-6 練習題:二次(quadratic) 線性判別分析(discrim qda 指令)
Chapter08 集群(cluster) 分析/ 聚類分析
8-1 集群分析/ 聚類分析(cluster analysis) 之概念
8-2 階層聚類分析/ 集群分析(hierarchical cluster):範例(cluster, cluster dendrogram, cluster generate, cluster kmeans and kmedians 指令)
8-2-1 階層集群分析(hierarchical cluster analysis):17 學區的
4 項學生成績(cluster linkage、xi: mvreg) 指令有7 種方法
8-2-2 練習題:集群分析(hierarchical cluster analysis):mammal 資料(cluster linkage) 指令有7 種方法
8-2-3 練習題:集群分析(hierarchical cluster analysis):mammal 資料(cluster linkage) 指令有7 種方法
8-3 大樣本之K-means 集群分析(K-means and K-medians cluster analysis):50 棵植物4 個化學實驗數據(cluster kmeans、cluster kmedians 指令)
8-4 計算similarity、dissimilarity:50 棵植物4 個化學實驗數據(matrix dissimilarity、mat list 指令)
8-5 二元變數(binary variables) 之集群分析(cluster kmeans 指令)
8-5-1 二元變數(binary variables) 關聯性(association) 之概念
8-5-2 二元變數之集群分析(cluster analysis for binary variables):35 題是非題(cluster kmeans、cluster kmedians 指令)
Chapter09 主成分分析(principal componentsanalysis, pca 指令)
9-1 主成分分析(principal components analysis) 之重點整理(pca 指令)
9-1-1 主成分分析(principal components analysis) 之概念
9-1-2 主成分分析(principal components analysis) 之統計基礎
9-1-3 主成分分析:標準化居住品質9 指標(pca 指令)
Chapter10 測量工具檢定:信度(reliability) 與建構效度(construct validity)
10-1 測量工具檢定:信度(reliability) 與效度(validity)
10-1-1 信度與效度之重點整理
10-1-2 因素分析(factor analysis, FA),又譯因子分析
10-2 因素分析(factor analysis, PCA) 之重點整理
10-2-1 因素分析(factor analysis, PCA) 之概念
10-2-2 因素分析:居住社區9 個評量指標(factor 指令)
10-2-2a 最大概似估計(maximum likelihood estimation)
10-2-2b 因素分析:適配度(goodness-of-fit) Chi-Squared 檢定
10-2-2c 因素轉軸(factor rotations)
10-2-2d 因素分數的估計(estimation of factor scores)
10-3 探索性因素分析≒建構效度(explore factor analysis, EFA)(factor、estat kmo、rotate、estat structure、screeplot、predict 指令)
10-3-1 建構效度(construct validity)
10-3-2 因素分析4 種估計法的取捨:醫生對成本的6 態度(factor 指令)
10-3-3 Likert 量表建構: 建構效度來篩選問卷題目(factor、estat kmo、rotate、predict、alpha 指令)
10-3-4 練習題:讀入相關矩陣之因素分析:知覺3 變數(matrix、factormat 指令)
Chapter11 多維標度法/ 多向度量尺(multidimensional scaling)
11-1 古典(classical) 多維標度法/ 多向度量尺(multidimensionalscaling, MDS) 之重點整理(mds 指令)
11-1-1 多維標度法/ 多向度量尺(Multidimensional Scaling,MDS) 之概念
11-1-2 古典(classical) 多維標度法/ 多向度量尺(multidimensional scaling, MDS) 之統計基礎
11-2 多維標度法/ 多向度量尺(multidimensional scaling, MDS)之範例
11-2-1 古典:多維標度法/ 多向度量尺:美國10 城市社會經濟特徵(infile、mds、screeplot、mdsconfig、mdsshepard 指令)
11-2-2a 非度量性(nonmetric):多維標度法/ 多向度量尺:2004 年美國總統候選人(matrix dissimilarity、mdsmat、mdsconfig、mdsshepard 指令)
11-2-2b 多維標度法後續之迴歸分析:2004 年美國總統候選人(infile、regress、graph twoway 指令
11-2-3 練習題:古典多維標度法:美國10 城市社會經濟特徵(matrix define、mdsmat、mdsconfig、mdsshepard 指令)
Chapter12 對應分析(correspondence analysis)
12-1 對應分析(correspondence analysis) 之概念
12-2 簡單的對應分析(discriminant correspondence analysis)(ca、camat 指令)
12-2-1 對應分析:「性別與學歷」對科學信仰之對應(ca 指令)
12-2-2 對應分析(correspondence analysis):輸入矩陣—5 個
國家與11 個資源之對應(camat 指令)
12-3 多重且聯合對應分析(Multiple and joint correspondence analysis):科學四態度之對應圖(mca 指令)
參考文獻
自 序
Chapter00 STaTa 是地表最強的統計軟體
0-1 STaTa 是地表最強大的統計軟體
0-1-1 多變量統計(multivariate analysis) 之指令
0-1-2 單層次:連續vs. 類別依變數迴歸之種類
0-1-3 多層次模型(HLM) 及重複測量之STaTa 指令
0-1-4 STaTa panel-data 迴歸的種類
0-1-5 STaTa 流行病(epidemiologists) 之選擇表對應的指令
0-1-6 STaTa 存活分析的選擇表之對應指令
0-1-7 STaTa 縱貫面—時間序列之選擇表
0-1-8 邏輯斯迴歸及離散選擇模型之STaTa 選擇表
0-1-9 有限混合模型(finite mixtures models, FMM):E...