本書特色:
●Stata功能強大,可以選單操作,也可自行輸入指令,能滿足初級者到高階者的需求。
●本書詳盡介紹生物醫學領域必學的分析技術,包含類別資料處理、存活分析、流行病學、病例控制、篩檢工具與ROC曲線等。
●實用範例資料檔,搭配視覺化操作說明,讓您迅速成為Stata統計高手。
●完整且札實的範例解析,幫助您觸類旁通,讓您的報告、論文大升級。
●由於電腦與統計的日新月異,使生醫統計也延伸至以下研究領域:生態、農業、商業、社會科學……
◎隨書附贈資料檔光碟,建議使用Stata 14版本執行。
----------
由於電腦硬體、軟體與統計方法的日新月異,使得統計學在生物醫學領域中,扮演舉足輕重的角色,本書內容主要為下列三大類:
一、類別資料處理。包括:二向列聯表、三向列聯表……等。
二、存活分析。包括:Kaplan-Meier、Cox迴歸、參數存活模型、危險比例檢定、時間共變數、韋伯分配、指數分配……等。存活分析的事件時間資料也常出現在其他不同領域中,如:企業存活時間(商業)、客戶忠誠度(行銷)、法人預警分析(金融)、再就業時間(經濟)、假釋到再犯時間(法學)和可靠度分析(工業)等等。
三、流行病學工具。包括:病例控制、Mantel-Haenszel、ROC分析……等。
Stata操作簡便,給予使用者足夠的自訂空間。不但可使用簡單的視窗指令,還能因應需求自行修改、添加或撰寫程式,擴充性極強。在運算速度上,也比SPSS及SAS更快。
本書是一本非常有用的Stata工具書,對初學或想領略高等統計的讀者,相信定有很大的收獲。
作者簡介:
張紹勳
學歷:國立政治大學資訊管理博士
現任:國立彰化師範大學專任教授
經歷:致理技術學院專任副教授
●研究助理
張任坊
國立海洋大學商船系
張博一
國立中央大學通訊工程研究所
章節試閱
二、世代研究(Cohort study)
世代研究又稱追蹤性研究、前瞻性研究或縱貫性研究,是一種探索病因的流行病學研究方法。其做法是在人群中抽取一個樣本,按是否暴露(expose) 於某種可疑病因( 危險因子) 或暴露程度分組,經過一段追蹤觀察,最後比較各組的發病率或死亡率,對因果關係作出估計。世代研究適用於發病率較高的疾病,也適用於環境污染對健康影響的評價。該方法的優點是在兩組對比中( 開始時的健康狀況一樣) 直接觀察致病因子與發病的關係,不存在回憶性偏差,且能計算發病率、死亡率和相對危險性。缺點是觀察時間長,可發生失訪偏差;如觀察發病率低的疾病則需大量人力,費用高、時間長。
世代研究是研究一開始將研究對象( 不一定是有病的人) 隨機地分派至兩組,其中一組是暴露組(exposed group) 另一組則是未暴露組(unexposed group),至於暴露的因子則是研究者關心的變數,例如抽菸與肺癌的關係或居住在高壓電附近與腦部病變的關係。然後往後追蹤一段期間,就會觀察到暴露組與未暴露組都有人發生事件(event,例如疾病),此時就可計算兩組發生事件比例的比較,例如追蹤10 年後抽菸組發生肺癌的比例為3% 而未抽菸組罹患肺癌比例為1%,接著進而透過統計分析評估究竟暴露因子( 抽菸) 是否與事件( 肺癌) 有所關聯。
世代研究是非常具有因果推論效力的研究設計,但是非常耗時也非常耗費成本,以抽菸跟肺癌來說,可能至少的追蹤期要10 年以上才有意義。另外一方面也因為追蹤期很長,研究參與對象會有失去追蹤(lost to follow up) 的問題。
----------
1-4-3 病例對照(case-control) 列聯表(cc and cci、tabodds、mhodds 指令)
流行病學的研究設計類型包括:個案報告(case report)、病例分析(case analysis)、現況調查(cross section study)、病例對照研究(case control study)、世代研究(cohort study)、臨床試驗(clinical trial)。這些方法的論證因果遞增強度,由小到大依序為:個案報告 < 病例分析 < 現況調查 < 病例對照研究 < 世代研究 < 臨床試驗,並以「同期隨機對照試驗」論證強度最高。
病例對照研究是流行病學的其中一種研究設計。它是一種較廉宜及慣常使用的流行病學研究,只需少數的研究人員( 甚至只是一個) 及單一的設備,且不涉及有結構的試驗。它的方法是指向一系列的重要發現及先例,其可信性卻有受質疑的地方,但因它過往的成功,現時廣泛被醫學界所接受。
病例對照研究的最大成功是由理查.多爾及其他科學家所發現吸菸與肺癌之間的關係。多爾在大量的病例中成功證明了兩者在統計有顯著關聯。但懷疑者( 包括菸草業人士) 爭辯病例對照研究根本不能證實成因,但在最近的雙盲的預測研究中已確定病例對照研究的結果,而現時已接受差不多所有因肺癌而死亡的人都是因吸菸所導致的。
實證研究中,除了所欲分析之暴露因素外,對照的選擇要與病例在其他的因素上具有可比性,像是干擾因子( 例如年齡與性別要相似)。其實在實務上,我們認為合適對照之選擇是相當困難的,甚至更難於病例之收集。比如說,許多慢性病研究其病例通常是年長者,但是要選擇健康的年長者為對照,是相對地困難,因為年長者鮮少沒有疾病的。
如果我們不注意這可比性的問題,就可能會產生荒謬的結果。比如說,我們以病例對照研究,來探討子宮頸癌的成因,結果你在醫院收集了子宮頸癌患者的資料;另一方面,你方便起見以公衛系的全體同學為對照。最後你得到結果,即是性別解釋絕大部分的病因,因為在醫院所收集到的子宮頸癌患者都是女性,而學校的男同學都沒有人得子宮頸癌。這種結果,就是鬧笑話了!
為了改善這種收集已經生病之病例為主體的研究,所以「病例對照(casecontrol)」,相較於世代研究具有幾項 優點:
1. 適合研究稀有疾病或具有長潛伏期的疾病。
2. 執行上相對快速,相對省錢。
3. 需要相對較少的樣本數目。
4. 允許同時探討多重潛在病因。
但是病例對照還是有其缺點:
1. 倚賴過去暴露的紀錄,或者須要去回憶收集資料;但是對於過去的資料要去評估與確認常常是困難的。
2. 合適的比較組( 對照) 之選擇,有時是困難的。
3. 有時無法建立起時序性。
小結
病例對照研究(Case-control Study) 屬於分析流行病學的一種,主要應用於探索疾病的的病因及危險因素,是對研究的病因假設進行檢驗得一種方法及提供進一步研究。
病例對照研究特點:
1. 是一種回顧性調查研究(retrospective study):病例組與對照組對暴露的危險因素的不能主動控制,因為暴露與否已經試事實,無法改變。
2. 是一種從果到因的時間順序進行研究:是已知研究對象患有某病或未患某病,再追朔可能的病因,因此,調查方向是回顧性的。
3. 設有對照組。
4. 屬於觀察研究方法。
二、世代研究(Cohort study)
世代研究又稱追蹤性研究、前瞻性研究或縱貫性研究,是一種探索病因的流行病學研究方法。其做法是在人群中抽取一個樣本,按是否暴露(expose) 於某種可疑病因( 危險因子) 或暴露程度分組,經過一段追蹤觀察,最後比較各組的發病率或死亡率,對因果關係作出估計。世代研究適用於發病率較高的疾病,也適用於環境污染對健康影響的評價。該方法的優點是在兩組對比中( 開始時的健康狀況一樣) 直接觀察致病因子與發病的關係,不存在回憶性偏差,且能計算發病率、死亡率和相對危險性。缺點是觀察時間長,可發生失訪...
作者序
隨著21世紀生物科技資訊時代的來臨,搭配STaTa是地表最強的統計軟體。使得生物統計在醫學上已扮演著舉足輕重的角色。生物統計學(biometry, biometrics, biostatistics),綜合其意,是指將統計學或數學上的方法應用於生物、醫學、農學、商業,而其對於流行病學及臨床試驗方面,具有相當高的價值。
醫學統計學係採用統計學、運籌學、經濟、數學等領域之定量方法。對臨床試驗的設計和分析就是醫學統計學在醫學裡最明顯的應用。生物醫學統計分析,依使用者及研究目的,大致分為臨床與實驗室資料分析、問卷資料分析、流行病學資料分析、資料庫資料分析,不同之使用者及研究目的之間。事實上有許多共通之研究設計及統計分析法,都與作者在五南出版STaTa 一序書名有關,包括:
一、「 STaTa與高等統計分析」一書,該書內容包括:
描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重覆測量...。
二、「 STaTa 在結構方程模型及試題反應理論的應用」一書,該書內容包括:
路徑分析、結構方程模型、測量工具的信效度分析、因素分析、試題反應理論...。
三、「 STaTa在生物醫學統計分析的應用」一書,該書內容包括:
類別資料分析( 無母數統計)、存活分析、流行病學、配對與非配對病例對照研究資料、盛行率、發生率、相對危險率比、勝出比(Odds Ratio) 的計算、篩檢工具與ROC 曲線、工具變數(2SLS)...。
四、「 Meta 分析實作:使用 Excel 與 CMA 程式」一書,該書內容包括:
統合分析(meta-analysis)、勝出比(Odds Ratio)、風險比、4 種有名效果量(ES) 公式之單位變換等。
五、「 Panel-data迴歸模型:STaTa在廣義時間序列的應用」一書,該書內容包括:
多層次模型、GEE、工具變數(2SLS)、動態模型...。
六、「 STaTa在財務金融與經濟分析的應用」一書,該書內容包括:
誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合...等。
此外,集群分析(cluster analysis)、鑑別分析...等分析,則有待作者後續再寫作。
本書主要內容包含三大類內容:
1. 類別資料處理:
二因子列聯表、三因子列聯表...。
2. 生存分析 (Survival analysis):
Kaplan – Meier、Cox 回歸( 弱性)、參數存活模型( 弱性)、危險比例檢定、時間共變數、左- 右檢查、韋柏分配、指數分配...。
在醫學統計中,存活分析法(survival analysis) 是用來研究或分析樣本所觀測到的某一段時間長度之分配。一段時間長度通常是從一特定事件起始之起始時間點算起,計算到某一特定事件發生的時間點為止,通常稱為事件時間或存活時間。在我們週圍,事件時間的資料常出現在不同領域中,包括:
(1) 公共衛生中的死亡率。
(2) 生物醫學領域:競爭風險、參數模型等存活分析。
(3) 流行病學中的生命量表。
(4) 商業領域:客戶關係管理、公司企業的存活時間。市場研究之消費者對特定商品購買時間,客戶忠誠度的時間。或則商業上客戶資料管理、行銷、企業倒閉、員工離職。
(5) 金融領域:個人消費性貸款、法人金融預警分析等。
(6) 保險統計學及人口統計學中的生命統計資料。
(7) 社會學中的事件歷史分析,研究結婚時間到離婚時間,到再婚時間,人口居住時間與流動時間。
(8) 法學研究:犯罪嫌疑人從犯罪時間到被捕時間,犯罪嫌疑人從被捕時間到起訴時間,從起訴時間到定罪時間,從假釋時間到再犯時間等。
(9) 工業領域:可靠度分析、工業製成、產品cycle。
(10) 經濟研究:失業,從就業時間到失業時間,到再就業時間等。
(11) 教育領域:老師離職、學生休退學/ 吸毒等。
3. 流行病學工具 (Tools for epidemiologists):
比例標準化、病例控制、已配適病例控制、Mantel– Haenszel,藥理學、ROC分析、 ICD-9-CM(icd9 指令)...。
大部分的醫學統計學課程都開在公共衛生學校、醫學院、林業、農業、商業、應用統計的學院是常見的課程,甚至某些美國的大學會為醫學統計學設立獨立學院。
迄今,由於電腦與統計的日新月異,使得生物醫學統計已延伸至以下研究領域:公共衛生、流行病學、營養學和環境健康、基因組學、人口遺傳學、醫學、生態、生物鑒定、農業、商業、社會科學...。
最後,特感謝全傑科技公司(http://www.softhome.com.tw),贊助STATA軟體,晚學才有機會撰寫Stata一系列的書,以嘉惠學習者。
張紹勳
敬上
隨著21世紀生物科技資訊時代的來臨,搭配STaTa是地表最強的統計軟體。使得生物統計在醫學上已扮演著舉足輕重的角色。生物統計學(biometry, biometrics, biostatistics),綜合其意,是指將統計學或數學上的方法應用於生物、醫學、農學、商業,而其對於流行病學及臨床試驗方面,具有相當高的價值。
醫學統計學係採用統計學、運籌學、經濟、數學等領域之定量方法。對臨床試驗的設計和分析就是醫學統計學在醫學裡最明顯的應用。生物醫學統計分析,依使用者及研究目的,大致分為臨床與實驗室資料分析、問卷資料分析、流行病學資料分...
目錄
Chapter 01 最小平方法(OLS) vs. 類別(Categorical) 資料分析
1-1 Stata是地表最強大之統計軟體
1-1-1 Stata統計功能
1-1-2 類別資料之列聯表,Stata對應的指令
1-1-3 Stata流行病(epidemiologists)之選擇表對應的指令
1-2 醫學實驗設計種類、重要性
1-2-1 流行病學的研究法:實驗性vs.觀察性
1-2-2 統計與實驗設計功能之對應關係
1-2-3 OLS迴歸模型之重點整理
1-2-4 單變量vs.多變量統計
1-3 二個類別變數之分析
1-3-1 類別變數之適用條件
1-3-2 卡方檢定:關聯性分析
1-3-2a 卡方檢定之介紹
1-3-2b 卡方檢定之Stata實作
1-3-3 勝算比(OR)、ROC曲線、敏感度/ 特異性:logistic迴歸
1-3-3a Odds ratio之意義
1-3-3b Odds ratio之STATA實作
1-3-3c 二元依變數之模型:邏輯斯迴歸之實例
1-3-3d ROC曲線面積、敏感度/ 特異性
1-4 流行病之類別資料統計表( 同質性檢定)
1-4-1 二發生率(Incidence-rate ratio)之列聯表(ir and iri指令)
1-4-2 世代研究風險比(Cohort study risk-ratio)之列聯表(cs、csi指令)
1-4-3 病例對照(case-control)列聯表(cc and cci、tabodds、mhodds指令)
1-4-4 分群組之失敗率(failure odds by category)列聯表(tabodds指令)
1-4-5 配對病例對照研究(matched case-control)(mcc、mcci指令)
1-5 三向列聯表(Three-Way Contingency Tables)
1-5-1 三向列聯表、Mantel-Haenszel同質性檢定(tab3way、cc指令)
1-6 類別依變數之三種迴歸,誰誤差小就誰優
1-6-1 類別依變數之三種迴歸,誰優?(reg、logit、probit指令)
1-7 對數線性模型(Log linear Models)之列聯表(ipf、「glm ..., fam(pois) link(log)」指令)
1-8 Nominal依變數:Multinomial Logistic迴歸之多項選擇(mlogit、mlogtest、test、prchange、listcoef指令)
1-8-1 Multinomial Logistic迴歸之解說
1-8-2 Multinomial Logistic迴歸之實作
1-9 配對資料(Matched Pairs)模型:Conditional logistic迴歸(先「clogit, group( 配對) or」指令、再tabulate指令)
1-10 Logit迴歸之練習題
Chapter 02 (半參數)Cox存活分析:臨床研究最重要統計法
2-1 存活分析(survival analysis)介紹
2-1-1 存活分析之定義
2-1-2 為何存活分析是臨床研究最重要的統計法?
2-1-3 存活分析之三種研究目標
2-1-4 存活分析之研究議題
2-1-5 設限資料(censored data)
2-1-6 存活時間T之機率函數
2-1-7 Cox存活分析vs. Logit模型/ probit模型的差異
2-2 Stata存活分析/ 繪圖表之對應指令、新增統計功能
2-3 存活分析範例:除草有助幼苗存活率嗎?
2-3-1 生命表(life table)
2-3-2 存活分析範例[依序(estat phtest、sts graph、ltable或sts list、stci、stmh、stcox指令)]
2-4 Cox比例危險模型(proportional hazards model)(stcox 指令)
2-4-1 f(t)機率密度函數、S(t)存活函數、h(t)危險函數、H(t)累積危險函數
2-4-2 Cox比例危險模型之迴歸式解說
2-4-3 危險函數的估計(hazard function)
2-4-4 Cox比例危險模型之配適度檢定
2-4-5 Cox模型之相對風險(relative risk, RR)
2-5 Kaplan-Meier存活模型
2-5-1 Kaplan-Meier估計法(product-limit Estimate)
2-5-2 存活分析法:Kaplan-Meier vs.韋伯分布(參數存活模型)
2-5-3 Kaplan-Meier存活函數(依序sts graph、ltable或sts list、stci、stmh、stcox指令)
2-5-4 存活分析之檢定法:Cox比例危險模型(stcox)指令
2-6 脆弱性之Cox模型(Cox regression with shared frailty)
2-6-1 脆弱性之Cox模型:「stcox, shared( 脆弱變數)」指令
Chapter 03 參數存活分析(偏態之依變數有6種分布可搭2種脆弱模型)
3-1 參數存活分析(parametric survival analysis)有六種模型
3-1-1a 可靠度之品質管理(韋伯分布常搭配accelerated failure-time)
3-1-1b Cox比例危險模型(PHM)及加速失敗時間模型(accelerated failure time, AFT)
3-1-2 參數存活分析之介紹(streg指令)
3-1-3 6種參數存活模型:韋伯及對數分布尚可搭2種脆弱模型(streg)
3-2 連續隨機變數(存活時間T)的6種機率密度函數(PDF)
3-2-1 機率密度函數(probability density function)
3-2-2 Weibull分布(非常態分布、右偏態):存活分析最重要分布
3-2-3 指數(Exponential) 分布:可靠度模型之失效時間的機率分布
3-2-4 Gompertz分布:偏態分布
3-2-5 對數邏輯分布(Log-logistic):偏態分布
3-2-6 對數常態(Log-normal)分布:偏態分布
3-2-7 廣義(generalized)gamma分布
3-3 存活時間機率函數(連續型態vs.離散型態)
3-3-1 連續型態之存活時間機率函數
3-3-2 離散型態之存活時間機率函數
3-4 帶偏態之依變數:參數存活分析(streg指令)
3-4-1 脆弱性(frailty) 模型
3-4-2 加速失敗時間(Accelerated Failure Time)模型
3-4-3 配對後Weibull存活模型搭配accelerated failure time:發電機壽命(streg指令)
3-4-4 每位病人發生多重失敗事件(multiple failures)之Weibull存活模型(streg指令)
3-4-5 五種參數模型(廣義Gamma、韋伯...),誰優?驗證治癌新藥效:(streg、test指令)
3-4-6 Weibull存活模型(帶有脆弱性gamma): 癌症死亡之個人因子(streg指令)
3-4-7 指數迴歸(搭配accelerated failure-time):肝癌之個人危險因子(streg指令)
Chapter 04 存活模型之進階
4-1 風險模型延伸(Extensions of the Proportional Hazards Model)
4-2 競爭風險迴歸(Competing-risks regression)(stcrreg指令)
4-2-1 競爭風險之應用:違約及提前清償行為模型係數估計
4-2-2 範例:競爭風險(Competing-risks)迴歸(stcrreg指令)
4-3 縱貫面調查法:肺癌存活模型(svy: stcox 指令)
4-4 panel-data參數存活模型[xtstreg , shared(panel變數)指令]
4-4-1 追蹤資料(panel-data)
4-4-2 追蹤資料(panel-data) 存活分析[xtstreg, shared (panel 變數) 指令]
4-5 多層次(multilevel)參數存活模型(mestreg指令)
4-5-1 Multilevel存活模型
4-5-2 多層次參數存活模型(mestreg...||分層變數)
Chapter 05 最小平方法(OLS)迴歸vs. Logistic迴歸
5-1 了解各類型迴歸分析
5-1-1 各類型迴歸之適用情境
5-1-2 線性迴歸之基本概念
5-2 最小平方法(OLS) 迴歸7個假定的診斷及補救法
5-3 Binary依變數:Linear Probability, Probit及Logistic迴歸
5-3-1 Logistic迴歸介紹
5-3-2 Logistic指令的事後檢定
5-3-3 Logistic範例:年齡與罹患冠心病(CHD)關係
5-4 Binary依變數(失業否預測):OLS,Probit及Logistic迴歸三者比較
Chapter 06 流行病學統計法:ROC曲線分析
6-1 流行病學(Epidemiology)
6-1-1 流行病學之研究法:觀察法及實驗法
6-1-2a 觀察法:描述性vs.分析性研究
6-1-2b 觀察法:前瞻性vs.回溯性研究;縱貫面vs.橫斷面研究
6-1-3 實驗法
6-1-4 Stata流行病(epidemiologists)之選擇表對應的指令
6-1-5 流行病學之ROC法的應用領域
6-1-6 臨床試驗常用術語解釋
6-1-7 頻率(frequency)的指標:生命統計測量值
6-2 Receiver operating characteristic(ROC)分析:判別檢驗工具的準確性
6-2-1 流行病統計法:ROC緣由
6-2-2 ROC曲線原理:2×2混淆矩陣
6-2-3a Type I誤差α及Type II誤差β:ROC圖切斷點的由來
6-2-3b 評估不同篩檢工具之分類準確性(accuracy):ROC圖
6-2-4 篩檢工具的績效(performance):同一篩檢工具不同檢驗值切斷點的選擇
6-2-5 ROC法之分析步驟
6-2-6 參數的ROC
6-3 ROC分析之Stata範例
6-3-1 如何提升ROC研究設計之品質
6-3-2a 二個Logistic迴歸誰優?(logit、lroc、roccomp指令)
6-3-2b ROC繪圖法:三個檢驗工具之準確度,誰優?(roccomp、rocgold指令)
6-3-3 Parametric ROC models:風險評級最佳斷點?(rocfit指令)
6-3-4 Nonparametric ROC模型之風險評級最佳斷點(roctab指令)
Chapter 01 最小平方法(OLS) vs. 類別(Categorical) 資料分析
1-1 Stata是地表最強大之統計軟體
1-1-1 Stata統計功能
1-1-2 類別資料之列聯表,Stata對應的指令
1-1-3 Stata流行病(epidemiologists)之選擇表對應的指令
1-2 醫學實驗設計種類、重要性
1-2-1 流行病學的研究法:實驗性vs.觀察性
1-2-2 統計與實驗設計功能之對應關係
1-2-3 OLS迴歸模型之重點整理
1-2-4 單變量vs.多變量統計
1-3 二個類別變數之分析
1-3-1 類別變數之適用條件
1-3-2 卡方檢定:關聯性...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。