運用Python進行資料分析,讓數據說話,有效達成論文目標。
⊙統計分析初學者最佳實用手冊,精要理論+手把手操作教學。
⊙內容涵蓋論文寫作常用的敘述統計、推論統計、非參數檢定,並延伸至結構方程模式,對於需要撰寫論文但對統計方法不熟悉的研究生尤其受用。
⊙適用於社會科學領域的學生和研究人員,特別是碩博士量化研究論文應用在問卷調查方面的分析、多變量研究、實驗設計與統計課程等項目。
需要的論文統計分析方法都在這裡!
受限於軟體工具的取得,研究者有可能面臨雖掌握足夠的數據資料,卻缺乏專業統計分析工具的窘境。本書介紹的Python為開放原始碼的開源軟體,解決統計分析軟體高成本、難入手的研究門檻,對於學術工作帶來極大的便利性與可及性,可協助提升研究專業能力。
Python的應用具有寬廣的發揮度,比如透過網路爬蟲抓取即時資料作大數據分析、編寫程式來加大對議題鑽研的深度與廣度的可能性,也能更加深入嘗試使用該工具來完成數據分析工作並獲得良好成果。書中內容在有關統計學部分作基礎概念解說,並偏重在數據分析的手把手教學步驟示現,讓初學者或者是有論文需求者可以按照內容簡易操作,並達成高效率地論文數據統計分析目標。
作者簡介:
洪煌佳
現職
國立臺東大學體育學系教授兼學生事務長
學歷
國立臺灣師範大學體育學系博士
國立臺灣師範大學運動與休閒管理研究所碩士
經歷
國立臺東大學師資培育中心主任
國立臺東大學體育室主任
各界推薦
名人推薦:
吳崇旗/臺灣師範大學公民教育與活動領導學系教授兼副系主任
馬上鈞/成功大學體育健康與休閒研究所教授
名人推薦:吳崇旗/臺灣師範大學公民教育與活動領導學系教授兼副系主任
馬上鈞/成功大學體育健康與休閒研究所教授
章節試閱
2.2 資料建立與編碼簿
Python可以讀取的資料包含很多,常見使用的檔案類型為「CSV」檔案。「CSV」格式的檔案是一種用逗號分隔儲存資料的型態,目前也是許多網頁中存取資料常見的格式之一。因而,Python可以從網路上下載許多政府機關所提供的資料,或者是許多網頁中提供的公開資訊。
當使用者要自己建立CSV檔案,其方式可以使用Microsoft Excel或者是Google Form執行,這裡介紹採用Excel的方式。而資料表格式為欄列格式,行/欄 (column) 為直的、圓柱狀的意思,檔案中的A、B、C…就是欄;而列 (row) 是橫的。一般欄列表示是編製統計表格的普遍作法。步驟如下:
1. 建立過錄編碼簿
過錄編碼簿 (codebook) 的意義在於呈現數據資料的背景描述與數據意義,一般含有「題號、 變數名稱、變數說明、選項數值說明、備註」等,以利使用者理解數據所欲表達的訊息,因而,數據整理應該清楚呈現所記載登錄的資訊。
以問卷調查為例,在調查問卷回收並篩選完有效樣本之後,除了給予問卷進行序號編碼之外,針對問卷內容也應該要進行編碼規劃,並給予各個題項進行編碼的登錄規則,這樣除了有助於律定登錄的數值之外,也可以清楚紀錄每個數值的代表意義。
因而,編碼簿就是原始問卷題目之外,針對該問卷題目的給予相對應數值的詳細說明,以作為後續資料解讀的重要依據。
2. 資料建立
開啟一個新的Excel檔案,並將「第一列」作為資料的「行標籤名稱」 (變數名稱),且建立「列索引」 (資料筆數) 排序數據資料。其中,「行標籤」的欄位標籤名稱中建議以英數字型登錄,以方便後續各類統計軟體讀取。
3. 在Excel中使用插入註解代替編碼簿
使用者如果想要直接將簡易編碼簿建立在Excel檔案中,也可以透過將第一列欄位標籤名稱中使用「插入註解」或是由校閱中「新增註解」的方式,來說明欄位標籤中的數值意義,並作為包含有編碼簿功能的「原始檔案」以利閱讀。而該Excel檔案後續則可以再另外儲存成一個CSV檔,作為資料分析使用。
基本上,使用者可以在Excel原始檔案的行標籤名稱中,點選右鍵「插入註解」後並在註解寫入資訊。例如,使用者在行標籤「gender」的註解寫入:「gender性別、1男、2女、空值為遺漏值」;在行標籤「age」中寫入註解:「age年齡、受訪者直接填寫歲數、空值為遺漏值」;在行標籤「edu」中寫入註解::「edu父親教育程度、1國小、2國中、3高中(職)、4專科、5大學、6碩士、7博士、空值為遺漏值」;在年齡、受訪者直接填寫歲數、空值為遺漏值」;而在「a1、a2、a3、a4、a5」則僅列出數值意義,在註解中寫入:「1非常不同意、2不同意、3普通、4同意、5非常同意、空值為遺漏值」。如果要針對行標籤已經有的註解,需要修改時則使用「編輯註解」作編輯。
另外,因應數據資料可能屬於同樣是量表題項的註解,可以在需要一樣註解的欄位中複製註解之後,再選取想要插入註解的欄位按右鍵「選擇性貼上」中選擇「註解」後則可以進行註解的複製。使用者以「a1、a2、a3、a4、a5」的註解示範,先針對a1寫入註解為:「1非常不同意、2不同意、3普通、4同意、5非常同意、空值為遺漏值」,然後複製到其他的相同註解的行標籤中。
2.2 資料建立與編碼簿
Python可以讀取的資料包含很多,常見使用的檔案類型為「CSV」檔案。「CSV」格式的檔案是一種用逗號分隔儲存資料的型態,目前也是許多網頁中存取資料常見的格式之一。因而,Python可以從網路上下載許多政府機關所提供的資料,或者是許多網頁中提供的公開資訊。
當使用者要自己建立CSV檔案,其方式可以使用Microsoft Excel或者是Google Form執行,這裡介紹採用Excel的方式。而資料表格式為欄列格式,行/欄 (column) 為直的、圓柱狀的意思,檔案中的A、B、C…就是欄;而列 (row) 是橫的。一般欄列表示是編...
推薦序
2022年初,接到洪煌佳教授的來電,聽得出電話另一端興奮的語調:「上鈞兄,我終於完成多年的夢想,雖然實現的過程有些久,但還是完成了!想邀請上鈞兄幫我的著作寫序!」頓時我的腦海中浮現了二十多年前與洪教授同窗共讀研究所時,為了瞭解論文中該使用哪一種統計方法,從晚餐時刻一直討論到隔天黎明破曉,這種追求知識的渴望與過程,久久無法忘懷,彷彿在昨日。心想,若當時有多幾本像煌佳教授這樣的著作,就能讓我們不需熬夜討論統計,且能輕鬆享受求學做學問的過程了。
拜讀《Python論文數據統計分析》,內容涵蓋論文寫作常用的敘述統計、推論統計、非參數檢定並延伸至結構方程模式,每個部份按部就班編排,從基本觀念、程式撰寫與結果說明、表格整理,再到手把手教學,對於撰寫論文又對統計方法不熟悉的研究生尤其受用。本書另外值得一提的優點是讓撰寫論文而需要使用統計方法者,同時學習到當今相當重要的程式語言,可說是附加價值相當好的一本書,建議研究生手邊有一本這樣的工具書,絕對受用無窮!
煌佳教授多年來在後山一點一滴努力耕耘,在繁忙的行政、教學與研究工作中,實現了他多年的自我承諾,完成了一部實用價值極高的統計著作,著實讓人佩服。能受邀為共硯好友新書寫序,感到無比榮幸!
馬上鈞
國立成功大學
體育健康與休閒研究所 教授
2022年2月18日
2022年初,接到洪煌佳教授的來電,聽得出電話另一端興奮的語調:「上鈞兄,我終於完成多年的夢想,雖然實現的過程有些久,但還是完成了!想邀請上鈞兄幫我的著作寫序!」頓時我的腦海中浮現了二十多年前與洪教授同窗共讀研究所時,為了瞭解論文中該使用哪一種統計方法,從晚餐時刻一直討論到隔天黎明破曉,這種追求知識的渴望與過程,久久無法忘懷,彷彿在昨日。心想,若當時有多幾本像煌佳教授這樣的著作,就能讓我們不需熬夜討論統計,且能輕鬆享受求學做學問的過程了。
拜讀《Python論文數據統計分析》,內容涵蓋論文寫作常...
作者序
「一步一步按部就班操作,輕鬆簡易完成論文數據統計分析!」這絕對是大部分研究者的盼望,也是個人當初接觸統計分析的盼望。時至今日,該盼望可說是具體實現了。
受限於軟體工具的取得,研究者有可能面臨雖掌握足夠的數據資料,卻缺乏專業統計分析工具的窘境,而落入「巧婦難為無米之炊」的心情寫照。尤其在當代社會中運用科技取得數據資料變得容易,但要有效率的處理分析資料則相對困難。因此,運用良好的資料分析工具進行有效益的分析,讓數據會說話,並且言之有物常是研究者最大的期許。
在就讀大學與研究所的過程中,統計應用往往是必修課程與論文數據分析的必備知能,尤其是,大部分學生或研究生在撰寫研究論文的過程中,蒐集龐雜的數據資料之後,更需要統計分析工具的使用,此時對於資料進一步分析則是「萬事俱備,只待東風了!」
而這裡的東風,指的就是專業的統計分析工具!然而,並非各個單位都能提供足夠的專業統計工具與空間,又或者是使用者都能有充裕時間待在單位提供的統計分析軟工具的設備環境中進行分析。因而,如果專業統計分析工具唾手可得且具有可及性,相信對於學術研究工作的發展更有推波助瀾的功效!
臺灣在2021年中COVID-19疫情大爆發期間,個人嘗試使用Python開源軟體執行專業的統計分析後,其簡潔的語法編碼與分析結果,讓個人深感其對於學術工作可以帶來極大地便利性與可及性。從而,也讓個人思考著如果可以透過該開源軟體讓更多人士學會使用,則可以讓他們在自己的環境中使用專業統計分析工具,而不用前往特定環境中才能夠使用專業統計軟體,避免不必要的社交、環境接觸並兼具防疫效果,更重要地是提升研究專業能力。
這或許是一開始使用Python執行統計分析的初衷與考量,但是隨著接觸Python的時間愈長與應用在教學上,也愈發認識到Python的應用是可以有更寬廣的發揮,比如透過網路爬蟲抓取即時資料作大數據分析、編寫程式來加大對議題鑽研的深度與廣度的可能性,也能更加深入嘗試使用該工具來完成數據分析工作並獲得良好成果。
具體來說,本書定位在使用Python來進行數據處理,並以其完成論文數據資料統計分析的實用操作手冊,且基於個人在學習統計應用時,秉持「Simple is beautiful!」的核心理念,因而,在內容寫作上有關統計學部分僅作基礎概念說明,並偏重在數據分析的手把手教學步驟說明,以讓初學者或者是有論文需求者可以按照內容簡易操作並達成高效率地論文數據統計分析目標。
本書得以順利出版,首先,由衷感謝五南圖書出版股份有限公司主編侯家嵐小姐的支持與協助之外,其次,也感謝恩師臺灣師範大學王宗吉教授在研究方法的啟迪與指導,再者,也要感謝在教學、研究與服務的實踐場域中,承蒙諸多學術先進,與臺東大學師長及同學的砥礪才得以完成。最後,感謝摯愛的母親、內人及兒子在幕後的耐心支持。然而,由於個人所學有限,本書內容雖然校對再三,謬誤或疏漏之處在所難免,還請諸位先進及學者專家能夠不吝指正以完善本書內容。
洪煌佳
謹識於臺東大學
2022年2月
「一步一步按部就班操作,輕鬆簡易完成論文數據統計分析!」這絕對是大部分研究者的盼望,也是個人當初接觸統計分析的盼望。時至今日,該盼望可說是具體實現了。
受限於軟體工具的取得,研究者有可能面臨雖掌握足夠的數據資料,卻缺乏專業統計分析工具的窘境,而落入「巧婦難為無米之炊」的心情寫照。尤其在當代社會中運用科技取得數據資料變得容易,但要有效率的處理分析資料則相對困難。因此,運用良好的資料分析工具進行有效益的分析,讓數據會說話,並且言之有物常是研究者最大的期許。
在就讀大學與研究所的過程中,...
目錄
第 1 章 Python軟體介紹
1.1 Python的發展
1.2 安裝Python軟體
1.3 整合開發環境的概念
1.4 Anaconda Prompt管理模組
1.5 常用整合開發環境
Python手把手教學 01:執行第一支Python程式
第 2 章 數據資料的測量與建立
2.1 數據的統計與測量
2.2 資料建立與編碼簿
2.3 登錄資料與資料儲存
Python手把手教學 02:建立CSV檔案資料
第 3 章 Python的Pandas庫進行數據分析
3.1 Python Pandas庫介紹
3.2 模組、套件包與工具庫
3.3 載入模組與套件
3.4 Pandas 讀取資料
3.5 資料檢視與基本操作
Python手把手教學 03:資料讀取與輸出
第 4 章 Pandas數據資料處理
4.1 Pandas資料檢視
4.2 Pandas資料篩選
4.3 Pandas資料清理
4.4 Pandas資料轉換
4.5 Pandas資料統計
4.6 Pandas匯出儲存檔案
Python手把手教學 04:數值計算與新增行標籤
第 5 章 數值資料分析與視覺化:Numpy及matplotlib
5.1 為什麼需要資料視覺化?
5.2 NumPy的基礎ndarry陣列與運算
5.3 matplotlib視覺化套件應用
Python手把手教學 05:資料視覺化
第 6 章 平均數檢定
6.1 t檢定的概念
6.2 執行t檢定
Python手把手教學 06:獨立樣本t檢定
第 7 章 變異數分析
7.1 變異數分析的概念
7.2 單因子重複量數變異數分析
7.3 單因子變異數分析
7.4 二因子變異數分析
7.5 二因子變異數分析:混合設計
Python手把手教學07:單因子變異數分析
第 8 章 非參數檢定
8.1 非參數檢定的概念
8.2 二組獨立樣本的非參數檢定
8.3 多組樣本的非參數檢定
Python手把手教學08:非參數檢定
第 9 章 相關與迴歸分析
9.1 相關分析的概念
9.2 相關分析的執行
9.3 線性迴歸分析的概念
9.4 線性迴歸分析的執行
Python手把手教學09:多元迴歸分析
第 10 章 項目分析與信度
10.1 項目分析的概念與執行
10.2 信度分析的概念與執行
Python手把手教學10:項目分析與信度分析
第 11 章 因素分析
11.1 因素分析的概念
11.2 因素分析執行
Python手把手教學11:因素分析
第 12 章 類別資料分析
12.1 類別資料分析的概念
12.2 執行卡方檢定
Python手把手教學12:卡方獨立性檢定
第 13 章 結構方程模式
13.1 驗證性因素分析的概念
13.2 驗證性因素分析的執行
13.3 結構方程模式的概念
13.4 結構方程模式的執行
Python手把手教學13:驗證性因素分析
第 1 章 Python軟體介紹
1.1 Python的發展
1.2 安裝Python軟體
1.3 整合開發環境的概念
1.4 Anaconda Prompt管理模組
1.5 常用整合開發環境
Python手把手教學 01:執行第一支Python程式
第 2 章 數據資料的測量與建立
2.1 數據的統計與測量
2.2 資料建立與編碼簿
2.3 登錄資料與資料儲存
Python手把手教學 02:建立CSV檔案資料
第 3 章 Python的Pandas庫進行數據分析
3.1 Python Pandas庫介紹
3.2 模組、套件包與工具庫
3.3 載...
商品資料
語言:繁體中文For input string: ""
裝訂方式:平裝頁數:464頁開數:16K
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。