克服你對數學的恐懼!
一本讀懂資訊處理、研究報告、人工智慧研發必須的統計學,
擺脫挫折感,擠進精英窄門!
想學好統計,一定要釐清「統計學的內在目的」
統計學只會用到「加、減、乘、除、平方根、次方」六種計算,
為什麼統計讓人感覺好亂?
看了許多數學學習書,仍然一頭霧水?
其實,並不是你程度差,
而是沒理解「數學的語言」!
數學之所以難,是因為數學不存在於自然界,
是「完全由人類建構而成,用於解決現實問題」的學問。
數學常見的「定理」和「數學式」也常給人「數學很難」的印象。
「定理」或許還能用語文知識勉強理解,
但「數學式」之所以令人卻步,是因為數學式「只會」寫出數學符號和預設條件。
但數學的語法,相較於中文,更接近「英文」。
這也是為什麼數學式看起來難以理解的原因之一。
本書在每一章節整理出「數學的意義」,
從「數學的語言」開始了解數學,擺脫挫折感!
作者簡介:
淺野晃(Akino Akira)
1987年 大阪大學工學部應用物理學科大學部 畢業
1989年 大阪大學工學研究科應用物理學專攻研究所博士前期課程 畢業
大阪大學工學研究科應用物理學專攻研究所博士後期課程 入學
1990年 蘇聯(現俄羅斯)科學院訊息傳遞問題研究所 客座研究員
1991年 日本學術振興會特別研究員DC
1992年 博士畢業(工學)(大阪大學)
1992年 九州工業大學資訊工學部機械系統工學科助手
1994年 芬蘭國立研究中心資訊工學部門客座研究員
1998年 廣島大學綜合科學部助理教授
2005年 廣島大學綜合科學部教授
2006年 廣島大學工學研究科研究所教授
2011年 關西大學綜合資訊學部教授至今
章節試閱
1.1 數學不是「UNO」,而是「Pageone」
為什麼數學這麼難呢?為什麼有很多人會覺得數學「很困難」呢?
覺得數學很難的原因千奇百怪,不過有一個很重要的原因是「數學中只有一小部分能用常識理解」。其它像是物理、生物等領域的學者們,研究的是自然界內的現象;而人文、社會學領域的學者們,研究的則是現實中的人類行為。研究這些學問時,研究者們可以在現實中親眼看到這些自然現象或人類行為,故可藉由現實中的經驗理解這些學問。
另一方面,數學卻不存在於自然界中,是一門完全由人類建構出來的學問。
當然,就像古埃及為了決定如何分配土地,而發展出數學中的幾何學一樣,數學原本是為了解決現實中的問題而發展出來的學問。不過當幾何學這門數學領域發展出來以後,就與埃及的土地分配沒有關係了,也和世界各地的土地分配沒有任何關係。
在思考幾何學問題時,用到的只有幾何學的規則,以及解題時的預設條件。學習幾何學時,會畫出有點或直線的圖,而在數學領域中,點沒有大小之分、直線沒有寬窄之別。這與我們的現實經驗不同,這些就是「我們在解數學題時的預設條件」。
我們可藉由這些規則,一一探究幾何學中各種圖形的性質。由此瞭解到的性質又稱為「定理」,而重要的定理則會被賦予名字,像是「畢氏定理」。畢氏定理說的是直角三角形的斜邊長(圖1.1的a)與其它兩邊(b與c)有著a2 = b2 + c2的關係。知道怎麼使用畢氏定理,就可以馬上算出長方形土地的對角線長。由此可知,數學世界的定理也可以幫助我們解決現實中的問題。
不過,即使我們可以接受數學世界中的預設條件,在閱讀數學書籍的時候,還有一個會讓我們覺得數學很困難的地方,那就是艱澀的數學式。
1.1 畢氏定理
之所以會覺得數學式很困難,是因為數學式中「只會」寫出數學符號與預設條件。用日語寫出來的文章,內容再怎麼艱澀,還是可以用我們平常使用的日語知識慢慢讀下去。但讀數學式時卻不是這麼一回事。數學式完全由數學符號與預設條件所組成。+-×÷這些符號在數學的每個領域中,都預設是同樣的意義。而(-1) × (-1) = +1這種負負得正的規則,也是在確認不會與其它預設條件矛盾之後,才決定出來的規則。
至於x是什麼、n是什麼之類,對於未知數的定義,則是在解題時當場決定的預設條件。舉例來說,統計學的書中可能會出現這樣的敘述
假設一組資料中有n個數值,分別是x1, x2, …, xn,則這些數值的平均值x¯可表示為(算式1.1)
其中n是數值的個數,x1, x2, …, xn代表每一個數值,x¯則是數值的平均,這些都是當場決定的事項。如果這條算式出現在一本數學書中,那麼這條算式所定義的事項,在這本書以後的內容中也持續有效。要是讀者直接跳到過這個部分,或者是忘記這條算式的定義,在閱讀後面的內容時,不管怎麼讀應該都讀不懂才對。
這樣的規則和某些卡牌遊戲的規則有幾個相似的地方。想必各位都有聽過「UNO」這個卡牌遊戲吧。UNO的玩家需從手牌中選擇與場上的牌花色相同,或者數字相同的牌打出。要是手上沒有可以出的牌,就必須從牌堆中抽出一張牌放入手牌內。遊戲時,每位玩家依序出牌,最先出完手牌的人就能獲得勝利。有些卡牌中還有著像是「讓下一個人抽兩張牌」、「出牌順序反轉」之類的指示。
那麼,各位有聽過「Pageone」(正確來說應該是「American Pageone」)的撲克牌遊戲嗎?Pageone是UNO的原型遊戲之一,有著各式各樣的變種玩法,不過「從手牌中選擇與場上的牌花色相同,或者數字相同的牌打出。要是手上沒有可以出的牌,就必須從牌堆中抽出一張牌放入手牌內。每位玩家依序出牌,最先出完手牌的人就能獲得勝利」這個基本規則和UNO是一樣的。
UNO是用專用牌來玩,所以有些牌上會寫著「讓下一個人抽兩張牌」這樣的說明。不過Pageone是用撲克牌來玩,所以若玩家希望特定數字的牌有特殊用法,需要在開始玩之前就自行定義清楚,像是「出2,下一個人要出兩張牌」,或者是「出8,出牌順序反轉」之類的。因為這是遊戲規則,所以即使被問到「為什麼出8的時候出牌順序會反過來呢?」也很難回答出個所以然。因為這是預設條件,所以沒有為什麼。
筆者念小學的時候,在學校玩Pageone的時候常會「當場決定遊戲規則」。在開始正式遊戲之前,我們會隨意抽出一張牌,如果這張牌是3,就訂出「出3,下一位玩家就要抽兩張牌」這樣的規則,並當場把這個規則背起來。要是在遊玩途中弄錯規則的話就要「加手牌」,也就是要接受處罰。
讀數學書籍的時候,就和這種「當場決定規則的Pageone」一樣。若想知道書中數學式中的x和y分別是什麼意思,就要往前翻翻這本書中這條數學式之前的內容,一定會有「將某某東西表示為x」之類的說明。要是沒有確認這一點,就會被「加手牌」,就算讀完這本書也不曉得書的內容在講些什麼。
1.2 數學書的閱讀方式:數學家也不可能一目十行
在你看書的時候,讀一頁大概需要多少時間呢?如果是讀起來很輕鬆的書籍,應該可以一頁一頁地迅速翻過。如果是稍微有點困難的書,閱讀的速度可能就和唸出聲音的速度差不多。
但閱讀數學書籍的時候就不是這麼一回事了。某些情況下,讀一頁,甚至是理解一條數學式可能就會花上好幾天。不只是還未習慣閱讀數學書籍的初學者,數學家也很有可能會出現這樣的情況。數學家們在閱讀數學論文時,需要充分的時間理解最新的研究成果。
為什麼閱讀數學書籍時很花時間呢?筆者認為原因有以下幾點。
書中所寫的數學規則僅適用於該書 如前一節所述,現實生活中的「常識」沒辦法應用在閱讀數學書籍上。數學書中除了有+-×÷這些適用於所有數學領域的規則之外,還有著「將某某東西表示為x」這種僅適用於這本書的規則。在閱讀數學書籍時,需隨時記著這些規則,一一理解每條數學式想表達什麼意思,數學式又為什麼要這樣變形才行。
不是用日語文法寫成 數學式的書寫規則與日語文法有所不同。若要問和哪種語言比較接近,比起日語,數學式與歐美語言較為相似。舉例來說,本書第九章以後會用P(X)來表示「X的機率」。英語中寫成“probability of X”,P在X前面。但在日語和中文順序剛好相反,「機率」在X的後面。因此在日語數學書中,常可看到日語中夾雜著各種「外國語言」及「數學語言」。
不一定是從前面開始閱讀 一般的語言中,為了在唸出聲音時能讓人馬上理解,通常是從一段文字的最前端開始,照著文字的順序一一理解文字的意義。但數學式並沒有預設要被唸出聲音來,故不一定是從最前端開始理解每一個符號的意思。
數學式中有著「先乘除、後加減」的規則。因此像是「1 + 2 × 3」這樣的式子,就必須先計算2 × 3,再計算1 + (2 × 3的結果)。
另外,我們在第十二章中說明「區間估計」時,也會出現「P(-1.96≦Z≦1.96) = 0.95」這樣的式子。讀者必須先讀懂( )內想表達的是「Z在-1.96以上,1.96以下」的意思,然後瞭解到P(…)想表達的是「( )內的事情發生的機率」,最後看到「= 0.95」時,才會明白到這個機率是0.95。照這個規則閱讀這條式子,先瞭解式子的中間部分,再逐漸往左右兩邊擴張,才能讀懂這條式子想表達的意思。
沒辦法把數學式唸出來 如前所述,數學式並沒有預設要被唸出聲音來。因此,唸不出數學式是很正常的。
第四章中說明用來表示總和的符號「Σ」時,會提到「(算式)」這個數學式的唸法是「sigma xi i等於1到n」或「將i等於1到n的xi加總」,但這個數學式並不是非得要這樣唸才行,不管怎麼唸都沒有關係。
「要是沒有讀出聲音的話就很難記住」這種想法也不是不能理解,但照著文字符號的排列把數學式硬背下來其實沒有什麼意義。就算反覆唸著「sigma xi i等於1到n」而將其硬背下來,若沒有辦法把這轉換成數學符號(算式),就沒有意義了。
讀到後面時會覺得突然變得很難 我們小時候學過的數學知識在我們的生活中會不斷重複使用。生活中經常使用的「+-×÷」就是在小學時學到的,在多次使用之後我們已熟練了這些計算方式。就像前面提到的「平均」這個例子一樣,如果在一本書中已經定義了一次規則,就不會在同一本書內講第二次,而且這個定義會一直沿用到書結束。
數學書籍中,常會在一開始就提到一大堆諸如「x代表某某意思」之類,看起來很單純的定義。由於在這本書之後的內容中,都會把這個定義當成理所當然的條件來使用,所以要是一開始不把這些單純的定義當一回事,讀到後面時就會覺得突然變得很難。
閱讀數學書籍時會碰到上述困難。老實說,對於筆者而言,閱讀寫有一大堆數學式的書時也會覺得很累,常會想要跳過數學式的部分。但這就像是讀日語時,跳過艱難的漢字只讀假名一樣,絕對看不懂在寫什麼。
因此,對那些覺得數學書籍很難看懂的人,我建議閱讀時在旁邊做一份筆記。當看到書中寫著「x代表某某意思」的內容時,就在筆記上寫下「x:某某意思」。之後如果在其它數學式中看到x,就再回頭看看筆記中的「x:某某意思」。這麼一來,讀者就可以在腦中將各種數學式一一組合起來,想像出這本書想說明的世界,建構出自己的「世界觀」。
換句話說,就像是在玩剛才提到的「當場決定規則的Pageone」時,將當場決定的規則寫在筆記上,邊看著規則邊玩遊戲一樣。筆者現在在閱讀有許多數學式的學術論文時,也常用這種方法。
1.3 本書的內容展望
我們剛才提過「世界觀」這個詞。在閱讀數學書籍的時候,「展望」也是很重要的事。不管是在推導數學式還是在推導邏輯,要是沒有一個目標,腦中的數學世界會逐漸蒙上一層濃霧。若知道終點是什麼,就能夠同時從出發點與終點走出一條路徑,幫助理解這段推論的過程。
因此在本章的最後,我想簡單說明在這本書中,做為統計學的「熱身運動」的第一部內容,與說明統計學概念的第二、三部內容有什麼樣的關係。請對照著圖1.3看。
第二章「狡猾的政客」中,我們會說明數學中的邏輯與集合,以及集合的示意圖「文氏圖」。本書中常會用到數學上的邏輯,特別是在第十二章講到「檢定」時,數學邏輯更是必備的基礎概念。而在第九章講到機率時,我們會用集合與文氏圖來說明「條件機率」的概念。
第三章「希臘字母看起來好帥」中,我們會說明在數學中常用到的希臘字母。而且在本章中所提到的「常數」與「變數」的概念,在本書的其它地方也會用到。另外,本章會提到「不等式」。第十章中說明「隨機變數的範圍」,以及第十二章說明「區間估計」時,都會用到不等式的概念。
第四章「加法→乘法→次方,逐漸演進的計算方法」中,會說明「+、-、×、÷、根號、次方」等計算符號。本章還會提到代表加總的「Σ符號」,這個符號在第七章中求平均值,以及第十四章中計算各種與期望值有關的數值時都會出現。此外,在第八章中講到「對數尺度」時,會用到本章所提到的「對數」概念;而在第十三章中講到「連續」時,會用到本章所提到的「實數」概念。
第五章「函數與數學式」中,會說明數學領域中非常重要的「函數」,以及函數的「圖形」等概念。第八章講到能夠精簡資料意義的「迴歸」,以及第十三章講到與機率有關的「機率密度函數」時,都會用到函數與圖形的觀念。
第六章「從單位到微分、從合計到積分」中,會說明數學領域中用來衡量「量」的變化時會用到的「微分」與「積分」。第八章在求迴歸線時會用到「最小平方法」,說明最小平方法時就會用到微分的概念;第十三章在說明「連續型機率分配」時,則會用到積分的概念。
1.1 數學不是「UNO」,而是「Pageone」
為什麼數學這麼難呢?為什麼有很多人會覺得數學「很困難」呢?
覺得數學很難的原因千奇百怪,不過有一個很重要的原因是「數學中只有一小部分能用常識理解」。其它像是物理、生物等領域的學者們,研究的是自然界內的現象;而人文、社會學領域的學者們,研究的則是現實中的人類行為。研究這些學問時,研究者們可以在現實中親眼看到這些自然現象或人類行為,故可藉由現實中的經驗理解這些學問。
另一方面,數學卻不存在於自然界中,是一門完全由人類建構出來的學問。
當然,就像古埃及為了決定如何...
作者序
感謝你拿起本書。
對我來說,在大學部工學部(大學理工學院)念書,已經是三十年前的事了,那時我們的必修課程中並沒有統計學。不過,現在的電腦與網路科技比那時還要發達許多,蒐集、處理大規模資料已是再尋常不過的事,使統計學成為一門應用廣泛的學問。最近很流行的「人工智慧」,也是在蒐集了非常龐大的資料以後,從中找出我們想要的答案,這可說是統計學發展的結晶。另外,許多大學的共同課程中,也加入統計學課程。不管學生是文組還是理組、主修哪個領域,統計學都成為了一門必備的學問。
若我開的統計課上有許多來自各個領域的學生,我除了教他們統計學的計算過程,也會說明「統計學為什麼要這樣計算、有什麼目的」,也就是「統計學的內在」。
「統計學的內在」可以用數學表示。在我開的課中,為了讓學生不要被嚇跑,我一定會在一開始就說「統計學會用到的計算只有+、-、×、÷、平方根,還有次方這六種而已喔」。但當我們開始計算平均值,用到Σ這個符號(計算總和)時,就有學生撐不下去了。遺憾的是,這樣的學生還不算少。
這些地方之所以會成為學生的障礙,並不是因為學生們數學差。只是因為他們並不曉得這些符號在數學領域中的使用方式,或者說他們不了解數學的「語言」,也可能只是他們剛好忘了這些符號怎麼用而已。這些學生們就因為這樣而失去了接觸統計學的機會,我覺得是一件很可惜的事。
因此,在開始學習「統計的內在」前,本書準備了「數學準備篇」這個章節,以說明「數學的內在」。在這個部分中,我們會先從「如何閱讀數學相關書籍」開始說明,像是數學邏輯與日常邏輯有什麼不同、變數與常數,以及數學中常用到的「希臘字母」。此外,還會提到次方、平方根、以及Σ符號等,只在數學中出現的表現方式,也會說明微分、積分的概念。
在做完這些數學熱身運動後,就可進入「統計學基礎篇」,開始說明統計學的基礎原理。我們會先說明在蒐集資料之後如何進行分析,也就是所謂的「敘述統計學」。不論資料大小,我們都可以用代表值、相關、迴歸等概念說明資料的特性,我希望讀者在讀過這個部分「不只能說出每一筆資料各有不同,還能夠說出資料的組成特性」。
熟悉以上內容之後,就可進入「統計學進階篇」。我們會學到如何從蒐集到的資料,分析未能蒐集到的資料,也就是所謂的「推論統計」。在這個部分中,「機率」扮演著很重要的角色。推論統計方法中,若知道蒐集到之資料的「組成特性」,就可以知道除此之外的資料可能會長什麼樣子,這就是這個部分的重點。
在這裡有一個小小的要求想要拜託準備要閱讀這本書的你,當你在閱讀本書時,如果覺得好像有掌握到某些「統計學的內在」,請你一定要試著用個人電腦跑跑看資料處理。能夠進行資料處理的工具包括Excel之類的試算表軟體,以及R這類免費統計分析軟體,市面上有相當多這些軟體的解說書籍。如果在你親手操作這些工具、處理資料時,真正意會到「這個步驟想做什麼」,才表示這些統計學的「核心」真的有成為你的一部分。
執筆本書時,Ohm社書籍編輯部門的各位給予我許多協助,並提供了許多很棒的建議,在此表示我的謝意。
另外,由於我申請到了平成二十八年度關西大學研修員的身分,獲得了研修費,使我能夠在這段期間內專心於研究、寫作活動。本書的部分內容也是在這段期間內完成的。
筆者在大學開的統計學課程中所使用的投影片已公開於網站上,網址為http://racco.mikeneko.jp/Kougi/。
二〇一七年一月
淺野 晃
感謝你拿起本書。
對我來說,在大學部工學部(大學理工學院)念書,已經是三十年前的事了,那時我們的必修課程中並沒有統計學。不過,現在的電腦與網路科技比那時還要發達許多,蒐集、處理大規模資料已是再尋常不過的事,使統計學成為一門應用廣泛的學問。最近很流行的「人工智慧」,也是在蒐集了非常龐大的資料以後,從中找出我們想要的答案,這可說是統計學發展的結晶。另外,許多大學的共同課程中,也加入統計學課程。不管學生是文組還是理組、主修哪個領域,統計學都成為了一門必備的學問。
若我開的統計課上有許多來自各個領域的學...
目錄
前言
第一部 數學準備篇
第一章 數學不是「UNO」,而是「Pageone」
1.1 數學不是「UNO」,而是「Pageone」
1.2 數學書的閱讀方式:數學家也不可能一目十行
1.3 本書的內容展望
第二章 狡猾的政客
2.1 狡猾的政客,會做出「可以實現的承諾嗎」?
2.2 「數學的邏輯」與「科學的態度」
2.3 邏輯與集合
2.4 回過頭來看「我不會做出無法實現的承諾」的意義
第三章 希臘字母看起來好帥
3.1 數學與數學式內的字母:變數與常數
3.2 「=(等號)」的各種意思
3.3 等號與方程式
3.4 不等號與不等式
3.5 為什麼要用希臘字母呢?
第四章 加法→乘法→次方,逐漸演進的計算方法
4.1 計算方式的發展
4.2 逆運算與平方根
4.3 指數的推廣
4.4 對數
4.5 符號Σ表示「把n個數加總」的意思
第五章 函數與數學式
5.1 以數學式表示函數
5.2 自變數與依變數
5.3 有名字的函數
5.4 畫出函數的圖
5.5 統計學與函數
第六章 從單位到微分、從合計到積分
6.1 「單位量」與「合計量」常讓人搞混
6.2 從單位到微分
6.3 從合計到積分
6.4 關於機率密度
第二部 統計學基礎篇
第七章 資料的分配、平均、變異數
7.1 統計學與屬量資料
7.2 「分散的資料」、「資料分配」
7.3 次數分配
7.4 直方圖
7.5 為什麼要取「平均」?各式各樣的平均
7.5.1 算術平均
7.5.2 幾何平均
7.5.3 調和平均
7.5.4 中位數
7.6 變異數
7.7 計算變異數時,為什麼要把數值平方呢?
第八章 相關、迴歸、決定係數
8.1 相關關係與相關係數
8.1.1 多變量分析與相關關係
8.1.2 散布圖
8.1.3 共變異數與相關係數
8.2 迴歸分析
8.3 決定係數:可以決定什麼呢?
8.4 為了求出迴歸直線
8.4.1 微分與極值
8.4.2 最小平方法與偏微分
8.5 補充:推導數學式
8.5.1 對最小平方法的數學式偏微分,推導出迴歸係數(式(8.3))
8.5.2 殘差與相關係數(式(8.5))
第九章 機率
9.1 為什麼統計的書會提到機率呢?
9.2 機率與「佔比」
9.2.1 由次數定義機率
9.2.2 拉普拉斯的定義
9.3 條件機率與「獨立」
9.4 機率的三大誤解
9.4.1 「誤以為獨立」
9.4.2 「誤以為機率相等」
9.4.3 「誤以為成本相同」
第十章 隨機變數與機率分配模型
10.1 隨機變數的概念
10.2 機率分配模型與常態分配、中央極限定理
10.2.1 機率分配模型
10.2.2 常態分配模型與中央極限定理
10.2.3 常態分配模型的性質
第三部 統計學進階篇
第十一章 推論統計與大數法則
11.1 推論統計是在做什麼呢?
11.2 次數分配與樣本的機率分配
11.3 大數法則,「通常」與「幾乎」
11.4 大數法則與保險
11.5 母體與樣本
第十二章 區間估計與檢定
12.1 區間估計
12.1.1 什麼是區間估計
12.1.2 常態分配與區間估計
12.1.3 信心水準與信賴區間的注意事項
12.2 不偏變異數、t分配與區間估計
12.2.1 不偏變異數
12.2.2 t分配與區間估計
12.3 檢定是「在某條件下的審判」
12.3.1 什麼是假說檢定
12.3.2 t分配與檢定
12.3.3 檢定的用語
12.3.4 雙尾檢定與單尾檢定
12.3.5 無法拒絕虛無假說的時候
12.3.6 關於顯著水準
12.3.7 「(在母體為常態分配,且顯著水準為5%的條件下)你在騙人」
第十三章 連續型機率分配與中央極限定理的意義
13.1 連續型機率分配
13.2 中央極限定理的意義
13.3 常態分配在現實中存在嗎?
第十四章 樣本平均的變異數:為什麼會是「樣本大小分之一」呢?
14.1 關於樣本平均的期望值與變異數
14.2 邊際機率分配與聯合機率分配
14.3 計算樣本平均的期望值與變異數的數學式
14.3.1 隨機變數的期望值
14.3.2 隨機變數之常數倍的期望值、隨機變數之和的期望值
14.3.3 隨機變數的變異數
14.3.4 隨機變數之常數倍的變異數、隨機變數之和的變異數
附錄 本書所使用的常態分配表與t分配表
索引
前言
第一部 數學準備篇
第一章 數學不是「UNO」,而是「Pageone」
1.1 數學不是「UNO」,而是「Pageone」
1.2 數學書的閱讀方式:數學家也不可能一目十行
1.3 本書的內容展望
第二章 狡猾的政客
2.1 狡猾的政客,會做出「可以實現的承諾嗎」?
2.2 「數學的邏輯」與「科學的態度」
2.3 邏輯與集合
2.4 回過頭來看「我不會做出無法實現的承諾」的意義
第三章 希臘字母看起來好帥
3.1 數學與數學式內的字母:變數與常數
3.2 「=(等號)」的各種意思
3.3 等號與方程式
3.4 不等號與不等式
3.5 為什麼要用希臘字母呢?
第四...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。