本書的基本概念
我們所知道的,遠比我們自己認為的還要多。信不信由你,我們長年的經驗,其實早就讓我們具備看透數字的能力。而這就是本書的基本概念:我們不用讀者不熟悉的觀點來震懾讀者,反而是要讓他們看清楚自己已經知道多少,並善用這些知識來發掘數字背後的真相。
這本書所強調的原則,幾乎每個人在生活中都使用過,也熟諳其中道理。比方說,每個人都知道把波浪誤認為是潮汐,是一件完全沒有常識的人會做的蠢事,你可能不相信,只要擁有這種程度的知識,就能夠分辨測速照相機是否真的能夠挽救所有人的性命。
本書的目的,就是要幫大家運用自己身上的知識,來破解看似奧祕的數字,讓大家用日常生活的經驗,來了解那些數字的涵義。換言之,如果這本書確實達到我們當初設定的目標,那些以往在你眼裡有如無字天書般難解或嚇人的數字,將會變成通俗的白話文。接下來,就讓我們來看看幾個有趣的例子。
數字大不大?
只要數字到了千萬以上,對某些人來說,就變成有聽沒有懂的天文數字。你可以發現,只要遇到比普通年薪或一般貸款金額大的數字,很多人的腦袋立刻打結。無論是七百億,還是七兆,如果這些數字聽起來都一樣,在晚間新聞裡總是讓人看得一頭霧水,大概是因為它們沒被拆解,以人類尺度來看。只要記得一個小訣竅:把這些數字想成秒,一百萬秒約等於十一天半,十億秒則差不多是三十二年之久。運用這種邏輯,以人類尺度來看這些數字,它們就會變得比較和藹可親。
舉個例,二○○七年一月,英國政府大肆宣布將提撥一千萬英鎊的預算,「振興」小學的歌唱與音樂教育。一千萬英鎊,看起來好像很大,但這個數字應該附加下列說明:全英有大約一千萬個學童,幾乎有一半都在念小學,將一千萬英鎊平均分配給五百萬個小學生之後,這筆預算到底可以振興出什麼結果?
這就是破解天文數字的方法:讓數字變得有意義的最佳工具,就是以人類尺度來看。丟開腦中的刻板印象,不要再認為很多零就等於大,強迫自己做一些小小的運算,把數字除以相關人數,你會發現,這些以往看來有如天體般龐大的數字,霎時就變得微不足道。總之,判斷一個數字是大是小的時候,應該把它切成個人的等分,讓每個人都可以問:「如果只看我的這一份,數字還是很大嗎?」
一、二、三、四、五,如何算清楚?
統計有一項基本原則,那就是為了要產生數字,一定要先定義並確認計算項目,千萬別小看了細節可能造成的差距。首先,得同意要算什麼,這有什麼困難的?讓我們來看一個有趣的例子──牧場上的三隻綿羊:
我們要數什麼?
綿羊。
有幾隻?
三隻。
但其中一隻是小羊,牠算是一隻羊,還是半隻?此外,有一隻懷孕的母羊即將生產,牠算是一隻?兩隻?還是一隻半?(假設牠懷的不是多胞胎。)全部總共有幾隻?依我們對統計項目定義的不同,總數可能是二、二•五、三、三•五或四隻。對一個小數目來說,這個差距的範圍已經相當廣,其中有個答案居然可以大到是另一個答案的兩倍。在現實世界中,含混計算只會讓事實被扭曲。
我們可以暫時建立出一個簡單的數數規則:一個依照某種定義計算出來的數字,大多扭曲了部分事實。雖然這是非常古老的知識,但人們總是習慣遺忘這項規則。永遠別忘了問:「對於計算出來的結果,我是否感到滿意?」簡單地講,就是:一、二、三是 A ,四、五還算 A 嗎?
有沒有可能?那不是老虎
黑暗中,是誰鬼鬼祟祟地企圖想要毀滅一切?二○○三年十一月五日的營火之夜,接近午夜時分,西米德蘭衛修鎮外(Wishaw, West Midlands),有人意圖不軌,自認為替天行道。
不管肇事者是誰(從來也沒有人被起訴),總之有人帶來了繩索和搬運工具,在幾分鐘之內,把位於市郊賽馬訓練場和牧場之間,一座擁有十年歷史、二十三公尺高的行動基地台連根拔起,推倒在地上。基地台的訊號恰好在半夜十二點三十分停止,警察沒有找到任何目擊者,隔天早上,抗議人士包圍著倒下的基地台,拒絕讓業主 T Mobile 公司移走或更換基地台。抗議群眾的代表律師不准地主接近,因為那代表穿越別人的私人產業。抗爭行動很快就變成全天候的警戒,雙方都雇了保全公司沿界巡邏。
鎮民的激烈抗爭,起因於絕望,因為自從基地台設立了之後,周圍五百公尺內的二十戶人家,已經有九個人罹患癌症。他們一直到現在仍始終相信,這件事怎麼可能是偶然?除了基地台的電磁波之外,還有什麼原因可以解釋,一個地方為什麼會有這麼多的病例?
想知道為什麼?請站在地毯上(最好選一張毛不會太長的,並把吸塵器準備好),拿一袋米來打開袋子,然後……把米全部倒出來。你的目標是,把整包米拋向空中,讓米粒像雨點般落下。
這麼做,是為了看米粒在地毯上分布的機率。請你特別觀察米粒散落的方式,你會發現,它們大都不是平均地落下,而是偏重某個地方,所以常會造成某堆米特別高,和其他米不一樣:那堆米形成了一個群集。
只要是癌症發生率高的地方,人們都希望能夠有個合理的解釋。透過上述那包米,大家可以看出類似的形式,你可以把每顆米粒,想像成國內的一個癌症病例。從這包米可以看出,單純由機率造成的群集,是能夠被預期的。如果米粒均勻地散布成一層,那才是奇怪。同樣地,如果疾病的發生,在全國人口平均分布,那也很奇怪。
大家很容易就會相信,米粒的分布純屬機率,而疾病的發生,則一定事出有因,但這種想法是錯誤的。「機率」並不純屬偶然,有很多原因能夠影響米粒落下的位置,如:氣流、手勁、每粒米最初在袋中的位置等,而癌症在這方面(也只有在這方面),通常沒有什麼差異。雖然看起來好像有什麼意義,但除了偶然之外,真的別無其他涵義。
我們大家都是天生的直覺動物,下意識就會知道有哪些事是合理的,哪些事又與我們的想像相悖。一旦遇到這些「感覺」起來好像不那麼順的事時,我們本能地就會想要追根究柢。有人對此提出一個似乎還滿有道理的論點,認為只要外頭有任何的風吹草動,我們就會提心吊膽的原因,是人類進化的結果。為了延續生命,安全總比遺憾好,所以我們只要看到樹叢間投射出來的光線,以及樹葉飛舞的樣子,就會以為自己看到了老虎,然後拔腿就跑。
但這種根深蒂固、不求甚解的習慣,卻讓我們成了最差勁的統計員,隨隨便便就做出結論。模式通常是機率造成的結果,但我們很難說服自己去相信這個事實,所以我們會問:「老虎在哪?」統計員會說﹕「沒有老虎。不過又是機率這個騙子,在施展它的老把戲。」既然我們已經從叢林中進化出來了,我們就應該記住自己對於機率的經驗,並在重要時刻,迅速控制本能。
平均的真相
荷蘭經濟學家潘正(Jan Pen)有個很有名的比喻方式,他將全世界人的身高,比喻成他們擁有的財富(請注意他比喻的是「財富」,不是「收入」)。每個人的高度,都和其擁有的財富成正比,然後排成一列。一個擁有一般水準財富的人,其身高也會是一般高度。整支隊伍從最貧窮的(最矮的)人開始排,過了一個小時之後,隊伍末端是最有錢的(最高的)人。
開始排隊後的二十分鐘之內,我們還看不見半個人,因為此時排隊的,要不是財富為負值(負債比財產多),就是一無所有的人,所以他們的身高是零。直到整整三十分鐘後,才開始有六吋高的小矮人出現。然後,小矮人一個接著一個加入,直到第四十八分鐘,才會看到擁有平均身高(平均財富)的人出現,但此時,排隊的人口,已經超過全世界四分之三的人口。
是什麼延遲了平均值,讓它在大多數人口都加入隊伍之後才出現?答案是:那些排在更後面的人。潘正寫道:「最後幾分鐘,巨人們紛紛現形……不怎麼成功的律師,八英尺高。」當一個鐘頭快要結束的時候,排在隊伍後面的人,高到我們看不見他們的頭。潘正說,當時排在最後的是美國石油大亨約翰•保羅•蓋堤(John Paul Getty),當時比爾•蓋茲(Bill Gates)和華倫•巴菲特(Warren Buffett)的財產,還沒有達到全盛時期。蓋堤的身高令人屏息,可能有十英里高,也可能還要高上兩倍。
一個百萬富翁對於平均值的影響,遠大於成千上萬個貧民,而億萬富翁的影響力,則又大了一百倍。他們的影響力,大到讓全世界八○%人口的財富,低於平均值。在日常言論中,每每提到「平均」,往往代表了低下或鄙視。但對於薪資來說,平均值卻相當高。在問平均薪資時,也許我們不會想知道金字塔頂端的人收入有多少,只想了解普通人的狀況。重要的是,你得知道什麼該計算,什麼該剔除,確定自己已經完成了自己想要的組合。平均值是一個概略,有用,但所有的概略都是一個樣。如果你不知道它只是個摘要,就會被它誤導。
風險有多大?把它個人化
二○○五年一月,英國國家放射防護局(National Radiological Protection Board)局長宣布,一項針對手機的新醫學研究指出,為了降低風險,孩童應該避免使用手機。毫不意外地,這項宣布又引起各大媒體沸沸揚揚的報導。局長發表的建議,是引用瑞典卡洛林研究院(Karolinska Institute)的一篇論文,該文指出,長期使用手機與較高的腦瘤風險(稱為聽神經瘤)有關。但風險到底有多高?新聞中指出,手機會讓風險提高兩倍。
又來了,幾乎沒有一則報導提到風險基數,或是依照人類數數的直覺,去計算一下風險產生的病例數。在所有全國性報紙與電視新聞節目中,我們只找到唯一的例外,那就是英國廣播公司網路新聞的一則報導。風險提高兩倍聽起來好像很嚴重,可能吧!但就像跑步一樣,兩倍快也可能是烏龜賽跑。
關於手機與腦瘤,你可以先從認識這些腫瘤不是癌症開始。它們會長大,但只是有時候會,而且速度通常很慢,或是在大到某種程度就停止。這種腫瘤造成的問題之一是:當它們持續變大,壓迫到周圍的腦組織或是聽神經時,可能必須切除。該研究指出,這些腫瘤在一般使用手機的情況下,至少十年後才會出現。在你掌握了所有的資訊之後,記得問那個最簡單的問題:「這個數字大不大?」要了解比較的基準。
事件暴發幾天後,我們訪問了最初的研究人員之一──卡洛林研究院的瑪麗亞•費區廷(Maria Feychting)。她告訴我們基數是○•○○一%,也就是說每十萬人約有一人,這是一般不使用手機的人,會得到聽神經瘤的機率。在正常情況使用手機十年後,所謂的兩倍風險,就是○•○○二%,也就是說,每十萬人約有兩人有可能得到聽神經瘤(但如果測量比較常用來聽手機的那隻耳朵,機率可能會更高)。所以,定期使用手機,可能會讓使用者增加○•○○一%的風險,或是說手機族每十萬人當中,有一人可能會長瘤。
費區廷會不會禁止自己的小孩使用手機?並不會,她寧願知道他們身在何處,可以打電話給他們。她也提出警告,表示研究結果是暫定的,因為研究的規模很小,一旦擴大抽樣後,可能會產生不同的結果。她表示,事實經常如此,這類風險似乎會隨著更多證據,與更大型研究而縮小。
兩年以後,這個全球性研究團隊,再度調查無線對講機對健康的影響,卡洛林研究院也參與其中。這次研究提出了另一份報告,利用更多樣本取得新的結果,最後指出沒有證據顯示,聽神經瘤的風險會因為使用手機而提高,稍早研究結果的數據,純屬統計上的偶然,在這次較大型的研究中已不存在。
從我們看過的許多例子可知,疾病風險、犯罪率、車禍次數等各種機率,有很多數字的百分比升降,都有一樣的問題,深受蒐證方法的影響。因此往後我們再看到各種風險數字時,可以做出以下反應:把增加的百分比,當作是兩個人在比賽跑步,當人家告訴你風險提高時(其中一個跑者,以驚人的比例遙遙領先),一定要記得問,另一個跑者的速度有多快(也就是基數為何),不要被差異度所騙。最理想的情況是,報導風險應以人數的計算為依據,就像人類數數的直覺一樣,盡量少用百分比來表示,應該鼓勵新聞官員也一樣,然後我們就可以問:增加的風險,會在每百/千人中,影響到多少人?
本書包含的例子
本書能夠讓你們了解下列這些問題:有多少人賺錢,多少人欠錢?多少人是有錢人,多少人是窮光蛋?政府今年的支出,是否把錢花在刀口上?施政目標又讓幾家歡樂幾家愁?排行榜上的順位,是否映照出真實的情況?測速照相機到底救了多少條人命?在每四個英國青少年當中,是不是就真的有一個人犯罪?每位女性多喝一瓶酒精飲料,罹患乳癌的風險,是不是真的比同齡女性高出六%?
此外,通膨數字、伊拉克戰爭死亡人數、感染 HIV/AIDS 的人數、北海漁獲量、英國刺蝟量、判斷罹患癌症的準確率、英國能夠領到退休金的人數、健保局的赤字、讓孕婦空焦急的不準預產期、第三世界的外債、全球暖化的各項數字等,實際上到底又是怎麼一回事?
現在,幾乎沒有一個議題不會談到與尺寸、數量、預估值、排名、統計數、達成率等有關的數字。數字無所不在,而且常常引起爭議,如果我們對其中任何一個數字,稍微有點興趣的話,就應該試著把它們拆開來看,而這本書會告訴你該怎麼做。