如何讓人相信一句非常荒誕的話?加上一個數字就可以了!
「資料夠多,你想要有什麼結果,大數據就能給你什麼結果。」
你被數據欺騙的次數,可能比你吃的米還多!
◎人類的「正常體溫」是多少?
德國物理學家卡爾宣稱,他為100萬人測量了精確體溫,在統計了體溫結果以後,最終得出結論:正常體溫應該是37℃!
但其實,卡爾測量的是腋溫,並不適用其他部位測量體溫,這就體現出,這一數字結論本身帶有某種偏差。
「正常體溫」的定義並不精確,甚至是主觀臆想,但這種典型的「假精確」,幾百年來人們卻深信不疑。
◎職場上的加薪陷阱,你看出來了嗎?
老闆有一天良心發現,決定為每一位員工加5%!全體員工歡騰,覺得自己終於能「出頭天」了,更加賣力上班……
幫員工加薪?小心是老闆的「變相自肥」!
老闆的年薪是2000萬元,以5%計算,老闆能加薪100多萬!
「這一年每個人都能加薪5%」,遠遠比「我的加薪是你的幾百倍」溫柔得多,儘管這兩句話本質一樣!
◎你看到的,都是對我有用的數據
該網站訪問量日成長率達800%──其實該網站1月3日訪問量只有10,而一月4日訪問量到達90。
有35%的被調查者購買了本產品──這個例子一般會用在公司強調產品的受歡迎程度。但公司顯然刻意隱瞞了另一點,那就是消費者購買後,有80%的人強烈要求退貨!
◎比詐騙集團更恐怖的,是大數據時代的合法詐騙
本書全面介紹了各種類型的數據陷阱,剖析詳細生動的案例,最後列出了幾項避免數據陷阱的妙招,幫助大家在工作、讀書學習、購物等日常生活中,更容易辨識出數據騙局!
在這個假精確時代,你還甘心被騙走這麼多錢跟時間嗎?
作者簡介:
李凱,數學與應用數學系,高級軟體工程師,擔任過數據分析師、專案經理等職務。主要從事大數據環境下的商業數據分析,設計酒店、金融證券、建築和行動通訊等多個行業。
作者序
前言
世界上有三種謊言:謊言、該死的謊言和統計數字。
首先要掌握事實,然後你可以隨意歪曲它們。
——馬克‧吐溫
我們生活在一個資訊大爆炸的年代,周圍充斥著越來越多的資訊。我們要做的就是如何儲存與提取資訊。資訊如此之多,真假莫辨,好多人全盤接收,結果吃了虧。不過,吃一塹長一智,人們對周圍的資訊越來越有免疫力,質疑聲從來沒有斷過。
應了那句老話,「道高一尺,魔高一丈」,虛假資訊總會在不知不覺中侵入我們的大腦,影響我們的決策。
數字作為資訊的一種,其中蘊藏的陷阱不知有多少,數都數不清。這些數字陷阱隱藏得很深,如果稍不注意,就會掉入其中,損失慘重。
當看到我說的這句話時,你可能會驚呼一聲:「對,我就遭遇過一次數字陷阱!」
當我問你時,你可能會提起你在商店購買蔬菜時的缺斤短兩,也可能會提到在商場購買商品的時候遇到的折扣陷阱。你會後悔,太不應該追逐眼前的小利了,結果落入商家設計好的陷阱中。
你可能只是遇到過少量的數字陷阱,並不清楚這大千世界數字陷阱何其之多。在看完本書之後,不要害怕,但請在今後擦亮你的眼睛,找到我提出的這些陷阱,維護好自己的利益。
數字陷阱整體來說分為兩種類型,一種是人為故意製造的陷阱,目的很明確,就是為了欺騙大家,增加自己的利益。另一種就是人們無意中製造的數字陷阱。可能是因為認知能力不夠,也可能是在哪一方面有所疏忽,數字陷阱就悄無聲息的來到我們的面前,我們再走一步,就會落入其中,而結果往往正是那樣。
數字一出現,往往會讓最冷靜的頭腦發熱,做出衝動的事情或者不理智的決定。二十世紀發生在美國的「麥卡錫主義」就很好的詮釋了這一觀點。
一九五〇年二月九日,美國參議員約瑟夫•麥卡錫宣稱美國政府徹底被共產黨黨員滲透。他偽造了一份名單,上面有兩百零五名隱藏在美國政府裡的共產黨黨員,但他並沒有給出準確的名字,只是拿出了一個看似確切的數字。
不僅如此,這個數字不是一成不變的。他一開始聲稱名單上有五十七人,在二月二十日他又改口說有八十一個不忠誠的隱患人員。麥卡錫很明顯沒能一次性編造出這些數字來。事實上,早在一九四七年,美國政府就對國會中的一百零八位職員進行了「忠誠度調查」。他們的忠誠度備受懷疑。至一九四八年,僅有五十七人仍受僱於國會。
我們可以試想是這份調查洗清了這五十七人的冤屈,也可以像麥卡錫一樣說他們是「政府承認的共產黨員」。「八十一人」這個數據正是從這份涉及一百零八人的調查中得出的。與此同時,另一份一九四六年呈遞給國會的報告得出共有兩百零五個共產黨黨員,那份報告證實兩百八十四個有潛在安全隱患的人員中已有七十九人被裁。
美國政府加緊防禦,匆忙要求麥卡錫證實他的數字來源。麥卡錫卻絲毫不在意這件事。他只是輕描淡寫的說:「我不回應指控,畢竟我才是控方。」
他的名單影響如此重大,以至於這種效應形成了一個專有名詞「麥卡錫主義」,專用於指製造冤假錯案的慣用做法。麥卡錫作為一個典型的反面教材,也告訴了我們數字可以怎樣被濫用。他只是隨意的扔給擔驚受怕的大眾幾個數字,就使他們恐懼起來,並引起一場政治迫害。
本書意在揭開數字陷阱的面紗,還你一個真實的數據世界,爭取將生活中、廣告裡、單位機構營運,乃至現今最炙手可熱的網路世界,將各個方面的數字陷阱一網打盡,幫助你遠離欺騙,維護自身的利益。數字陷阱不可怕,它就是一隻紙老虎,只要我們掌握正確的方法,堅持理智,這種陷阱很快就會被填平,讓我們一馬平川的大踏步前進。
在即將到來的大數據時代,數字陷阱還會有其他更加隱蔽的表現形式,應用本書所講述的方法,我們一起來辨別,並提高我們的「數字免疫」能力。
前言
世界上有三種謊言:謊言、該死的謊言和統計數字。
首先要掌握事實,然後你可以隨意歪曲它們。
——馬克‧吐溫
我們生活在一個資訊大爆炸的年代,周圍充斥著越來越多的資訊。我們要做的就是如何儲存與提取資訊。資訊如此之多,真假莫辨,好多人全盤接收,結果吃了虧。不過,吃一塹長一智,人們對周圍的資訊越來越有免疫力,質疑聲從來沒有斷過。
應了那句老話,「道高一尺,魔高一丈」,虛假資訊總會在不知不覺中侵入我們的大腦,影響我們的決策。
數字作為資訊的一種,其中蘊藏的陷阱不知有多少,數都數不清。這些數字陷阱隱藏得很深,...
目錄
前 言
第一章 數字也會說謊
一、數字並不是你看起來那麼龐大
(一)網路上的「大數字」
(二)教育中的「大數字」
(三)生活中的「大」數字
(四)缺乏對比,數字大小未可知
二、這些數字是捏造出來的
(一)網路造假
(二)票房造假
(三)胡亂預測
三、看穿數字中的「假精確」
(一)廣告中的「假精確」
(二)生活中的「假精確」
四、數字真實,包裝後也會認不出
(一)你看到的,都是對我有用的
1.醫學研究中的「最優選擇」
2.經濟數據中的「最優選擇」
3.商業上的「最優選擇」
4.媒體報導上的「最優選擇」
(二)指鹿為馬,無效的比較
1.生活中的數字陷阱
2.票房中的數字陷阱
3.工作中的數字陷阱
(三)改一改,數據變了樣
1.平均值,典型值?
2.圖表,徒有其表
五、拙劣的數字謊言
(一)廣告中的數字謊言
(二)網路中的數字謊言
(三)投資中的數字謊言
(四)所謂的「公式」
第二章 風險中的數字陷阱
一、虛假的「小」風險
(一)科學中的「小」風險
(二)金融中的「小」風險
二、虛假的「大」風險
(一)科學上的「大」風險
(二)生活上的「大」風險
三、風險也分相對與絕對
(一)科學上的風險
(二)生活上的風險
四、科學謠言扎根於數字陷阱
(一)「大」數字
(二)風險「相對論」
(三)關聯不是因果
(四)毫無意義的比較
(五)離開劑量談毒性?請不要耍流氓
第三章 注意:迴歸分析也有陷阱
一、數字相關≠因果聯繫
(一)醫學上的數字陷阱
(二)網路上的數字陷阱
1.機緣巧合產生的相關關係
2.聯合變動
3.顯著相關性,變量之間毫無影響
二、A和B,哪個是因?哪個是果?
(一)科學界的因果倒置
(二)經濟上的因果倒置
(三)學習上的因果倒置
(四)廣告上的因果倒置
(五)教育上的因果倒置
三、遺漏變量,分析有誤差
(一)學校考試成績中的數字陷阱
(二)健康上的數字陷阱
(三)機率上的數字陷阱
1.環境謬誤——假設整體的機率就是個體的機率
2.獨立性謬誤——需要證明獨立性,卻假設獨立性先驗存在
3.檢察官謬誤
四、無關變量太多,結果無意義
五、預測趨勢胡亂分析,結果很可笑
第四章 統計調查,數字陷阱的重災區
一、樣本數據不足,離正確結論失之千里
二、資料不相配,何談正確結論
(一)媒體的不相配數據
(二)廣告中的不相配數據
(三)醫學上的不相配數據
(四)公司營運中的不相配數據
三、樣本選取錯誤,系統誤差不可避免
四、人性弱點,被調查者不一定說真話
五、問題問得好,被調查者才會答得好
第五章 廣告中的數字陷阱
一、徵才廣告有隱情,虛假薪資誘人心弦
二、商品折扣增加四〇%,你是否心動?
三、裝潢陷阱玩弄低價數字遊戲,你能看清嗎?
1.展開面積≠投影面積
2.單位不同,小心有詐
3.外牆面積與內牆面積
4.圖紙與預算書中的尺寸要一致
四、公司產品滿意度九九‧八%,幌子不少
五、廣告中的辛普森悖論
(一)藥物 vs 安慰劑
(二)考試成績
(三)吸菸與健康問題
六、數字形式巧變樣,感覺不一樣
(一)模糊字眼
(二)「大」數字
(三)精確數字
七、價格就怕比,弄得消費者沒主意
(一)第一個數字
(二)消費者的中庸之道
(三)我們只是缺少一個購買的理由
八、特價房屋,特價可能只是錯覺
第六章 網際網路的數字陷阱
一、婚戀網站陷阱多,機器人帳號遍地開花
二、網路金融,產品收益說得不可靠
(一)年化收益率一六%?零風險?
(二)貨幣基金收益八%?
(三)高收益吸睛,文字遊戲?
三、你的粉絲究竟有多少是虛假的?
四、網際網路的KPI,內幕真不少
1.用戶註冊數
2.活躍用戶數
3.用戶瀏覽數
五、網路上有排行,灌水太多不可靠
(一)品牌榜
(二)暢銷榜
(三)信譽榜
(四)排名應有准入門檻
(五)網路平台當擔責
六、直播平台很熱門,隱情很多,湊成堆出現
七、流傳二十多年的假數據,是時候拆穿了
八、網路數據造假為何頻頻出現?
第七章 企事業單位營運的數字陷阱
一、學校考生真是不同凡響,你關注上榜人數的背後了嗎?
二、藥價下降了,你覺得醫藥費真的會少嗎?
三、霧霾減輕了,真的是車輛限行的原因嗎?
四、電視收視率有那麼簡單嗎?
(一)收視率的玄機
(二)收視率為零?
(三)收視率 vs 收視占比
五、上市公司融資額,造假危險且愚蠢
(一)上市潛力股公司
(二)上市企業所投公司
六、高鐵上座率大於百分之百,有的車廂還沒人?
七、可恨的誘餌式標題,死亡率可不能這麼對比
第八章 生活中的數字陷阱
一、攤販找你小錢,先不要著急走開
(一)耍賴裝傻
(二)障眼法
(三)墊秤
(四)耍秤
二、步數多,健康也不一定會來
1.步數≠運動強度
2.生活步數≠運動步數
三、有折扣就便宜?可沒有那麼好的事
(一)折扣陷阱
(二)贈品陷阱
四、體重減輕,減肥就成功?
(一)越減越肥
(二)失戀減肥
(三)紋絲不動的體重數字
(四)瘦卻乾癟著
(五)身材好,體重卻沒變
五、視力度數就一定可靠?小心近視
六、葡萄酒看年份,這種常識不可輕信
七、前面有坑,小心掉入中獎陷阱
八、二手車看里程數,多長心眼別被糊弄
第九章 避免數字陷阱有妙招
一、大數據的困局,N≠所有
二、大數據,用小規模實驗求證
三、尋找偏差,不要被權威迷惑
(一)有意識的偏差
(二)無意識偏差
(三)將資料與權威人士劃清界限
四、問自己,是否遺漏了什麼?
(一)缺乏比較
(二)遺漏原因
五、拆穿偷換概念的把戲
(一)統計口徑不同
(二)口頭回答不可靠
(三)目的不同
(四)無理比較
(五)標榜第一
(六)文字遊戲
六、用提問將毫無意義的數據打回原形
前 言
第一章 數字也會說謊
一、數字並不是你看起來那麼龐大
(一)網路上的「大數字」
(二)教育中的「大數字」
(三)生活中的「大」數字
(四)缺乏對比,數字大小未可知
二、這些數字是捏造出來的
(一)網路造假
(二)票房造假
(三)胡亂預測
三、看穿數字中的「假精確」
(一)廣告中的「假精確」
(二)生活中的「假精確」
四、數字真實,包裝後也會認不出
(一)你看到的,都是對我有用的
1.醫學研究中的「最優選擇」
2.經濟數據中的「最優選擇」
3.商業上的「最優選擇」
4.媒體報導上的「最優選擇」
(二)指鹿為馬,無效...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。