後真相時代來臨:謊言與該死的謊言

書摘

有句話大家可能都聽過:「謊言有三種,謊言、該死的謊言和統計數字。」雖然如此,在健康、政治、投資、教育,以及其他諸多領域中,我們還是要靠統計數字來做出正確選擇。統計數字不是謊言,只不過同樣是真相,統計數據比單純的數字更有可塑性。

平均值(average)是最常用的統計數字之一。為了估算某一族群的平均身高,要先測量可能至少其中七十五人的身高,再取這些樣本的平均值。或許有些人認為,像平均值這麼簡單的東西,不可能用來製造什麼矛盾真相。但你必須要知道,平均值可不只一種。首先,有所謂的平均數(mean):把所有樣本身高加起來再除以七十五。還有所謂的中位數(median):請這七十五人按高矮順序排列,那麼站在最中間的人的身高就是中位數。這兩個平均值可能是不一樣的數字。

誤導者在陳述事實時,可能會選擇對自己有利的平均數或中位數,乘機欺瞞不知道箇中差異的閱聽者。二○一四至二○一五年間,英國稅前所得中位數是二萬二千四百英鎊,同年稅前所得平均數則是三萬一千八百英鎊(兩個數值的對象都只有包含納稅人)。就算平均數明顯高得多,也沒什麼好大驚小怪的,畢竟這個社會的大部分財富都進了小部分人的口袋;雖然這些人幾乎無法對中位數造成影響,但他們擁有龐大的薪酬,仍然能夠大幅拉高平均數。

因此,在二○一五年,下列兩句敘述都是真的:教師月領二萬八千英鎊的薪水,比納稅人平均所得還要低。教師月領二萬八千英鎊的薪水,比納稅人平均所得還要高。大多數人並不會費心說明自己選用的是哪一種平均值,至於政治人物、工會領袖和倡議人士,則會刻意選用能支持他們意圖的平均值。

挑選有利數據

平均數還可以有其他使詐方式。許多家長很在意孩子學校的班級規模,一般都希望班級人數少一點,老師才有更多時間去幫助每一個孩子。因此政治人物往往熱衷於證明班級規模「平均起來」人很少,然而卻不代表一般孩子都能進小班級。

為了說明這個反直覺的現象,請你想像一下,假設鎮上唯一的學校只有兩個班級,一班有十個孩子,另一班有五十個孩子,那麼平均班級規模就是三十人。乍看之下還算合理,但事實上,鎮上大多數的孩子都在五十人的大班級裡。

政治人物談起某州或某國的平均班級規模時,總是一副信誓旦旦的樣子,但他們給出的數字,往往比實際的班級學生人數更低。針對擁擠的監獄、火車、醫院等議題,也可以應用同樣的手法。總之,國家或政府提出的平均數,向來低估了一般人的實際經驗。想想這道謎題:有一個男人的頭髮比平均長度更長,他走進一家酒吧後,酒吧裡的眾人頭髮平均長度就下降了。這是怎麼一回事?

這是一道很簡單的謎題,只不過當中包含一種有問題的統計觀點,稱為「辛普森悖論」(Simpson’s Paradox)。之所以說有問題,是因為同一個數字可以傳達兩個截然不同的真相。回答這道謎題前,讓我們先看一個真實案例。

二○○○至二○一二年間,修正通貨膨脹的影響後,美國薪資中位數上升了0.9%。36 這看起來似乎是好事。然而在同一時期,高中輟學者薪資中位數下降了7.9%,高中畢業者薪資中位數下降了4.7%,受過部分大學教育者薪資中位數下降了7.6%,擁有一個或一個以上大學學位者的薪資中位數則下降了1.2%。

簡單來說,雖然美國整體薪資平均值上升了,但個別經濟族群卻仍然面臨薪資下降的問題。

這下你明白這為什麼被稱為「悖論」了嗎?回頭看那個謎題,答案就取決於我說「比平均長度更長」時,指的是什麼意思。我指的並非「全部人口」的平均。雖然新來的男人頭髮長度比「全部男性」的平均頭髮長度更長,但那個酒吧裡也有女性,而且新來的男人頭髮長度比女性的平均頭髮長度更短。當那個男人走進酒吧,男性族群的平均頭髮長度變長了,女性族群的平均頭髮長度則沒有變化。因此酒吧裡所有人的平均頭髮長度自然就變短了。

解開辛普森悖論之謎的關鍵,就在於辨別「全體」和「個別群體」的差異。再仔細看看美國薪資下降的問題。難道個別群體不會隨時間變化嗎?和以前相比,美國現在有更多工作者具備大學學位。換句話說,在二○○○年,薪資最好的群體比薪資最差的群體多了更多人。因此,即使大學畢業者的薪資中位數下降了,他們大幅增加的人數還是能把整體平均值往上拉。

全體與個別群體是不同的層次,可以產生出不同的結論。

美國政治人物就是乘機利用這一點,才能信誓旦旦宣稱薪資上升和薪資下降。大多數人從沒聽過辛普森悖論,又缺乏統計方面的訓練,不知道像這樣互相矛盾的兩個真相可以同時並存,才會聽人家說什麼就信什麼。或者要是他們同時聽到兩種真相,說不定就乾脆不信統計數字了。

薪資上升了,有統計數字為證!

薪資下降了,有統計數字為證!

兩句話都對。

這下你知道人們為什麼會變得如此憤世嫉俗了吧。