因果關係可以多糾結?數據中的微光—花生與井水

書摘

科學家們熱衷於探究原因,但對原因的探究往往是一個漫長而不見得有結果的過程,而且所得出的結果恐怕也不見得有重要的意義。為何探究原因是如此的艱難?以下我們將從兩個探詢原因的經典科學故事說起,來看看表面上很勵志的科學故事,在因果關係的議題上可以有多糾結。

黃麴毒素與蛋白質

在2004年出版的《救命飲食》(The China Study,但談的是營養學研究成果而不是政治學論述)這本暢銷書中,兩位坎培爾(Colin Campbell & Thomas Campbell II)教授描述了一個關於黃麴毒素與食物蛋白質攝取的故事,是一個以流行病學研究為起點,延伸至分子生物學研究的經典傳奇。1960年代,為了解決菲律賓兒童營養不良的問題,國際組織規劃利用花生的高蛋白,作為菲律賓兒童補充蛋白質的來源。但有個潛在的問題,保存不當的花生容易有黃麴毒素(aflatoxin),而黃麴毒素是嚴重的致癌物質之一,尤其是肝癌。所以,這個推動計畫得同時解決兩個問題,一方面要用花生的高蛋白解決營養不良的問題,另一方面又要避免花生的黃麴毒素感染問題。

對研究人員來說,首要任務是弄清楚在菲律賓的人口中,哪些人有攝取到黃麴毒素,以及哪些人有得到肝癌。研究發現,當時菲律賓的市售花生醬含黃麴毒素是美國法規可接受的300倍,但整顆販售的花生則沒有明顯的黃麴毒素污染,未超過美國標準。經調查,這個差別源於菲律賓花生加工廠的運作方式,長相漂亮的花生被挑選裝罐整顆販售,但賣向不佳以及有長霉的則被做成花生醬販售。研究進一步發現,食用花生醬的主要人口為兒童,而攝取花生醬越多的人口,得到肝癌的機率越高。

以上的研究似乎驗證了先前對於黃麴毒素的致癌性研究,但故事還沒完,接下去的故事令人聽來有點驚恐。研究人員發現,在菲律賓有高比例的孩童得到肝癌,但是在西方國家,肝癌主要的患者是40歲以上的成年人。更令人疑惑的問題是,調查顯示,這些得到肝癌的孩童,主要是那些高所得而提供較佳營養來源的家庭中的小孩,這些家庭提供較多的蛋白質(如動物性蛋白質)給孩童。換句話說,攝取較多蛋白質的孩童,就是那些主要得到肝癌的小孩。

這個結果令研究人員感到難以理解,因為根據國際調查,肝癌的發生一般與蛋白質攝取成反向關係,也就是說蛋白質缺乏是肝癌的指標。但菲律賓剛好相反,攝取越多蛋白質的孩童越會得肝癌,而解決菲律賓兒童營養問題的目標,就是要增加蛋白質攝取,這不就剛好適得其反嗎?

同一時間,研究人員注意到從印度發的一篇奇特研究報告,報告中描述兩組大鼠(rat),這兩組都被餵養一樣多的黃麴毒素,但其中一組被餵養蛋白質含量20%的飲食,而另一組被餵養蛋白質含量5%的飲食。研究結果顯示,那一組吃蛋白質含量20%飲食的每一隻老鼠都得到肝癌,但另一組沒有任何一隻得到肝癌。在餵養黃麴毒素的情況下,吃越多蛋白質,越易得肝癌。對大鼠來說,蛋白質是使得致癌物黃麴毒素發生「致癌」效果的元凶之一。後續的分子生物學研究顯示,蛋白質確實會透過影響代謝黃麴毒素的酵素,來影響肝癌的形成,但細節在此就不多說了。

補充說明

個例因果關係與類型因果關係

在文獻中,通常會區分事件個例(event token)間的因果關係,以及事件類型(event type)間的因果關係。事件個例一般被理解為事件類型的個別例子,例如「地震」這個事件類型的兩個事件個例是「今天早上的地震」以及「昨天早上的地震」;「房屋倒塌」這個事件類型的兩個事件個例是「今天早上的房屋倒塌」以及「昨天早上的房屋倒塌」。事件個例間的因果關係,例如「今天早上的地震造成今天早上的房屋倒塌」,一般稱為個例因果關係(token causation)或是真實因果關係(actual causation),這種因果關係是哲學文獻中討論較多的因果關係;事件類型間的因果關係,例如「地震造成房屋倒塌」,一般稱為類型因果關係(type causation),科學文獻中討論較多的是這類因果關係。一般來說,本書中討論的是事件個例還是事件類型,在文意的脈絡上皆可被輕易區分。

井水與烏腳病

相對於黃麴毒素與蛋白質的研究,臺灣關於烏腳病與砷的研究,也是一個從流行病學為起點,延續到分子生物學研究的經典案例。

1950年代,嘉南部分沿海地區鄉鎮爆發烏腳病疫情,引發政府重視,臺大醫院及公衛研究所被委任進行調查。臺大研究團隊發現,烏腳病流行地區的居民有兩種井水可以飲用,一種為淺水井,深度為3到5公尺,另一種為深水井,深度為30到100公尺,因地層下陷,所以淺水井的水較鹹,因而居民多飲用深水井。研究人員發現,飲用深水井的居民得烏腳病的比例高於飲用淺水井的居民。而進一步分析淺水井與深水井的差異,發現深水井的砷濃度含量特別高。

研究指出,砷的攝取除了與烏腳病的發生有關,也與皮膚癌及其他內臟癌症有關,包含肺癌、腎臟癌等等。進一步研究發現,砷的攝取與動脈硬化相關,因而砷的攝取也與心臟病、腦中風、糖尿病、高血壓等疾病相關。後續研究更發現,因為砷進入人體後,會快速的分布全身,因而也與其他各種疾病的發生有所關連。

與砷相關的分子生物學研究及病理學研究持續進行中,研究成果非常豐碩,如砷會引發血管病變,因而造成病變血管周邊血液供應不足而導致烏腳病。其他更多的研究細節,在這裡就不多說了。

可以有多糾結

關於以上兩個科學研究的故事,一方面看來是一個漫長的科學研究成果簡短報告,另一方面,我們也看出這些研究在因果議題上的掙扎,可對研究成果提出一些思考上的省思。

從相關性到因果性議題

在以上的兩個故事中,我們第一個可以省思的議題是所謂的從相關性(事件間伴隨出現)到因果性(事件間有因果關係)議題。從攝取黃麴毒素與肝癌的相關性存在,是否可得出黃麴毒素造成肝癌?(黃麴毒素是肝癌的原因)從飲用深水井水與烏腳病的相關性存在,是否可以得出深水井井水造成烏腳病?

相關性是否就是因果性這個議題,最明顯的對比是我們可以區分所謂的「指標」及「原因」。一個腹痛的孩童血液中白血球的數量超高,可被視為盲腸炎或其他體內病變的「指標」,因為白血球數量高與體內發炎有相關性,但白血球數量高不是盲腸炎的「原因」,而是盲腸炎造成白血球數量高。溫度計的讀數變化是溫度變化的「指標」,之所以是指標是因為溫度計的讀數變化與溫度變化有相關性,但溫度計的讀數變化不是溫度變化的「原因」,因為這個相關性來自於溫度計的讀數變化與溫度變化有共同的原因。

其實,訴諸相關性到因果性的推理,常常會具有誤導性。上醫院看病的人中有病的人,比例高於沒上醫院看病的人,所以上醫院看病是生病的原因?(請注意,這個推論模式與從深水井與烏腳病的相關性,推論到深水井導致烏腳病是一樣的。)年輕人中低薪的比例高於不年輕的人,所以年輕是低薪的原因?(若果真如此,我們就慢慢等老薪水就會變高了。)

相關性與因果性的問題,在先前的兩個科學故事中更顯複雜。就黃麴毒素與蛋白質的關係來說,飲食中蛋白質的比例會觸發黃麴毒素引起肝癌,在這個情況下,我們該說黃麴毒素引發肝癌(因而是肝癌的原因),還是說飲食中的蛋白質是肝癌的原因?這兩個說法好像都怪怪的,而或許我們的因果概念根本就是含糊不清,需要被更細膩的區隔。

不管如何,相關性是因果探究的一個重要數據及起點,而當科學家接收這個數據後,下一步究竟要怎麼做,才是重要的議題。

比例議題

雖然我們或許最終承認黃麴毒素會致癌,深水井水會導致烏腳病,然而,並不是所有吃那麼多黃麴毒素的人都會得癌症,也不是喝深水井水的人都會得烏腳病,如此看來,黃麴毒素真的是得癌症的原因?而飲用深水井水是得烏腳病的原因?如果是,為何有些人不會得?

在科學中探討「原因」的時候,常常不是全有全無的情況,而是一個比例的問題,所以科學家常說是「致病因子」而不說是「致病原因」。然而,我們便可進一步追問,對那些得病的人是因子,但對那些沒得病的人也是因子嗎?說「因子」來取代說「原因」,其實沒有讓事情變的更清楚。

因果判斷中的比例議題,背後顯現的是因果關係的特異性(specificity),所謂的致病因子或原因,只是針對特定的人口或東西才有致病性,而比例議題,顯現的是我們對於哪些人才會得病以及那些人為何得病,瞭解不夠深入,對於複雜的相關影響因素瞭解不多,需要更多的研究來發掘真相。

應用議題

而因果關係中的比例議題所引發的特異性議題,影響到因果判斷的應用議題。研究因果關係,有重要的實用目標,我們要藉以進行對未來的預測(執行死刑是否會降低犯罪率?)、行動的選擇(買A股票還是買B股票才會賺錢?),及政策的制訂(在幼稚園推動雙語教學,是否會增加未來公民的國際競爭力?)。當比例議題的現象存在(也就是並非全有全無),我們究竟該如何應用這個因果判斷?到底身處其中的行動者,應被判斷為是「有」的那一群,還是「無」的那一群?此兩者的差異,嚴重影響決策考量。

因果關係的特異性問題常常發生,因而在因果判斷的運用上也獲得許多關注。癌症的標靶藥物整體來說對治療癌症是有效的,但之所以稱為標靶藥物,是因為對特定癌症群體特別有效,而對另外的群體效果就不見得好,使用上得就因果的特異性進行考量。(某個教育方式整體來說是好的,但不見得適合你的小孩,因為教育方式具有因果上的特異性。)

數據議題

在科學研究中,數據有兩個重要來源,一個是藉由觀察取得,另一個是藉由實驗獲得,哪一種比較好?

1954年,針對超過40萬名美國兒童,進行小兒麻痺沙克(Salk)疫苗的隨機取樣研究,證實沙克疫苗的效果及安全性。一般的看法認為,這個大規模的隨機取樣研究,確認了小兒麻痺沙克疫苗的效果及安全性,然而,這個研究有何特質,可以提供這樣的確認?

有個在本書現階段聽來很淺薄的說法,試圖區分觀察數據與實驗數據的差別:「觀察數據是用(seeing)而得到的,實驗數據是用(doing)而得到的,所以有差。」這個說法聽來很瞎(請讀者試著提供三個很瞎的理由),但我將在本書中說明,這其實沒有那麼瞎。

數據議題是本書的一個核心議題,我們將以這個議題為出發點,來回答其他的議題,因果關係的特異性將是焦點之一,我在此就不多說,先對讀者們賣個關子,讓讀者有點想像的空間。

思考啟動

從數據到因果,是人類思考因果關係的重要特性,但要能確 認(以及如何能確認),卻是一個漫長的過程,以下提供幾個數 據讓大家思考。

據統計,一個國家的每人年均巧克力消費量,與該國人口中獲得諾貝爾獎人數的比例,呈現高度的正相關(正比)(Messerli 2012),這是否代表人均巧克力消費增加,可使得諾貝爾獎的得獎人數增加?

胃潰瘍及十二指腸潰瘍患者,超過85%都有感染胃 幽門螺旋桿菌。試問,感染幽門螺旋桿菌是胃潰瘍及十二指 腸潰瘍的原因嗎?要如何才能確認呢?

每日的溫差越大或是溫度越高,躁鬱症病人入院治療的機率 就越高(Sung et al. 2013)。試問,溫差大或是溫度高,是躁鬱症病人入院治療的原因嗎?

黃麴毒素對大鼠的致癌性高,但對小鼠(mice,如白老鼠) 幾乎沒有致癌性(Steel 2007: 82)。這沒有搞錯嗎?黃麴毒素不是致癌物嗎?如果黃麴毒素對小鼠不會致癌,那還算是致癌物嗎?

1928年秋天,英國科學家弗來明(Alexander Fleming)在假期過後,發現假期前培養的葡萄球菌遭綠色黴菌污染,而在綠 色黴菌附近的細菌都死了。話雖如此,但其實我們觀察到的只是葡萄球菌死亡與綠色黴菌的相關性,而不是綠色黴菌導 致葡萄球菌死亡。

關於咖啡與癌症的研究,關於紅酒與心血管疾病的研究,相關數據多到自相矛盾。