Epidemiological and Statistical blog

2014年1月22日 星期三

流行病學的因果推論(Causal inference in Epidemiology)

Overview
公雞啼叫,日光出現,日復一日,似乎有規律,你做出大膽的假設,如果公雞啼叫是引起日出的原因,則雞啼後日光沒有出現,規律失敗,若日光出現了,規律重現。因此你在某天早晨聽到雞啼後,開始紀錄是否可以看到日光出現,結果不出所料,雞啼後日光出現,於是你大膽的假設獲得了印證,因此猜想雞啼與日光可能有某種關係,但大膽假設必須謹慎求證,因此你謹慎地調查了將近100天,每天的結果都重複印證了雞啼日出的規律,你獲得了初步結論:雞啼引起了日出。
Francis Bacon
(22 Jan 1561 – 9 Apr 1626)

這個研究小故事在21世紀聽起來非常荒謬,因為你已經知道真相,你可能早已學過基礎的地球科學和生物學,你知道地球自轉與公雞的基因機轉之間只是個假相關,但如果你聽過Francis Bacon這個人,大概可以知道上述的研究確實遵從一套曾經盛極一時的哲學歸納主義"Inductivism"(是指將歸納法(induction)的哲學思想奉為圭臬)。你也許知道歸納法在科學因果推論上的致命缺點,又或者剛好從其它地方聽過這類的故事,你可以在公雞啼叫前將牠殺掉,然後等待日出,就能破除歸納所推論的假設,獲得新結論:公雞不啼叫、日出照樣來,公雞與日出無相關。

相關性連結是人類與生俱來的學習能力,小孩子看到冒煙的茶壺會好奇,伸手觸碰後立刻縮手,於是明白冒煙的茶壺等於燙傷,下次再看到冒煙的茶壺就不敢再觸碰。我們對於外在世界的任何事物都會建立相關性,聽到刺耳蟬鳴就知道季節是盛夏,出門看到滿天烏雲就知道應該帶雨傘再出門,有些甚至不需親身體驗也能學習到事物間的關係,例如你絕對不會希望在十字路口紅燈時還不踩煞車。

察覺事物之間關係在生命中有很大的助益,特別是當這種關係是因與果的角色,若A是因,B是果,A必定在B之前發生,這是因果關係唯一的必要條件,假如B要發生必須要A出現,反之,沒有A出現B就不會發生,則A稱為B的necessary cause。以登革熱來說,登革熱必須要有蚊子作為媒介,若世界上沒有蚊子存在,則登革熱就不會發生,因此蚊子是登革熱的necessary cause。即使實務上根本做不到撲殺所有蚊子,但我們可以預期,只要有效降低蚊子的數量,登革熱就會獲得控制。

Necessary cause的因果關係較常出現在病媒蟲傳染病的傳染途徑中,然而生物醫學領域中的慢性病則又是另一回事,以慢性病為主的因果關係經常較為複雜且難以釐清,通常都會遇到一因多果、多因一果的情形,例如吸菸與多重疾病的關係,糖尿病與高血糖、高血脂、高血壓的關係,有時候研究者甚至不會清楚得知某種特定暴露源與疾病的關係,因此研究者該如何測量與確立因果關係?

為了釐清因果推論應用至流行病學的複雜性,本文將從哲學歷史著手並延伸至流行病學的因果推論,內容將包含Hume's causation、Kant's Critique、Popper's Falsificationism、Counterfactual theory與知名的Hill's criteria,最後會討論Modern Epidemiology的作者Rothman所提出的Sufficient component cause model,以及一個近年來應用廣泛的因果推論工具Causal Diagram的Directed Acyclic Graphs理論,又可簡稱DAGs。
Basic causal inference
(5 Mar 1813 – 16 Jun 1858)
流行病學研究的目的是為了找出exposure與outcome之間的關係,而因果關係是渴望被論證的目標,一旦找到exposure與outcome之間疑似存在因果關係,而後人們便能根據這種關係去介入控制,若outcome是某種致命性疾病,則人們便能根據研究結果去遏止exposure,並進而降低致命性疾病的威脅,反之,若outcome是能延續生命、保持健康的結果,則應該推展這種exposure,而這樣的研究與介入控制在歷史上比比皆是,例如1854倫敦的霍亂傳染,當時John Snow醫師便是利用因果推論的基礎概念去找出疾病與傳染源,在當時細菌學尚未健全的背景下,John Snow醫師便是利用基礎因果論中時空相近與必然連結性的概念去推論,傳染源疑似是飲用公用的抽水井,而後加以介入控制,也成功遏止了倫敦的疾病傳染。於是乎,最早的流行病學便是建立在基礎因果推論上,而早期對於因果的概念主要包含三大因素:
  • 若A是B的因,則B必然在A之後發生,因此因果關係存在時間的先後次序。
  • 若A與B有因果關係,則A與B會在相近的時間與空間內發生。
  • 若A與B有因果關係,則必然存在連結性使這種關係可以重複被觀察到。
若依照上述三大因素去重新審視John Snow整治倫敦霍亂的整個過程,當時John Snow懷疑的可能傳染源有許多種,最後確認公用抽水井是最有可能的傳染源,其原因全是因為滿足了上述三大因素。

有了三大因果關係的架構,我們可以去思考生物醫學中exposure與outcome的關係,是否全部滿足這種關係。以傳染病來說,疾病是由傳染源所觸發,因此傳染源必然在疾病之前,結核病(TB)是由Mycobacterium tuberculosis結核分枝桿菌所傳染,故人體必然先接觸結核桿菌才能在後續時空中引發TB。疾病與傳染源會在相近的時間與空間內發生,食物中毒的沙門氏菌與急性腸胃炎,在某道海產料理食入受沙門氏菌汙染的食物後,於短時間內引發急性腸胃炎,故兩者的發生均在數小時內,滿足時空相近性。疾病與傳染源的連結性可以重複被觀察到,因此瘧疾由瘧蚊傳染,故不同時空中,只要有瘧蚊存在,便能重複觀察到瘧疾發生。

經由傳染症來論證基礎因果推論是很簡易的思考,然而當outcome變為慢性病時,一切就變得複雜許多,exposure與outcome的關係不再滿足於時空相近性與必然連結性,例如exposure為飲酒,引發的outcome如慢性肝炎或肝硬化,可能在數年內發生,數十年內發生,也可能永遠都不會發生,相同的肝炎與肝硬化也可能藉由B型肝炎病毒所引發或者是其他因素,故因果關係越複雜,基礎因果推論便越失效。

Hume's causation
David Hume
(7 May 1711 – 25 Aug 1776)
三大基本因果條件的形成是長久以來藉由不斷地觀察,透過真實存在的因果事件所找出的共通點,並且訴諸於歸納法的支持,因此基本因果條件的第三點,必然的連結性就是結合了歸納法的概念,因此過去所有哲學家對於歸納法的質疑,也延伸到基本因果條件的批判,其中最引人注目的批判是1739年發表的著作A Treatise of Human Nature與1748年出版的著作An Enquiry concerning Human Understanding,這兩本書對於基本因果推論中的必然連結性進行了不可知論的批判,提出人類觀察事件發生的連結性,只要一件事伴隨著另一件事發生,人類思想便會相信此兩件事之間有某種連結性,但這全是基於人類觀察與經驗上所獲得的表象,而非真實存在的因果關係,因此當我們觀察到兩件事之間存在某種連結性時,並不能依此推論此存在因果關係,而只能認為兩件事之間恰好滿足恆常的連結性(constant conjunction),兩件事只是剛好被觀察到具有時序性且相近時空內發生,當連結性重複出現時便滿足了人類心理所期待的因果現象,所以相信這之間存在因果關係,而非真理的因果,因此這種恆常連結性理所當然會隨時間而改變,並不會一直存在連結性,但人類依然會相信因果關係是存在的,而大膽提出因果關係只是心理因素的假象的懷疑論者,便是知名的哲學家David Hume

Hume提出的因果論十分危險,因為人類所能找出的一切可能因果關係,都是先藉由經驗觀察形成歸納,若透過經驗觀察的結果僅僅是滿足心理期待的結果,而非事物的本質,那麼至今所有的因果關係都將無法論證。換言之,若遵照Hume對於因果所提出的問題,那麼許多生物醫學的研究便難以持續,因為任何研究的觀察結果只存在恆常性連結,並非一直存在關係性,在不同情境下執行相同主題的研究都會有不太一致的研究結果,然而這是否說明了任何涉及因果相關的研究都不再具有意義呢?是否還能相信觀察到的因果關係?

Kant's Critique
Immanuel Kant
(22 Apr 1724 – 12 Feb 1804)
受到Hume的啟發,西哲的重量級人物Immanuel Kant先接受了Hume對於事物本質與觀察的不可知論,而後對於因果不可知論的問題,發展出了新的批判理論。

Kant認為,人類透過觀察所獲得的結果是事物本質的反映,是本質所投射的現象,因此透過觀察對於事物本質是不可知的,但卻可知事物本質所投射的表象與特徵,而因果關係正是事物本質所反映的特徵,因此並不需要質疑人類所觀察或歸納的結果,因為這些現象是不需證明的,因此觀察與歸納所形成的因果關係是可知的,而反映出因果關係的事物本質才是不可知的。

Kant的想法其實很簡單,讓我們試著想像一個情境,人類的觀察與事物的本質之間就像隔著一塊白布,觀察所看到的,只是白布上透過光線照射事物本質所投射的影子,因此不論如何觀察都無法清楚明白事物的本質為何,但卻能透過影子了解本質的架構與形塑,進而透過影子歸納出本質的任何動作與表現。因此,Kant雖然延續了Hume的不可知論,卻走出與Hume對於因果關係所丟出的無解論證,轉而證明任何透過歸納所獲得的因果關係,都不需懷疑其因果機制的本質,簡言之,歸納法之於因果關係仍是可信的。

Popper's Falsificationism
Karl Popper
(28 Jul 1902 – 17 Sep 1994)
歸納法是對於觀察所獲得的結果,找出其中的規律性,因此歸納出自然中存在某種規律性使事件發生或影響另一件事件,就某種角度而言,歸納法是一種訴諸於主觀意識層面的結果,然而透過Kant在其思想脈絡的擴展,藉由這種主觀意識的結果也能形成客觀,於是歸納法依舊是找尋自然界規律性的有力工具,然而歸納法依然有其限制。

本文最前述的公雞與日出即是歸納法的缺陷,透過觀察所獲得的規律性並非總是真相,公雞與日出在事件發生時符合時序性與可近性,然而卻只是單純的具有事件發生的相關性,卻並非因果關係,於是乎,試圖從歸納法去論證因果關係在理論上是失敗的,這一點也是許多對於歸納法的批判其中之一,科學哲學的發展面對歸納法的缺陷轉而形成驗證歸納法的新路,以公雞日出的例子來說,就是將公雞殺掉再觀察日出,這種想法即是一種典型的反證,不以歸納所獲得的規律性假設來推論真相,卻以找出非規律性來證明規律性假設不存在,如果因為歸納而假設公雞引起日出,只要找到一件公雞不引起日出的情形便能打破歸納的假設,於是乎只要殺掉公雞即可。相較於歸納法的不可論證性質,提出完全相反的論證思路,反證法(Falsifiability)或稱證偽主義(Falsificationism)的最經典人物便是Karl Popper爵士[1]。

反證主義的確立是科學哲學上一大進步,因為反證法而明確了何謂科學與非科學,任何科學理論均是人類知識範疇的假設與推測,任何能藉由反證法去重複檢驗的理論才能藉由不斷的去蕪存菁而逼近真相,反之,無法透過反證檢驗的理論,例如一個歸納法獲得的規律假設無法提出反證來檢驗,於是這樣的假設基於歸納本身的不可論證性而無法可信,此類無法藉由反證檢驗的理論便稱為非科學,反之就是科學。

因為反證法提供了驗證真相的有力方法,這樣的例子很多,最有名的就是白天鵝假設,過去歐洲人普遍相信只有白天鵝存在,因為在當時歐洲各地只可見到白天鵝,於是任何歐洲人透過歸納法都能提出天鵝只有白色的假設,但這樣的歸納法不可論證,即使你透過1,000次或100,000,000次觀察天鵝均是白色的,都無法論證這樣的歸納是真相,因為只要找到一隻黑天鵝,天鵝只有白色的假設就宣告失敗,而事實上,當時黑天鵝就生存於俄羅斯,只是當時的歐洲人沒有見過。

歸納的失敗在於主觀觀察容易有知識限制,你觀察到任何事物都是出自於你自身的角度與環境,你所留意的片段都與自身的背景有關,於是每個人觀察的結果都不太一致,因為主觀有其限制性,但主觀並不代表假象,這就像瞎子摸象一般,任何人摸到的部位都不同,但特徵都是相同的,於是藉由瞎子主觀獲得的特徵去形成假設,會受限於每個人的知識領域而不同,於是有人說大象是柱子,也有人說像蛇。因此假設大象是柱子與大象是蛇就犯了主觀推測的錯誤,但大象具有柱子與蛇的特徵卻是真實。
 
以較為極端的例子來說,主觀歸納就如同你站在一隻羊的側對面,你看見那頭羊側面全身雪白,於是乎很直覺地說出"那是隻白羊"的結論,但由於你只看到羊的側面,並沒有觀察到羊的全身,結果當羊轉身後你才驚覺歸納犯了大錯,原來那頭羊一側身雪白,一側身全黑。

George Price
(6 Oct 1922 – 6 Jan 1975)
關於反證法在科學應用的故事很多,其中一則最令我感到震驚的是一位數學兼遺傳學家George Price的故事,終其一生都在依循反證法論證自己曾經提出的基因遺傳理論是否錯誤,最後生命終結時仍無法找到反證。

1970年世界一流科學期刊Nature刊登了一篇震撼學界的研究"Selection and covariance"[2],文章內容主要是透過知名演化生物學家William Hamilton的研究獲得靈感,以數學論證基因遺傳論,並推導出遺傳選擇令生命產生自保行為,任何生命的選擇都是為了延續基因遺傳,而所謂的利他行為其實只是遺傳選擇的自保行為,例如一名母親衝入火場救兩名幼兒,最後兩名幼兒存活但母親卻喪命,許多人會認為這是令人感動的利他行為,母親為了小孩而付出生命代價,但根據Price的理論,這並非是利他,而是因為小孩身上帶有母親的基因延續,因此為了保住小孩身上的基因延續而令母親做出犧牲的行為,所以是自保行為。

由於這篇文章的問世以及後來Price本人對於宗教信仰的迷戀,漸漸地讓Price對於自己提出的自保行為理論感到深深懷疑,透過反證法的原則,若要證明自保行為理論是否屬實,只需要找到一件真正的利他行為,便可反證此理論,於是Price決定尋找自然界中真正的利他行為,然而這件事卻不順利,Price所能觀察到所有現象都脫離不了自保行為,於是Price決定拿自己來實驗,若是自己能夠展現真正的利他行為,便能從反證的角度反駁自保行為,然而這個決定最終也讓Price自己付出了生命代價,為了執行真正的利他行為,Price開始協助街頭流浪漢,邀請流浪漢到居家住,並給予照顧,但這件事影響了他的工作,於是Price最後放棄了工作專心從事利他行為,最終將自己的所有資產全都散盡又罹患了憂鬱症。

身無分文又陷入憂鬱的Price終究無法證明自己的理論是否錯誤,於1975年1月6號自殺身亡,由於當時Price的遺體沒有任何身分證明,最後是靠研究同伴與好友Hamilton所確認。關於利他行為是否存在,Hamilton曾說過"I had only ever seen two examples of truly altruistic behaviour; Mother Teresa and my friend, George Price".

Counterfactual theory
David Lewis
(28 Sep 1941 – 14 Oct 2001)
先歸納再反證至今已是部分科學檢驗的流程,然而生物醫學的領域中,疾病事件的因果關係卻充滿高度異質性,而且致病原通常極不特異,例如多因一果,多因多果的狀況,這種例子絕大多數都是慢性病,在這種狀況下,縱使exposure與outcome存在因果關係,全部的人都接觸exposure,也並非所有人都會發生outcome,原因不外乎是這種因果關係是屬於間接關係,因與果之間還有許多因素介入,或者因果關係之間存在交互作用,兩個因彼此拮抗、協同,又或者是多因子交互作用。受限於實際上複雜的因果關係,基本因果推論顯得毫無用處,為了解決這種推論的困境,一種獨特又極具吸引力的因果推論由哲學家David Lewis在1973年發展提出

Counterfactual theory[3]是一個在理論上可以判別因果關係的想法,我們以生物醫學的例子來舉例說明counterfactual的概念,假使今天我們要研究喝咖啡與胰臟癌是否存在因果關係,一個很直覺的想法就是找一群完全沒喝咖啡且沒有胰臟癌的人,然後全部都給予喝咖啡並持續不間斷,接著觀察30年後胰臟癌的發生個數,於是我們可以計算出這群人在開始持續喝咖啡30年後得胰臟癌的incidence rate。

接著我們將時空再倒流到30年前,但這次全部的人都不准喝咖啡,然後觀察30年後胰臟癌的發生個數,於是可算出這群人完全不喝咖啡30年後得胰臟癌的incidence rate。

Population (coffee)         -----------------> Incidence rate of pancreatic cancer

Population (non-coffee) -----------------> Incidence rate of pancreatic cancer

為了推論有效,假設兩種時空狀態只有喝咖啡與不喝咖啡是有差異的,但其餘的條件皆相同,故兩個時空所計算得到的incidence rate就可以拿來比較,若有喝咖啡的incidence rate與沒喝咖啡的皆相同,則喝咖啡與胰臟癌便沒有因果關係,反之則否。

上述的例子呈現Counterfactual theory用於因果推論上的優美,而且在理論上能夠甄別出特定暴露源是否會促進特定疾病的發生,若隨著暴露源的改變,而疾病也隨著改變,則兩者的關係就很明確,而且也可以藉此量化出因果關係之間的強度。然而實際上這理論卻不能執行,其最大的原因有二。第一,counterfactual theory依靠相同人群相同條件不變情況下,接受暴露與非暴露兩種時空反應,然而在現實中根本不能將時空倒流,同一群人一次只能接受一種情境。第二,我刻意舉這個例子是為了額外說明,任何調查傷害性暴露風險為目的之研究,都不能以介入的手段來執行調查,必須以觀察性的方式,且必須尊重個案(參與者)意願,隨時都可讓參與者退出調查,而這也是世界醫學倫理的規範,其他倫理規範內容可詳見2013年新版的Declaration of Helsinki內容。

"順便一提,喝咖啡可能導致胰臟癌是近二、三十年來備受爭議的研究,其爭議原因有來自於商業經濟的質疑(咖啡供應商之間的角力,其內容可見Mark Pendergrast於2000年出版的Uncommon Grounds: The History of Coffee and How It Transformed Our World,中文譯本為咖啡萬歲,譯者韓懷宗)、研究設計的證據力不足等(絕大多數是hospital-base case-control study,關於case-control study的研究設計優缺點會再以後說明),然而systematic review和meta-analysis study的研究都無法一致性的指出喝咖啡是否真的與胰臟癌的發生有因果機制的關係。"

Hill's criteria
Austin Bradford Hill
(8 Jul 1897 – 18 Apr 1991)
由流行病學家Austin Bradford Hill爵士於1965年發表的因果推論準則[4],一共包含九大類,九項均是根據實際上明確的因果關係中所存在的特徵而提出,因此在判定是否存在因果關係的問題中,可根據實際研究結果是否符合以下的條件來衡量因果關係:
  • Strength:如果觀察到兩個因子之間的相關性很強,則此兩因子之間很可能有某種因果關係,反之,若兩因子相關性很弱,則此觀點下認為兩因子的因果關係可能性很低。
  • Consistence:如果某兩個因子的關係不只存在於單一研究,而能在不同情境下都能產生一致的結果,則稱此現象為具有consistence。
  • Specificity:若發現某因子特別只與另一因子有關,則稱此現象為specificity。
  • Biological gradient:如果某因子的增加會伴隨引起另一因子的增加或減少,則稱此現象為biological gradient,此又可稱為生物劑量關係dose-response relation。
  • Plausibility:研究觀察的結果若能從現有科學知識中獲得合理的解答,則因果關係的存在可能性較高。
  • Coherence:流行病學經由研究結果提出的因果假設若與其他實驗結果之間若無衝突性,則因果關係的可能性較高。
  • Experimental evidence:又可稱為Reversibility,通常認為將某因子移除後可以改變另一因子發生的程度,依此認為此兩因子之間的共生共存可能存在某種因果關係。
  • Analogy:顧名思義,即是將其他不同領域的因果概念應用於流行病學上,並依此提出許多富有創意的因果假設,又或者是將某個已知的因果關係,類比至其他相似的關係上,並依此推論其因果關係存在與否。
  • Temporary:如果因果關係存在,則因必在果之前,而因與果之間的時間性質則稱為temporary,因與果之間的時序性質可說是符合了所有因果關係的必要條件,反之,若懷疑A因子是B因子的致因,且符合Hill's criteria其他所有的因果條件,但實質上A因子發生在B因子之後,其時序性相反,則可以說明此兩因子不存在因果關係。
九大項因果準則看似都合情合理,但每項都備受批判,尤其是針對這九項綜合而言,除了temporary之外其他的準則根本都並非因果關係的必要條件,而且各九項都可以找到反例去推翻因果判定,例如strength在實際研究上,能夠呈現很強的相關性結果,往往都是受到干擾作用的後果。某種特定的因果關係只存在於特殊的情境下,因此consistence並不能滿足於所有因果關係,故研究者也不能依靠consistence判斷因果關係。在某些因果關係中,一個果可由多因所致,單因也可能會引發多果,故存在specificity並不能說明所有因果關係。dose-response relation在某些因果關係的機制反而會以U型或J型曲線呈現,故缺乏biological gradient也不能說明沒有因果關係。Plausibility往往受限於有限的科學知識,因此是否符合生物科學上的合理性也難以解釋某些因果關係。Coherence然而研究者無法藉由排除具有衝突性的結果而因此說明因果關係的存在,因為產生衝突性的資訊本身很可能即是錯誤的。Experimental evidence發現reversibility的結果很可能只是受到干擾作用的結果,而非真正的因果關係。Analogy一旦失敗也不能說明因果關係不存在,很可能是因果假設本身即是錯誤,也可能受限於知識不足,經驗缺乏或概念上創意不夠等因素導致失敗。最後的必要條件temporary,由於並非唯一的充分條件,故符合temporary也無法說明是否存在因果關係。

Sufficient component cause model
Kenneth Rothman
Conterfactual theory無法實用,九大Hill's criteria也難以論斷因果關係(即使現在認為Hill's criteria在檢驗因果關係上無法獲得滿意,但仍然廣受歡迎,應用於諸多流行病學的因果推論,但成效極其有限,至今流行病學界最大的成就之一便是確定吸菸為致癌因子,其餘的風險因子都無法論斷其因果效應),於是流行病學的因果推論似乎走進了迷霧中。1976年Kenneth Rothman注意到了流行病學因果推論的難題,並開始思索如何解決因果關係的複雜性,最後提出了一種極其視覺化且符合直觀的因果圖模式(Sufficient component cause model)[5],簡而言之, 就是以常見的圓餅圖呈現outcome事件的成因。

Rothman構思的Sufficient component cause model的概念很簡單,單一個體一個事件發生即可以構成一個Sufficient cause,因此一個圓餅圖就是一個sufficient cause,圓餅圖內的每一小塊扇形區域就是構成單一個體發生事件的其中一種成因,因此單一sufficient cause內每一個成因就是component cause,而特定發生事件的所有可能sufficient cause中若有相同的component cause,則那些相同的component cause即稱為necessary cause。

Figure 1. Sufficient-component cause model.  
右圖是一個人發生心肌梗塞的sufficient cause,A是高濃度空氣汙染懸浮微粒,B是低溫環境,C是動脈粥狀硬化,D是吸菸習慣,E是沒有戴口罩,U則代表其餘未被調查的成因,在此提醒,在任何sufficient cause中,U是必須存在的成因,除非調查研究能徹底釐清所有可能的因素,否則任何發生事件中,都會存在部分未知的成因。由sufficient cause中可以發現這個人發生心肌梗塞的各種主要的component cause,於是我們可以得知,只要其中一個環節沒有發生,這個人就不會發生心肌梗塞,反之,只要這個人恰巧所有 component cause都滿足了,心肌梗塞便即刻發生。因此對於每一個人的sufficient cause而言,所有人的發生狀況都像是在累計發生條件,但並非每個人的sufficient  cause都會一樣。這種個體之間的異質性是很容易理解的現象,導致異質性的原因很多,絕大多數是先天性的條件。

接著來看下圖figure 2,這四個sufficient cause代表一個特定事件的所有可能因果狀況,故U1~U4個別代表四種sufficient cause之下的未知成因,而ABCD則是最主要的成因。
Figure 2. Necessary cause and component cause in four sufficient cause models of disease.
在figure 2中有許多的訊息可以得知,例如在這個特定事件中,所有可能的sufficient cause都B的component cause參與,因此我們可以得知B為這個特定事件的necessary cause,另一個更有趣的資訊是構成的條件之間即會產生交互作用,換言之,在U4的sufficient cause中,A與B就對於特定事件具有交互作用的效應,而U1則是A、B與C的交互作用關係。

Figure 3. Six types of sufficient cause models of heart disease.
透過sufficient component cause model的關係,我們可以清楚理解為何在族群中,接觸特定暴露源的人當中,有人會發病,有人卻不會發病,以右圖figure 3為例,假設一個研究調查內1000個案當中一共有6種型態的心臟病的sufficient cause,其中U1的sufficient cause有10人符合,U2的sufficient cause有450人符合,U3的sufficient cause有200人符合,U4的sufficient cause有250人符合,U5的sufficient cause有50人符合,U6的sufficient cause有40人符合。而在此研究中,所有人均沒有接觸B暴露,於是U3與U4的人不會發病,而其餘人皆發病,故計算A暴露的致病風險則為0.66,非A暴露的致病風險則為0.23,因此可以估算A暴露的因果效應為0.66 - 0.23 = 0.43(risk different)與0.66 / 0.23 = 2.87(risk ratio)。於是透過這樣的方法即可以處理因果關係與效應,讀者在此需要特別留意,上述因果效應的計算得以成立是基於我所假設的這六種sufficient cause恰巧為一邊有A,一邊無A,而且兩組之間可以比較,在實際上,因果關係並非如假設般簡單。

Sufficient component cause model的缺點,各因子之間的時序關係難以釐清,這很可能造成某種誤解,例如在一些具有time-dependent的交互作用的情境下,研究者有必要去了解個因子之間在時間次序所扮演的腳色,並釐清之間的關係。若讀者對於sufficient component causal model的應用有興趣,可以參考Rothman的Modern epidemiology[6],這本書提供了進階者學習流行病學的概念與應用,在前半段章節中也有詳細的sufficient component causal model的詳細討論。目前在概念上是很方便的因果推論工具,但在實際應用上仍然沒有很好的進展,近年來將Sufficient component cause model應用於流行病學的推論上最大的進步是著眼於交互作用的部分,而2010年發表的causal pie model與其後續的系列論文都是延續Sufficient component cause model的架構去延伸至不同研究設計的交互作用效應甄別,故回到流行病學最單純的因果效應推論上,Sufficient component cause model仍然只停留在理論階段,等待有人進一步延續並發展。


Causal diagram: The theory of DAGs
上述介紹的各種因果推論的理論或假設或多或少都有輔以圖像式來協助思考,以繪圖方式來協助思考已有很久遠的歷史,甚至無法追朔是誰開始這種思考模式,而近年來這種以圖像式為主的因果推論,在經過一些學者的努力之後,終於逐漸成形,成為一門既嚴謹且合理的因果推論理論,而這就是causal diagram的DAGs理論[7]。
Judea Pearl

若對於數學理論熟悉的讀者應該對於DAGs並不陌生,其中文名稱有時翻譯為有向無環圖,是屬於拓樸學(Graph theory)的一種,而Judea Pearl、Peter Spirtes、Clark Glymour、Richard Scheines這四名學者在90年代對於Causal diagram的貢獻[8-10],可以說是重新打造整個DAGs應用於因果推論的數理基礎與哲學理論架構。他們將最基本的因果繪圖方式與DAGs結合,重新定義因果繪圖的元素、箭頭的方向性、非循環式的結構關係、賦予左右空間位置的時序性意義於各因子間來強化合理性,再輔以嚴謹且有趣的數學運算來建構各因子之間的因果推論,但以下的介紹將不會提到太多數學理論方便讀者閱讀理解,如果讀者對於DAGs的數理理論有興趣可參考我底下提供的文獻。

DAGs理論最大的特色便是拓樸學賦予的性質"非循環",以figure 4的例子來說,上圖的E與Y之間有雙向性,因此可容許於"循環式"的結構圖,但在非循環式的架構下,就不能再容許E跟Y在同一個空間位置上存在雙向的箭頭,而必須將E跟Y的關係在不同空間位置上表示雙向性,非循環式結構下必須釐清因子之間的時序關係才能表示在不同的空間位置,E影響Y,隨後Y再影響E,因此箭頭的指向也代表了時序關係、因果相關性的意義,箭頭所指的因子為受影響的因子或結果,同時也是時序上較後發生的事件,有時為了區別不同時空的因子,會加上數字來區別,例如因子E就加上E1和E2來方便辨別。

Figure 4. Acyclic and cyclic graphs.
使用DAGs進行因果推論最大的優點就是時序關係,而這一點洽巧是sufficient component causal model所缺乏的。DAGs最主要的目的有四個,其一為它可以提供研究者去假設並建構各個研究變項之間的因果關係。其二,它可以協助研究者建構主要暴露因子與疾病之間所有可能的相關性(包含間接與直接相關性)。其三,它可以協助研究者由建構出的因果圖來判斷因果關係是否真的存在。其四,釐清那些因子之間是屬於因果關係,或是單純的相關性。在這裡讀者必須留意,當一份研究或論述時,相關性存在並不完全等於因果相關,有可能是巧合或受到干擾的結果,這一點我在上述的討論中已有提過(特別是Hill's criteria),相關性只是反映兩因子之間具有某種規律性,而因果相關存在則一定等於相關性存在。

DAGs在處理因果推論時,特別是繪製出圖後,判斷因子之間是否是因果或者是相關性,讀者必須先將箭頭連接著兩因子之間想像成是存在著通路,由通路連接的各因子即存在相關性,若是沒有通路可以連接,則沒有相關性,箭頭相鄰的兩因子即存在因果關係,箭頭不相鄰但可以貫通的因子則具有相關性(非因果關係),但通路之間也存在一定的規則,這個規則即稱為d-separation,包含四大規則,規則一,受衝突因子(collider)會阻斷相關性的通路。規則二,針對非衝突因子(noncollider)做調整或控制,將會阻斷相關性通路。規則三,針對衝突性因子做調整或控制,將會打開其相關性的通路。規則四,針對衝突性因子的受影響因子做控制或調整,將會打開相關性通路。以下我將會以例子來說明上述的四個重要規則。

Figure 5. The d-separation rules of DAGs in causal diagram. 
現在讓我們以figure 5的例子來說明上述的d-separation rule,假設E為每天兩杯高糖份手搖飲料、C為吸菸、D為糖尿病、M為心肌梗塞,所謂的衝突因子(collider)是以通路之間的方向性來判斷,以Ex1的E-->D<--C通路而言,D即為E和C之間的衝突因子,若我們看的是E-->D-->M或C-->D-->M,則D在這兩條通路上就是非衝突因子。而衝突性因子的受影響因子即是M,又可稱為是D的子代因子(descendant)。現在讓我們檢視四大規則,以規則一來說,在Ex1中的E-->D<--C之間不存在相關性,因為通路之間存在D這個衝突因子,而且沒有受到控制或調整。規則二,在Ex1中的C-->D-->M與E-->D-->M有相關性,因為D沒有受到控制或調整,所以會觀察到C與M、E與M之間存在相關性,一旦D受到控制與調整,C與M、E與M之間的相關性就會不見,就如同Ex2那樣,受控制與調整會在DAGs中以框框代表。規則三,在Ex2中E與C之間,因為衝突因子D受到控制與調整,所以E與C之間的相關性通路被打開,因此可以觀察到C與E之間出現了假相關(因為例子中E與C並沒有相關性)。規則四,在Ex3中E與C之間會觀察到相關性,因為衝突因子的子代因子M受到控制與調整,即使D本身並沒有加以控制與調整,但也會連帶產生通路打開的效果。

在實際應用上該怎麼使用DAGs呢來作因果推論呢?一般來說研究者可參考過往的研究來推論某些重要的變項之間的相關性是屬於因果或是非因果關係,並依文獻回顧來初步建構因果圖,又或者可以執行一個調查研究來全面探討各因子之間的關係,並繪製出可能的因果圖。在此讀者必須注意,因果圖只是提供一個協助思考判斷的平台,又或者說是提出因果的假設,並非是實際上即是如此,有很多情形會影響因果圖的失敗,例如干擾因子的考量不周全,又或者是某些沒有被調查或測量的重要因子,會在研究觀察之外造成影響等。

Summary
上述對於因果推論的介紹基本上突顯了人類對於因果本質上的探求的渴望,想像創造力的激盪,不僅以觀察來獲得因果的假設、以理論建構因果的哲學思想、以表列式來推測不可知的因果關係,甚至是以相關性的檢驗來求證因果關係是否存在、圖像結構輔以數學公式來了解各因子之間的因果關係。我們對於疑問的求解,就如同飛蛾會趨近光源,是一種天性,也是一種可能會遭致自身毀滅的行為,科學發展的歷史不斷上演著追求真相與利益衝突者的對抗與爭論,最終唯有"不斷質疑任何事物"的精神,才能使知識的發展延續至今,唯有重拾天性上的好奇心並對於所有資訊都抱持著求證的態度,才能逼近真相。而在流行病學發展的路上,因果推論更是建構相關性研究之所以有效的依據,目前仍需要更多科學家一同努力,更多後輩的貢獻,延續前人或者是開拓更合理的因果推論假說。

Reference
  1. K Popper.  Science: Conjectures and refutations. 1953.
  2. GR Price. Selection and covariance. Nature. 1970; 227: 520-521.
  3. D Lewis. Causation. The Journal of Philosophy. Oct 1973; 70(17): 556-567.
  4. AB Hill. The Environment and Disease: Association or Causation?Proc R Soc Med. May 1965; 58(5): 295–300.
  5. K Rothman, S Greenland. Causation and Causal Inference in Epidemiology. American Journal of Public Health. 2005; 95(S1): S144-S150.
  6. K Rothman, S Greenland, TL Lash. Modern epidemiology. 2008.
  7. S Greenland, J Pearl, JM Robins. Causal diagrams for epidemiologic research. Epidemiology. 1999; 10: 37-48.
  8. J Pearl. Probabilistic reasoning in intelligent systems. San Francisco, CA: Morgan Kaufmann, 1988.
  9. J Pearl. Causal diagrams for empirical research. Biometrika. 1995; 82: 669-710.
  10. P Spirtes, C Glymour, R Scheines. Causation, prediction, and search. New York: Springer-Verlag, 1993.
  11. J Pearl. Causality: models, reasoning, and inference. Econometric Theory. 2003; 19: 675-685.

9 則留言:

  1. Temporary:若懷疑A因子是B因子的致因,且符合Hill's criteria其他所有的因果條件,但實質上A因子發生在B因子之前,其時序性相反,則可以說明此兩因子不存在因果關係。
    這段話的例子,想知道為什麼a因子發生在b因子之前時序性是相反?

    回覆刪除
  2. 感謝,寫得很棒很清楚。

    回覆刪除
  3. 你好,我想咨询下,关于DAGs您知道更具体的应用吗?我看到一些文献基本都在用它研究混杂,是否DAGs也在因果推断本身没什么发展,更多用于研究混杂呢?

    回覆刪除
    回覆
    1. 我不確定你所說的"混雜"指的是哪個專有名詞,是否提供英文原文?

      刪除
    2. The term "混杂" she/he refered on 2016.8.7 6:21 pm may be 'confounding'

      well,i'm unknown user too
      LOl

      刪除
  4. DAG例子中的规则3、4没有看懂,怎样的调整才能让E和C产生关联假象呢?

    回覆刪除
  5. Sufficient component cause model中,请问为什么“A暴露的致病風險則為0.66,非A暴露的致病風險則為0.23”,0.66和0.23是如何算出来的?

    回覆刪除