Epidemiological and Statistical blog

2014年1月23日 星期四

效應與相關性(Effect and association in Epidemiology)

Overview
前段文章中有提到疾病頻率的測量種類,incidence risk、incidence rate與prevalence risk,然而這些測量方法都是針對single population中特定暴露條件下的疾病頻率,於是在同一population中,仍有一群沒有接受特定暴露的群體,而且這群人也可能會發病,例如某特定地區居民中,若以吸菸來區分,則可以獲得吸菸與不吸菸的兩個子群體,而對這兩群人觀察15年後肺癌發生狀況,可預期吸菸子群體與非吸菸子群體都可觀察到肺癌發生的個數,於是我們可以個別測出兩子群體的肺癌發生率,接著你可能會問,既然吸菸與非吸菸都會發生肺癌,那麼該怎麼找出吸菸與肺癌的關係?

為了回答這個問題,在接下來的內容中將會逐一介紹幾個在流行病學中常用的比較性指標,例如absolute-effect measurement、relative-effect measurement、attributable fraction、population attributable fraction、standardization以及prevalence odds。並以舉例的方式呈現各指標的特色與解讀,最後會闡述在流行病學中effect與association該如何判定。

Absolute-effect measurement
對於一個存在的因果事件而言,要測出因與果之間的相關性強度,例如Exposure影響Outcome的程度,最直覺的方法即是將exposure與non-exposure兩種不同條件下的疾病頻率測量相減,如果exposure與outcome之間無因果關係,則相減應該等於0,若不為0則剩下來的數值即為exposure與outcome之間因果關係的量化程度,而這樣的計算概念稱為absolute-effect measurement。

以上述吸菸的例子來說,smoking與non-smoking在調查後均可測量出肺癌的疾病頻率,以R1、I1為smoking條件下的incidence risk(R)與incidence rate(I),R0與I0則為non-smoking,因此absolute-effect可由以下的Equation-1算得:
Equation-1
A1、A0為smoking與non-smoking之下的肺癌發生數,N1、N0為smoking與non-smoking之下的族群總人口數,T1、T0為smoking與non-smoking之下的總人時數(person-time)。在學術研究的習慣上,通常會以有暴露去扣除無暴露,至於為何如此,純粹是解讀上方便,因此RD、ID的數值有以下的特性,若RD、ID>0,則暴露是對疾病發生具有風險的因子,若RD、ID<0,則暴露是對疾病發生具有保護作用的因子。
Table 1.Measurement of number and incidence risk
Table 2.Measurement of person-time and incidence rate
Table 1與Table 2為實際上吸菸與肺癌的調查結果,其RD、ID分別為0.03512與0.00186,在解讀上兩者的數據均>0,故吸菸是肺癌的危險因子,而RD解釋為在研究族群內,平均每10萬人口中有3,512人是因為吸菸所增加的肺癌發生數。而ID解釋為在15年調查中,平均每10萬人時中中有186人是因為吸菸所增加的肺癌發生數。

Relative-effect measurement
相較於absolute-effect以較為直觀的概念去估量因與果之間的相關性強度,另一種更為常見的比較性指標則是relative-effect的概念,以倍數的方式量化exposure與outcome之間的關係。Equation-2呈現了risk ratio(RR)與rate ratio(IR)的計算方式,習慣上仍是以exposure為分子相較於non-exposure為分母的倍數,在某些學術文章中會看到relative risk的名詞,而relative risk在本質上概括了RR與IR的性質,因此為了避免混淆,應該區分名詞上的使用。

RR與IR的數值性質在解讀上較不直觀,RR、IR若 = 1,則暴露因子與疾病沒有相關性,RR、IR若>1,則暴露因子為疾病的危險因子,RR、IR若<1,則暴露因子為疾病的保護因子。
Equation-2
延續上述的例子,在relative-effect的概念下,RR、IR分別為4.95與4.51,在解讀上必須以倍數的概念去思考其相對風險,故RR解釋為族群中暴露於吸菸的肺癌發病風險是非吸菸族群肺癌發病風險的4.95倍,由於RR>1,因此吸菸為肺癌危險因子。IR的解釋為15年調查內族群暴露於吸菸的肺癌發生風險是非吸菸族群的4.51倍,IR同樣>1,故15年的調查中顯示吸菸為危險因子。在此我在RR與IR的描述上不太一樣,因為RR的測量指標並不包含person-time的概念,因此不適合在描述中強調時間性質,而IR含有person-time的概念,於是解釋上應強調時間的資訊。

Attributable fraction
在生物醫學領域中,absolute-effect在解釋上有盲點,例如上述實例中absolute-effect的RD為0.03512,是由0.04400 - 0.00888所算得,現在另一個研究希望了解平均每天吸1包菸以上的人與每天少於1包菸的人之肺癌發生率的差異,調查結果發現每天吸1包菸以上的肺癌發生率為0.09874、每天少於1包菸的肺癌發生率為0.06362,其RD同樣為0.03512,這樣的結果令人感到困惑,明明是兩種不同情況的研究,結果卻求得同樣的數據。然而我們知道雖然結果同樣為0.03512,但其背景資料來源不同,於是更精確的測量就是將基底數值的資訊帶入原本的absolute-effect中,而這就是excess fraction的概念。
Equation-3
Equation-4
Equation-3與equation-4分別為RD、ID的excess causal risk與excess causal rate,計算公式以非暴露組的疾病發生風險作為基底數值帶入原本的absolute-effect中,於是便形成了相對剩餘風險,以實例來說,吸菸的RD為0.03512,解釋上必須形容在研究族群內,平均每10萬人口中有3,512人是因為吸菸所增加的肺癌發生數,而excess causal risk所求得的數據為3.95,解釋上則修飾為,因為吸菸所增加的肺癌發生率是非吸菸族群的3.95倍,而這樣在解讀上就比原本的RD更加具體。

另一方面,若作為基底數值的並不是非暴露組,而取代為暴露組的疾病發生風險,則這種相對剩餘風險則稱為attributable fraction。
Equation-5
Equation-6
 Equation-5和equation-6分別為attributable risk fraction與attributable rage fraction,由於是以暴露組作為基底數值,因此解釋上可以更加簡潔的形容相對剩餘風險,以實例來說,吸菸的attributable risk fraction為0.798,你可以延續上述excess的解讀方式,解釋為因為吸菸所增加的肺癌發生率是吸菸族群的0.798倍,又或者以更精確的方式解讀為,此研究中若全部的吸菸者均戒菸,則將有79.8%因為吸菸導致的肺癌不會發生。

Population attributable fraction(PAF)
即使AF的計算已經考量了基底數值的資訊,然而仍有缺點,而且可以很輕易地由equation-3~6發現,例如excess causal risk,經整理後能得到relative-effect的形式,故不同的研究很可能算得同樣為RR,因此其excess causal risk與attributable risk fraction在不同研究間就喪失了區別性,為了解決這樣的問題,另一種思考產生了,若相對剩餘風險能夠在某種程度上反映其研究族群中暴露與非暴露的得病比例,於是便能在不同研究間、相同RR、IR的狀況中有所區別,因為不同研究的暴露與非暴露得病比例不一定相同。而這樣的計算就是population attributable fraction(PAF)。
Equation-7
Equation-8
在Equation-7、8中公式可以互換,因此擇其一去使用都是可以獲得相同的結果,其繁瑣的轉換寫法在appendix中。

Prevalence odds ratio
最後不可避免要來談談另一種獨特地比較性指標Odds Ratio(OR),在這裡我刻意與上述的incidence作區別,於是將OR用於prevalence,這並非意味著OR只能用於prevalence,事實上只要有合適的條件,incidence risk與incidence rate都可以用OR的方式表示,而且OR的概念在某些case-control study研究設計下可以有條件地推論至RR與OR,而後部分的推論與詳細內容將保留至case-control study的章節中專門介紹。

相較於上述RR、RD與IR、ID等多元的比較性指標,Prevalence受限於本質上涵蓋的資訊複雜性,例如病例中並非全部皆是新發病者,還包含了復發個案等,只要特定族群在特定時間內顯示為患病者,則全列為case,故單憑prevalence難以論斷暴露引發疾病的程度,於是在推論上更難去說明何謂因果關係,單純用absolute-effect和relative-effect去測量prevalence的因果相關程度,是不合適的處理。因此另一種運算概念便應運而生,完全捨棄因果推論的企圖,而直接呈現相關性的計算方式,prevalence odds直截反映了有病與無病的比值,單看一個prevalence odds並無太多解釋意義,然而當暴露組與非暴露組都可算出個別的prevalence odds,取兩者之間的比較後,在解讀上就精巧多了。
Table 3. Cancer prevalence of smoking and non-smoking. 
Equation-9
Equation-10
以實例來說明,Table 3為有無吸菸的癌症盛行率的資料,其吸菸組的prevalence odds為0.0496,非吸菸組的prevalence odds為0.0136,而有吸菸比無吸菸的prevalence odds ratio則為3.65,這個數據同relative-effect一樣是倍數的概念,但在解釋上與relative-effect略有不同。較為直白的解釋為暴露於吸菸的族群中有癌症與無癌症的比值是非吸菸族群的3.65倍,這個數據更為有趣的說法是詮釋為"在研究族群中,吸菸者比非吸菸者有大約3.5倍的機會成為癌症患者",在後面的描述中不再強調其精確的3.65倍,因為盛行率在因果推論上沒有足夠證據力,故精確數據對於盛行率欲推論至因果相關性就不再重要。

Summary
一般而言,在中文書中難以區分所謂的效應與相關性,而且經常是在解讀上會混合使用,例如描述吸菸與肺癌的關係,有時可見模擬兩可的描述,諸如"吸菸影響肺癌的效應"與"吸菸與肺癌的相關性",其實不光是在英文的字義上有所不同,所謂的effect與association用在流行病學中指的是完全不同的意義。Effect可用於代表因與果之間效應,或者有人認為果其實就是因的effect,換言之,在真正的因果機制中,吸菸導致的肺癌其實就是吸菸的effect,至於該如何測量出effect,在counterfactural theory中可以獲得最優美的詮釋,effect就是在同一群人、相同時空中因為暴露因素的改變所導致的結果,而實際上counterfactual根本無法在觀察性研究中實行,於是利用不同群體所獲得的RD、ID、RR、ID就是流行病學所認為的association,因此association即是在不同人群間,因為暴露因素的不同所導致的比較性結果。

在此需要特別留意,若是同一群人在不同時間測量而暴露有所改變,其後所導致的結果並不能認為是effect而是一種association,因此association泛指任何在現實中觀察性研究所獲得的結果。

Appendix

4 則留言: