2021年9月9日
早前港大一個記者會發表一項研究指出,港人長壽與吸煙率低有關。研究表示,香港人之所以長壽,是因為跟吸煙有關疾病死因比例較其他地區低,在記者會的PPT中更明言「男性及女性長壽的原因,分別有超過一半及三分之一原因跟本港吸煙率較其他地區低有關。」(Lower smoking prevalence contributed to 50.5% and 34.8% of Hong Kong's survival advantage over males and females in high income countries, respectively.)
干擾變量例子多的是
先旨聲明,我認同吸煙會危害健康。不過,看似對的結論可以是來自錯的分析,尤其在看到單一因素(吸煙率較低)可以對長壽有「一半」或「三分之一」這麼大的影響時,大家應該更小心分析當中一些可能的統計陷阱。
其中一個陷阱是干擾變量偏差(confounding variable bias)。何謂干擾變量?我試舉幾個例子簡單解釋。
例子一:理論上,餵奶樽(相對於埋身餵)會增加嬰兒肚瀉的風險,因為無論沖奶用的水還是奶樽都有較大機會在過程中受到細菌或病毒感染。然而,如果我們從數據看,餵奶樽的嬰兒肚瀉的情況反而是比埋身餵的嬰兒較少。不過,當我們再細看數據就會發現,使用奶樽的母親通常又比埋身餵的母親受過更高程度的教育,前者的各種育嬰知識自然比起後者要好一點,「奶樽嬰兒較健康」這結論亦沒有那麼「出人意表」了。
例子二:理論上,運動能夠減輕骨質疏鬆問題。然而,有研究人員收集相關數據後作了一個簡單的迴歸分析,卻發現兩者的相關性是零!但當這位研究人員在迴歸方程式加入參與者的重量後,就再發現運動與骨質疏鬆的確有負相關性。當中原因其實簡單不過:愈肥的人愈少做運動,但重量與骨質疏鬆卻有負相關性的關係。
例子三:有人發現,謀殺案與雪糕的銷售額有正向的關係!常理很難把兩者結合起來:兇手應該不會在事前或事後食雪糕,而食雪糕「引人犯罪」更是無稽之談。這到底所謂何事?原來,兩者都是與天氣有關:天寒地凍,變態殺手都只會躲在家中打邊爐而不會食雪糕;天時暑熱,殺人兇手和雪糕顧客都「空群而出」。
煙民生活習慣亦與短壽有關
在以上的例子裏,母親的教育程度、參與者的重量,以及一個城市的天氣,都是統計學中所謂的干擾變量。
同樣道理,如果我們只看各地吸煙率和人均壽命,的確可能會發現兩者有負相關性的關係。然而,我們不能忽略的是,選擇吸煙的人,生活習慣本身與「聞煙即遁」的人很可能並不一樣,前者或經常煙酒不離手,每日捱更抵夜,以及大吃大喝,後者則可能滴酒不沾,生活有規律,甚至每日清茶淡飯。另外,我們亦很難想像一個地方政府的禁煙政策和其公共醫療和衞生政策是完全沒有相關性。
重申一次,我是認同吸煙會危害健康的。不過,「男性及女性長壽的原因,分別有超過一半及三分之一原因跟本港吸煙率較其他地區低有關」,當中的「一半」和「三分一」有多少直接與吸煙有關,有多少與煙民本身的生活習慣有關,又有多少與特區政府的公共醫療和衞生政策有關?我想這還須再多作研究吧?
維克森林大學經濟系副教授、中文大學亞太研究所經濟研究中心成員
訂戶登入