熱門:

2020年3月9日

黃昊 解牛集

【30天免費閱讀】COVID-19死亡率反映真實風險?

新型冠狀病毒肺炎(COVID-19)疫情去年12月首先在中國湖北省武漢市爆發,因感染人數急遽上升,很快引起群眾恐慌。此次病毒的傳染力超出預料,引發大規模確疹病例,導致當局要採取「封城」等非常規手段設法控制疫情。然而,病毒不僅蔓延至中國各省市,也向全球擴散,各國「大流行」風險不斷升溫。

至今,疫情仍未被有效控制,集體恐慌性情緒持續升溫,官方或相關醫療和研究機構亦利用數據統計模型,就疫情向外公布最新的數據訊息,如病毒的傳染渠道、確診人數、病亡率、基本繁殖數(Basic reproduction number,在流行病學上指一個病例在其感染期內,可能感染多少個額外病例,即R0值)等訊息。

數據是否反映真相

不過,在疫情爆發期間特別是開始階段,無論病亡率或R0數值都出現很明顯的波動。這主要因為疫情尚在發展變化中,數據統計的取樣持續變化,當數據統計的取樣不同,得出的統計結果便往往與最終發生的事實有所偏離。這種由於樣本取樣選擇(Sample selection)導致的偏差,對人類集體行為亦往往產生意想不到,甚或與發放訊息冀緩和公眾恐慌的原意適得其反的效果。

筆者就今次新型冠狀病毒疫情這個案例,分析和闡述樣本取樣偏差(Sample selection bias)、數據所反映的疫情風險,尤其當疫情還在發展階段,往往與疫病結朿時的最終結果有異。那統計數據闡述有關COVID-19的死亡風險,樣本統計出來的數據說出了「真相嗎」?筆者利用病亡率等訊息,並以昔日「非典型肺炎」(SARS,沙士)的病亡率風險作出比較。清楚知曉病亡率背後的統計邏輯,有助於我們正確掌握訊息,尤其在這些訊息對於人類的集體行為產生影響的情況下。

在疫情之中,大家都十分關心相關疫情的各種數據。這些數據會影響大家對疫情發展變化的看法;亦影響到大眾對疫情風險程度的評估,而且大家也往往把今次新型冠狀病毒同昔日的「非典肺炎」,以及普通流感作出比較。

「非典」病亡率啟示

回顧湖北省武漢市爆發疫情初期對外公布的數據顯然並不完整。然而,排除數據不完整的情況,即使公布的數據是充分和完全的,但由於疫情尚未終結,病情仍在發展變化,因而所觀察到的數據,反應的只是整個疫情各個階段的情況。

舉例來說,世衞(WHO)統計的2003年「非典肺炎」的最終病亡率為9.6%。按中國國家衞生健康委員會於2月初發布的數據,在武漢受COVID-19感染的病亡率為4.9%,整個湖北省為3.1%,其他地方平均為0.16%。這些數據顯然並不「準確」,為什麼這樣說?

道理很簡單,大家想知道的病亡率是如果被病毒感染以後的最終死亡概率。而在疫情尚未結束時,病亡率是按當時受COVID-19病毒感染患病致死的人數,除以當時有確診的人數數量,得出這一時點的病亡率。按此計算出來的病亡率顯然會低估死亡率,因為被確診的人當中有很多仍然在醫院接受治療。究竟這些病患者是治癒抑或死亡?其中如若有任何人未能逃出「鬼門關」終歸不治,則會導致死亡率上升,而在此之前的病亡率,大概率比最終塵埃確定後的低。

病亡率數字難準繩

筆者翻查世衞對SARS的統計,在2003年4月初,SARS的病亡率約為4%,但如今大家都知道,SARS疫情完全落幕後得出來的病亡率實為9.6%(病亡人數774,確診人數為8098);但在當年5月份SARS肆虐令人聞風喪膽之時,世衞統計推算的病亡率為14%至15%,可見在疫情尚在發展階段,疫情可以變化萬千,數據難以「測準」。

換言之,在疫情還在發展階段,受感染病患者不一定馬上死亡,有可能出現「康復」或「死亡」的兩種未確定結果。按照上文的病亡率計算方法,即病死人數除以確診人數所得出來的病亡率,幾乎可以肯定是低估的,因為不少確診者不治,死亡人數持續增加。以2月28日COVID-19爆發在中國造成的病死情況,當日累計確診人數為79389,死亡人數為2838,病死率為2838/79389,即3.57%,從統計樣本取樣偏差的角度看,大有機會被低估。一般來說,在疫情未徹底終結前,難言有準確的病亡率數字。

計算方法不同結果有異

另一種計算方法,是根據染病的死亡人數除以已知結果的所有病人數量,即死亡人數加上痊癒出院的人數。這個方法同樣可以得出病亡率的數字,但這種計算方法,雖然避免了上文提及的未知終局病人的影響,卻會被另一因素控制,即患者康復所需要的時間,可能和從確診到死亡所經的時間不一樣。若病患者從受到感染到痊癒過程的時間比從感染到死亡的時間長,病亡率的數字便會高估。試想像,假如一群人同一時間被感染,兩個星期內便會導致死亡,但痊癒者並康復所經的時間則需一個月。這種情況下在兩個星期之內,確診後得知染病結果的病人都不幸病逝了,但卻沒有痊癒的人可以被納入統計,如果痊癒所經的時間較長,按這種計算方法得出的病亡率在初期是百分之一百,病亡率會較實際的情況高估;反之,若痊癒的時間較短,則病亡率便會低估。

換言之,確定相對準確的病亡率需要洞悉被感染後直至死亡或者痊癒的時間,以及兩者之間的相互比例,這樣才可以算出相對準確的病亡率數字。

再以2月28日在中國的疫情為例。當日累計死亡人數為2838,治癒人數為39049,則病亡率為2838/2838 + 39049,即日6.78%。從統計樣本取樣偏差的角度看,很大機會被高估。

和第一種方法比起來,病亡率3.57%與6.78%的差異相當大。在這段時間,即從2月初開始病亡率漸漸增加,原因是確診者需要經過一段時間才因無法挽救而病亡。當然,治癒率亦同時獲得提高。

年紀愈大病亡率愈高

以上我們解釋了集體性(全國性)病死率的統計預測,那這對個人有什麼意義?筆者再以2003年「非典」病毒於北京市的疫情結果來作例子說明。「非典」的最終病亡率為9.6%(死亡人數/確診人數的終極數字)。在北京,年齡24歲以下的人,病亡率小於1%;25至44歲為6%;45至64歲為15%;65歲或以上為50%,可見病亡率的風險高低,同年齡呈正相關。

再看COVID-19在中國爆發截至2月11日的統計,需要一提,COVID-19的疫情爆發仍在發展中階段。據統計,39歲或以下者,病亡率為0.2%;40至49歲為0.4%;50至59歲為了1.3%;60至69歲3.6%;70至79歲為8%;80歲或以上為14.8%。所以,一個50歲以下的人,「中招」之後病亡的機會率其實很低,充其量只有0.4%而已,香港的情況亦可如是理解。

另外,必須一提,這些病亡率數據是全國性的。按國家衞健委的統計數據,湖北病亡率為4.11%,湖北以外地區的病亡率為0.85%(包括所有年齡組別)。為什麼會出現如此差異?其中的原因,估計同醫療資源、數字統計、當地的恐慌性傳染,甚至樣本取樣統計偏差等因素有關。

數據對生活有多大用處?

引伸來看,湖北以外地區的病亡率為0.85%,不足1%,以香港在醫療設施和資源的力量,顯然優於內地城市,故病亡率相信會更低。在這種情況下,我們有必要把自己「自鎖」在家中,停止工作和正常生活行動?連出外運動的平常生活安排也取消,這樣是否反應過度?事實上,這些預測數據有多大程度對我們實實際際的生活有用?問題很值得思考。

對於今次COVID-19疫情病亡率計算的一些其他問題,以及疫情訊息對人類集體行為的影響,譬如,不分中外,各國群眾都在疫病爆發之際,紛紛搶購日常用,包括搶購廁紙等集體性行為邏輯,對這方面觀察和分析,因囿於篇幅,另文討論。

(二之一)

作者香港科大商學院會計學系副教授

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads