2021年8月19日
話說有大數據公司估算奧運賽果,其中對香港的預測竟然剛好是1金2銀3銅,跟實際結果一樣,曾引起一陣討論。抱着懷疑精神,我到網上查證這間公司的其他預測,發現有不少偏差甚大,令人懷疑估中香港是否有點撞彩。相反,更有名而備受推崇的預測網站FiveThirtyEight,預料香港只有一面獎牌,就大錯特錯了。
現場氣氛如何影響健兒表現
其實要判斷預測是否準確,不能單單抽出香港來比較,而且要清楚界定比較對象是什麼。只得一套預測,優劣無從說起,要麼就是與預測模型一較高下,要麼就看模型是否比賠率準確,總要有個競爭對手。
這些預測是如何煉成的?基本做法是搜集所有參賽運動員的數據,再根據近期大小地區國際賽的往績,加起來推算奧運時的表現。一如所有「人工智能」的統計模型,方法只能參考過去的「大數據」,再假設將來情況相似。當情況出現重要改變,模型就難以避免出現偏差。就如欄友徐家健昨日指出,今次東京奧運除了運動員要經過重重檢疫關卡,現場亦幾乎沒有觀眾,在奧運前的訓練過程中,視乎各地疫情運動員亦面對不同程度的干擾限制,表現因而受影響。沒有前車可鑑,這些都不是「人工智能」可解決的困難。
樂觀點看,今次奧運也是個難得的學習機會,讓人腦和電腦了解疫情和表現的關係。雖然只有這一次奧運是如此特別,但由於比賽項目眾多,而不同地區受疫情影響的性質亦大有分別,透過比較不同項目、運動員的預測「甩轆」情況,我們可以從中推算個別因素的重要性。
例如足球、籃球等運動,就曾有實證研究指出,現場觀眾的聲嘶力竭足以改變球員士氣,甚至球證也受氣氛「震撼」,判決不自覺地有偏差。相反,長跑、單車等與觀眾距離較遠的項目,打氣效果很可能較輕微,有沒有疫情分別不大。又例如某些運動的練習場地較受防疫措施影響,奧運前取消國際賽的情況也因項目而異,這些都跟運動員的身心狀態有關。
港隊能否再創佳績?
這些實證研究,不只有象牙塔的價值,亦有其現實意義。
香港隊今次表現出眾,隨之而來的是個「掃興」問題:好成績多少是源自疫情影響?最悲觀的解讀,就是現場觀眾對經驗較淺的運動員帶來較大壓力,又或由於香港人口不多,在現場永遠給對手觀眾的氣勢比下去。若是如此,東京奧運近乎鴉雀無聲,香港運動員就有難得的優勢,而這優勢在下屆奧運就大有可能消失。
較積極的看法是,政府近年「投資有道」,就如欄友昨日提到以億元計的「體育盛事配對資助計劃」,既為某些運動帶來更多資源,對運動員來說也是一個重要動力,是以今屆奧運表現奇佳。若然如此,只要政府維持政策甚至加碼,香港在下屆奧運就繼續有獎牌機會,好表現並非只此一次。其中的分析關鍵是,有些項目得到資助較多,從而可驗證其表現有沒有特別標青。
是悲觀還是樂觀,以及各自的比重為何,答案可在數據中尋。這不算是什麼「大數據」,也不必要用到什麼高深的統計方法,但要搜集相關的賽果和運動員資料,工程則頗為浩大,是要耗費數十小時的艱苦工作。對這問題有興趣的大學生,大可以此為畢業論文題目,而關心香港體育事業的組織和機構也不妨研究一下,嘗試解釋香港的奧運表現。
香港亞太研究所經濟研究中心成員、美國維珍尼亞理工大學經濟系副教授
http://www.facebook.com/economics3.0
訂戶登入
下一篇: | 美國從阿富汗止蝕 醜態百出 |
上一篇: | 與亞馬遜作對的男人 |