2020年12月5日
很少閱讀經濟學普及著作,例如大名鼎鼎的Freakonomics,我是一頁也沒有翻過的。不是因為這些書寫得不好,而是書中內容已經學過,提及的研究亦早有所聞,讀起來自然就趣味欠奉,很快失去耐性。
兩星期前提及華盛頓大學兩位學者Carl T. Bergstrom和Jevin D. West的新書Calling Bullshit是個難得的例外。副題The Art of Skepticism in a Data-Driven World,此書教的是如何在這個充滿數字圖表的年代不受人惑,內容離不開基本統計分析,都是經濟學者常用的概念和工具,但我竟花了幾天時間就讀完,而且還有追看的快感,也許是書中例子太有趣了。
靚仔無本心 罪犯有樣睇?
有個經常聽到的說法,是男性樣貌愈好,其性格大多愈差,愈大機會是渣男。又有一種說法,就是女性外表愈出眾,也是較難相處,又挑剔又眼角高。勉強解釋,大概就是外在條件優勝,成長中際遇自然與眾不同,較多人遷就你、給你好處,久而久之,就形成性格缺陷。
原來就算男女性格跟外貌全無關係,我們都會得出以上結論!究其原因,就是我們交朋友和談情說愛都不是隨機的,取樣因而有偏差,亦即出現了經濟學者經常留意的selection bias。樣貌差性格又差的人,「衰到冇朋友」,我們自會敬而遠之。人美又心善、靚仔又好人的理想對象,又未必有閒情跟我們這些普通人交往。由於現實所限,我們只能在中游位置生存,認識的大都是性格和外貌皆普通,又或只有一樣較佳的人,於是我們就有性格和外貌成反比的印象了。
另一個例子更有娛樂性。話說幾年前有兩位學者提出一個大膽想法,聲稱利用機器學習(machine learning)技巧,可以在沒有其他資料輔助之下,單憑照片外貌判斷一個人是否有犯罪傾向。機器學習近年相當流行,大家應略有所聞,大概做法就是利用一些數據去「訓練」電腦,讓其摸索出一套理解數據的方法,而當面對新數據,電腦程式就能照辦煮碗,作出各種預測了。
研究做法就是先給電腦「閱讀」大量的近照,並且「告訴」電腦哪些是罪犯、哪些不是,「訓練」過後,就可以嘗試去分析另一堆近照,看看預測有多準繩了。研究發現,「訓練」過後的電腦判斷異常準確,猶如科幻電影成真。根據機器學習的分析結果,憑照片為正邪定分界的關鍵所在,是相片中人嘴唇弧度和雙眼距離。
原來,研究用的數據有明顯偏差。普通人拍照,就如在社交網絡selfie,大都想表現自己最好一面,帶着微笑,雙眼有神,但罪犯照片大多來自警局,被警方拘捕扣留之時,心情當然甚差,精神狀態也不會太好,雙眼難免下垂,也不會露出什麼笑容。利用機器學習搞了一大輪得出的研究結果,其實只證明了罪犯拍照時較「樣衰」而已。
面對資訊爆棚要有懷疑精神
早前在本欄提及參與學術出版的兩個用處,一為懂得利用學術手法說項辯護,二為能夠識破真真假假的學術包裝。只是學院以外的普通讀者,對學術研究製作過程了解不多,亦很容易給各種行內術語專有名詞嚇怕,面對排山倒海的統計數字、「有圖有真相」的數據分析,不想照單全收的話,就要靠Calling Bullshit這類普及書籍,透過大量例子去武裝保護自己,學懂以有限的基本知識去無疑處有疑。就如剛才提到罪犯有樣睇的研究,百分之九十九點九的人都不知道機器學習的技術內容,當然亦未曾在工作上應用過,但只要知道garbage in garbage out的道理,察覺到數據來源有問題,無論研究方法聽起來有幾高深,自會對其驚世結論多幾分質疑。
上網閱報,不時讀到飲酒增加或減低患上某某疾病機會的可能、某大民調機構指出有百分之幾點幾市民支持或反對什麼、名牌大學研究團隊研究發現ABC導致XYZ、一圖看清這個那個社會現象國際差異,數字資訊爆棚,但其中既有事實亦有垃圾。此書作者認為,為人為己盡公民責任,我們都要有一點拆穿屁話、戳破謊言的能力。
話雖如此,我認為有心有興趣去查證是非對錯的始終是少數,畢竟事實未必是最「啱聽」,而用心去思考每個數字亦費時失事。有KOL天天給你報新聞、說故事、作分析,有別人替你思考幫你「fact check」,省事又舒暢,又不會聽到自己不喜歡的立場或結論。活在虛幻世界真美好,又何苦事事求真、親力親為呢?
香港亞太研究所經濟研究中心成員/美國維珍尼亞理工大學經濟系副教授
http://www.facebook.com/economics3.0
訂戶登入
下一篇: | 天下武功唯Arista不破 |
上一篇: | 疫情將怎樣結束? |