2023年10月3日
中大校友開發本地首個AI中文作文批改軟件,聲稱按DSE中文科評分標準,且能針對性改善寫作技巧,已獲10間學校試用。連同席捲全球的ChatGPT,網友問我究竟得唔得?我並非這方面專家,唯可以答:一定得,是一定要得!
一般講法:AI無真情實感啦!死板啦!朋友,我們在討論考試、改卷呀,學生綁鴨子上架般於限定時間地點擠出來的文章,你認為有多少真情實感?本來就無;而作為公開試,沒客觀的批改標準(俗稱死板),談何公平?所以,一份試卷若不能以AI評分,反而是問題。
先來看看答題乃怎麼一回事。比較兩個人,直覺只舉不同之處吧,但考慣試就知,要把相同和不同都列出,例如中史科著名的「朱陸異同」。嗯,答朱熹和陸九淵同樣是男人有沒有分?沒有;答朱熹和陸九淵同樣是宋朝思想家,就有分;當然,marking scheme最想你答朱陸同為儒家學者卻抱持不同主張……即是,換我小學階段會寫他們是男人;換我現今,我會寫二人對嫖妓的態度──朱熹曾因妓女爆醜聞,陸九淵被學生謝希孟嘲諷不及娼妓靈氣──這難道不關乎思想主張事嗎?況且趣味得多啊;但換我在特定時空試場,我只會寫儒學異同囉。可見,考試只不過一項約定規則的遊戲,務求hit中出卷者心目中的標準答案罷了,電腦怎不大派用場?
古代未發明電腦,追求標準精神一貫,明清以八股文格式取士,只考《四書集注》一書(恰恰上文朱熹所編),遭詬病其局限性,卻勝在公平。比起唐朝科舉又「公卷」又「通榜」等開放氣氛,固然文采風流傳佳話,偏造成許多混亂和流弊。
考專注力
或曰:考試考不到真學問啦。朋友,公認最有學問的博士級,亦須經過考出來。求學當然求分數,甚至,考什麼並不重要,尤其背誦性的內容,隨手即Google到,就算專業人士也毋須死記,憑啥莘莘學子要於特定時空默寫出來?就是鬥耐性呀!看誰能夠定下心溫書。大學收生,職場招聘精英,講到尾,欲找專注力強而已,百搭的,學什麼和做什麼必然特別快上手。君莫笑填鴨式教育和公開試,那是測量專心致志的客觀尺度。
直接說就看誰乖,我記憶裏大學同學都超乖,背書已經磨蝕到無時間耍壞。近年大學之門放寬,收了一批毋須太勤力的學生,O camp便變得不太乖了。換着以前,根本不可能發生。若說大學生玩得方叫學風自由,識玩就不會玩到引火自焚吧。
如此這般,DSE既肩負着替社會選拔「穩陣」人才的責任,倘不能穩穩陣陣有套客觀標準可供電腦人工智能去學習、模仿和評級,無所適從,才屬危機呢。我睇好其發展;諷刺在,老師准用AI改卷,考生不准用AI答卷,又另一種不公平。
撰文 : 余家強
(編者按:余家強最新著作《佛系推理》現已發售)
歡迎訂購:實體書、電子書
訂戶登入