2016年6月20日
香港城市大學管理層發表早前校內活動中心綠化屋頂倒塌的調查報告,校方宣稱是源於承建商採用了錯誤數據,而計錯了屋頂的負荷能力,認為承建商應該負責。不過,建築及工程業界專家認為城大不夠專業,指若然在項目動工前,校方有入則屋宇署,不適合的數據必定能及早發現,而且不勝負荷的綠化天台設計一定不獲批。
筆者並非土木工程師,對事件中誰是誰非實在不宜置評,然而事件對資訊科技業界發展卻響起警鐘,業界必須引以為鑑。
近年大數據科技在全球工商業界炙手可熱,資訊科技業界紛紛推出不同複雜程度的大數據產品,「商務智能」(Bussiness Intelligence, BI)、「智慧城市」(Smart City)等應用有如雨後春筍,在世界各地大行其道,廣泛利用大數據分析,這些應用的有效性建基於數據的質量。數據的真實性(Veracity)是大數據分析成功的關鍵。「垃圾入,垃圾出」(Garbage In Garbage Out)乃計算機科學的基本理論,在實際應用上不論分析技術何等先進,若然輸入的數據質量粗劣、滿載噪音(noisy data)的話,分析所得出的結論絕不可靠,風險極高。再者,若結論直接應用於現實情境(如「綠化工程」),效果便會弄巧反拙。
料未來缺10萬名專家
未來大數據經濟,公開數據(包括來自政府及工商業界的數據)將會是有如水銀瀉地般布滿全球,當中數據的真實性自然難以確保。不真實大數據可以因為技術上失誤而產生,例如(1)數據超大量,系統無法分析當中最關鍵部分;(2)系統更新率過慢,來不及分析頻變的數據;(3)分析系統過於簡單,未能有效處理超多樣的數據媒介;及(4)欠缺專業知識的技術人員採用非客觀及不恰當的算法分析數據,導致錯誤結論。大數據科技日新月異,筆者認為上述1、 2及3項,分別與容量(volume)、速度(velocity)及異構(variety)方面息息相關的技術問題,隨着全球科研進步,不久的將來將能迎刃而解。然而,上述第4個問題源於人才不足,國際資訊科技研究公司預測美國工商業界於2020年將缺少10萬名數據科學家(data scientists)。面對這困境,香港業界亦不能獨善其身,所以政府與教育界必須配合市場的需求,完善大數據科學家及工程師的專業培訓。
錯誤的大數據分析造成的負面影響可大可少。以城大為例,若意外發生在學生考試時段,便不堪設想。筆者建議政府成立「大數據監管局」,對所有可影響市民生命財產(不論公或私營)的大數據應用分析系統、分析員,以及所牽涉的數據進行嚴格監控,保障大數據用戶的生命財產安全。上述建議並非天方夜譚,以「金管局」為例,金錢是市民的財富,市民會把它存入銀行,「金管局」是監督銀行的運作,目的正正是保障市民,與「大數據監管局」的使命類同。
事實上,上述的技術問題主要是非故意(unintentional)產生的,一般較容易解決。但是黑客或職業「鎗手」故意(intentional)植入的垃圾資訊卻防不勝防,這才是大數據分析的「死穴」。
香港中文大學工程學院副院長(外務)
香港資訊科技聯會前會長
香港專業及資深行政人員協會副會長
訂戶登入
下一篇: | fb成功之道 用戶多兼食腦 |
上一篇: | 渡邊太太重倉 加劇英鎊風險 |