熱門:

2016年6月20日

黃錦輝 宏觀視野

城大塌頂敲響大數據產業警鐘

香港城市大學管理層發表早前校內活動中心綠化屋頂倒塌的調查報告,校方宣稱是源於承建商採用了錯誤數據,而計錯了屋頂的負荷能力,認為承建商應該負責。不過,建築及工程業界專家認為城大不夠專業,指若然在項目動工前,校方有入則屋宇署,不適合的數據必定能及早發現,而且不勝負荷的綠化天台設計一定不獲批。

筆者並非土木工程師,對事件中誰是誰非實在不宜置評,然而事件對資訊科技業界發展卻響起警鐘,業界必須引以為鑑。

近年大數據科技在全球工商業界炙手可熱,資訊科技業界紛紛推出不同複雜程度的大數據產品,「商務智能」(Bussiness Intelligence, BI)、「智慧城市」(Smart City)等應用有如雨後春筍,在世界各地大行其道,廣泛利用大數據分析,這些應用的有效性建基於數據的質量。數據的真實性(Veracity)是大數據分析成功的關鍵。「垃圾入,垃圾出」(Garbage In Garbage Out)乃計算機科學的基本理論,在實際應用上不論分析技術何等先進,若然輸入的數據質量粗劣、滿載噪音(noisy data)的話,分析所得出的結論絕不可靠,風險極高。再者,若結論直接應用於現實情境(如「綠化工程」),效果便會弄巧反拙。

料未來缺10萬名專家

未來大數據經濟,公開數據(包括來自政府及工商業界的數據)將會是有如水銀瀉地般布滿全球,當中數據的真實性自然難以確保。不真實大數據可以因為技術上失誤而產生,例如(1)數據超大量,系統無法分析當中最關鍵部分;(2)系統更新率過慢,來不及分析頻變的數據;(3)分析系統過於簡單,未能有效處理超多樣的數據媒介;及(4)欠缺專業知識的技術人員採用非客觀及不恰當的算法分析數據,導致錯誤結論。大數據科技日新月異,筆者認為上述1、 2及3項,分別與容量(volume)、速度(velocity)及異構(variety)方面息息相關的技術問題,隨着全球科研進步,不久的將來將能迎刃而解。然而,上述第4個問題源於人才不足,國際資訊科技研究公司預測美國工商業界於2020年將缺少10萬名數據科學家(data scientists)。面對這困境,香港業界亦不能獨善其身,所以政府與教育界必須配合市場的需求,完善大數據科學家及工程師的專業培訓。

錯誤的大數據分析造成的負面影響可大可少。以城大為例,若意外發生在學生考試時段,便不堪設想。筆者建議政府成立「大數據監管局」,對所有可影響市民生命財產(不論公或私營)的大數據應用分析系統、分析員,以及所牽涉的數據進行嚴格監控,保障大數據用戶的生命財產安全。上述建議並非天方夜譚,以「金管局」為例,金錢是市民的財富,市民會把它存入銀行,「金管局」是監督銀行的運作,目的正正是保障市民,與「大數據監管局」的使命類同。

事實上,上述的技術問題主要是非故意(unintentional)產生的,一般較容易解決。但是黑客或職業「鎗手」故意(intentional)植入的垃圾資訊卻防不勝防,這才是大數據分析的「死穴」。

香港中文大學工程學院副院長(外務)

香港資訊科技聯會前會長

香港專業及資深行政人員協會副會長

 

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads