熱門:

2014年9月20日

黃錦輝教授

資訊保安不善 大數據難起飛

1962年颱風「溫黛」襲港,造成近600人傷亡。50年後,颱風「海鷗」同樣來勢洶洶吹襲香港,不同的是「海鷗」並沒有構成重大傷亡。市民能避過無情暴風的蹂躪,筆者認為香港天文台居功至偉。近年天文台引入先進科技監察氣象變化,從大量氣象數據中進行大規模的實時分析,提供精準及適時的預警及通告,令市民預早做好防風措施,確保自身及家居安全。這例子反映出「大數據」分析對社會的重要性。

另一例子是美國總統奧巴馬深信資訊科技的重要性,在第一任期時成功游說國會撥款20億美元推動全國「大數據分析計劃」,目的是鼓勵聯邦政府內部及各省市進行跨部門數據交流及分析,使政府能徹底了解市民的需求,繼而為市民提供更多、更好兼度身訂造的服務。簡單而言,「大數據」是指非比尋常、極度複雜的海量數據,其質與量已超越現有數據庫管理技術的處理能力。

國際資訊科技專家於初期用3個V來描述大數據的技術特徵:

大數據更新率(Velocity)異常迅速。例如現時全球各財務機構每秒處理一萬個以上的信用卡交易;美國沃爾瑪公司每小時處理超過100萬名用戶的買賣;全世界超過500萬人利用智能移動電話通話、上網、發短信、玩網遊等。這些應用與我們的日常生活息息相關,是典型的「大數據」源頭。據資訊科技專家估計大數據容量(Volum)在未來10年比現時的數據量將超越50倍,估計其容量將會超過「堯字節」(yotta-bytes, YB, 24位樓目)之多。

除了超海量之外,未來大數據的結構種類(Variety)將變得五花八門,除了數、文、圖、音、錄像等多媒體數據之外,也不乏社交網絡的關係圖(Social Network Graph)、遙感器訊息(Sensor Data)、半結構化數據(Semi-Structured Data)、知識(Knowledge)、規則(Rules)等非傳統數據。總括而言,在未來10年全球IT業界必須解決因「大數據」的容量(Volume)、異構性(Variety)及更新率(Velocity)三者所產生的一系列技術難題。

私隱盜竊愈來愈常見

然而,單是從技術層面不能全面顯示大數據的特徵,業界進一步從應用角度加插了另外兩個V。工程師利用先進軟件及統計技術來分析大數據,從中挖掘出有價值(Value)的知識,應用系統因而變得更優化、更高效。可是「垃圾進,垃圾出」(Garbage In Garbage Out, GIGO),不管分析技術如何先進,若果輸入的數據缺乏真實性(Veracity),輸出的結果必然不可靠。倘若不可靠的結果最終被採用,情況恐怕只會弄巧反拙。

筆者認為上述五個V還未足夠,未能確保大數據的實用性(practicality)。近期網絡入侵以至資訊盜竊及資訊毀壞等網絡罪行於全球猖獗,大數據庫(尤其是集中式雲端儲存伺服器)存在極大的保安隱患(Vulnerability)危機。這現象不但影響數據質量之餘,亦嚴重影響用戶對大數據應用的信心。

網絡入侵事件比比皆是,最為全球矚目的是2013年5月的美國真人版「竊聽風雲」事件,美國前國安局技術員斯諾登披露美國政府在外國進行資訊盜竊活動,受害者包括德國總理默克爾;而近期最熱烘烘的案例是美國「豔照門」醜聞,事件中多個國際知名女星的自拍裸照從雲端儲存器iCloud中被盜取。由此可見,隨着社交網絡服務的普及化,私隱盜竊的情況會愈來愈常見。

所謂「一朝被蛇咬,十年怕草繩」,以德國為例,竊聽事件過後默克爾便計劃與歐盟諸國設置歐洲內聯網,防止美國再次竊聽。筆者認為這方案太消極,治標不治本,不但損害了網絡的自由度及資訊的流通性,亦影響世界宏觀經濟發展。政府及專家們必須對症下藥,資訊保安問題一日未解決,大數據產業難有太大的發展空間。

作者為香港中文大學工程學院副院長(外務)、香港資訊科技聯會前會長

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads