2015年1月26日
談到電腦學中的算法(Algorithm),我說算法也是一種技術,能力愈高競爭力必然愈強。例如數碼相機可以自動辨別人臉,甚至鎖定人物焦點,這內裏就是一個算法,鏡頭傳來的影像數碼轉化後,儲存在記憶體的矩陣,那裏的數據相等於人臉,這必定有程序計算出來。2000年代初期,掌握這計算方法做出來的產品,必然比人優勝。
變身應用產品 大行其道
幾年前,我在歐洲見到一個產品,用特製的筆在紙張上書寫,寫成的每頁內容自動存儲入電腦之內。這種筆是特製的,在筆尖有一個小型鏡頭,這不難,但這不足以把手寫的內容全然記錄,還有一個關鍵的算法。原來,雖然只是普通印刷的紙張,但印有特別設計的網點;這網點並非平均分布,而是按一定的規律變化,每個範圍的形狀不同,亦不重複。
這樣的網點圖形全部開展出來,據說面積幾近足球場那麼大,因此印在A5的拍紙簿上,每頁都不重複,筆上的鏡頭便可轉化為電子筆迹。這是北歐一家公司的發明,關鍵在於生產這種網點的算式(大概是一個周期很長的函數)。當然,怎樣把技術變為成功的產品那是另一回事。
90年代初,一個成功例子是華人社會趨之若鶩的中文手寫板。用者以筆桿寫在觸感板上,筆觸化為點陣數據,怎樣計算出每一筆迹最近似的中文字呢?這屬於machine learning的題目,現在看來沒多大困難,打開教科書都大概找到答案,但20年前這還是較尖端的算法問題,當時台灣的業者比較掌握這個算法,推出的產品風行華人地區(特別是香港,原來香港人的輸入法最差,於是手寫板大賣)。
可助反恐找敵人
近年盛行的大數據亦亟需算法的開發。所謂大數據,當然不止是雲端上儲存一大堆數據,真正的目的是發掘內裏的知識,以轉化為行動。例如網上的電影租賃,假如我們已知用者的一些動向,例如在哪裏消費、購物內容等,能否推斷那部電影最合適?若然配合用者的朋友資料,推斷的機率可提升,但又能否在有限的時間內完成運算?凡此等等,都是現時電腦學研究十分活躍的題目。美國IEEE學會每年辦有名為KDD的活動,當中設有這種算法的比賽,採用真實的大數據,要成功奪標必須算法(理論)和程式(實踐)的能力兼具。
美國在「911」之後動員大量人力物力進行反恐,相信是促進大數據研究的一個動力。若然大量的數據能推算用者對電影的喜好,那麼同樣的方法能否找出潛伏的敵人?不過,並非每一個電腦學者都願意參與這方面的開發。情況令人想起40年代的物理學界,並非所有人都願意參加原子彈的開發。日後或會出現所謂concerned scientist(科學家關注社會)的聲音,反思技術應用的目的和後果。
馮文
資深IT人,從事電腦、媒體、政策及教研工作
訂戶登入