« 返回前頁列印

2019年8月21日

全民大數據 車品覺

數據匿名化 可用不可看

「匿名數據」(Anonymous data)為什麼對未來數據驅動(Data Driven)很重要?典型的匿名數據是把資料中一些敏感個人訊息,例如名字和電郵地址等個別特徵剝離,我叫作De-identify,以便讓個人身份無法被識別出來。經過這個過程後,數據可以合法地自由使用並轉移給第三方。從醫療保健、金融科技到廣告領域,「匿名化」數據使用也隨着個人私隱意識加強而日益吃重。 然而,弔詭的地方是匿名數據可以被還原,當有足夠的數據量通過機器學習,進行逆向技術以重新識別某個體不是難事。 美國有研究指出,可以使用15個較通用的特徵(包括年齡、性別和婚姻狀況等)在任何已經被「匿名」的數據中,正確地重新識別9 ...

(節錄)全文共969字