« 返回前頁列印

2022-12-13 00:00

科網人語 鄧淑明博士

人工合成數據利弊

人工智能(AI)的智慧來自海量數據,而今天很多地方都收緊保護私隱政策,故此,不會違反個人私隱條例的人工合成數據(Synthetic Data)應運而生。有人估計它的成本僅為真實數據的1%,自然吸引企業參與。 不單如此,真實數據可能無法反映實況,如不同種族、國籍比例,而合成版本則可減少偏差。另一方面,合成數據也可就罕見情況提供更多樣的數據,彌補難以從現實獲得這些資訊的問題。 合成數據可以是文本、媒體(片段、圖像、聲音)和列表。根據真實資料的含量,大致分為三類:一)真假各半,二)模擬真實並加以改動,三)完全虛構。 時至今日,從銀行、醫藥到無人駕駛等多個行業也有使用合成數據。據報美國運通兩年前已開始 ...

(節錄)全文共1008字