« 返回前頁列印

2020-05-04 00:00

全民大數據 車品覺

數據採集非愈多愈好

數據驅動的第一步是數據獲取,或者叫數據採集,也是最重要而又最容易被忽略的環節之一。記得當年在阿里的時候,馬總(集團主席馬雲)一再強調大數據的採集方式應該是recording而非capturing,因為recording更追求全量數據的密集收取。這是兩種截然不同的數據採集策略,前者以需求為導向,所以範圍可控,治理成本比較低;後者很容易給人一種數據愈多愈好的錯覺。難怪到了2014年馬總都忍無可忍地提出,繼續無止境的收集,賺錢部門都給你們(數據部門)打工了。可見這世上並沒有數據愈多愈好的道理,商業講求的就是實效,數據多也會成為負擔。事實上,以目標導向去收窄採集範圍,更容易建立規範包括內容格式、時效、 ...

(節錄)全文共1003字