熱門:

2015年11月17日

陳大為 睇大睇細

大數據也愛莫能助

說起未來,Big data已經說到爛,不過,多數是集中在如何通過分析海量不同性質不同基礎的數據,從中找出模式和共同點,以分割和歸類不同群組內的共性,然後方便商家「度身訂造」相關的市場策略,提供更貼身的服務和產品,既提高用家的滿足,當然也提高商號的收入和利潤。

只是,這其實有點問題。

以筆者自己為例。如果只以行業及收入(投機者),近幾年買過的書和雜誌(不少的確也跟財經有關)、出外用餐的紀錄(最頻密的是意大利菜)、常做的活動(健身和跟朋友聚會),然後假設從大數據看,似乎這類人應該會是愛紅酒、愛芝士、愛去高級bar happy hour、愛去「靚」地方旅遊、愛名車、愛去上財經課,還有愛看某些有品味的電影。於是根據這種分析去幫我度身訂造相關的產品、服務,和推薦活動,恐怕就會大失所望。

我不懂喝酒,更不愛芝士伴酒,我不大去旅行;我愛看書,近幾年的書是以財經佔多,卻多是以歷史角度和演化角度看,我更鍾情歷史。而且,最近我還因參與一個讀書活動,重拾對物理學和生物學的興趣。我固然愛看勁用腦的電影,但也很喜歡《星球大戰》系列(Star Wars)、Marvel and DC superheros之類科幻動作,甚至也喜歡《見習冇限耆》(Intern)、《真的戀愛了》(Love Actually)、《鋼琴戰曲》(The Pianist)之類的電影(當然還有AV)。

其實就算全盤掌握我的喜好,那也只是過去和當下的喜好,不代表未來。筆者雖然絕不前衞,卻也不是一成不變,甚至如果獨自旅遊,是連實際的時間表和一個城市內的目的地都不預先計劃,去到哪裏就隨心而跑的人。大數據或許可計出我有很大的隨意性,卻無法計到下一刻到底我會想怎樣。

資訊人人有 藍海變紅海

相反,假使用家願意相信由海量數據歸納出來的建議特別「合心水」,則倒過來會形成一個循環:覺得大數據給的提議合用,於是更多的like、買賣、使用,和分享都以這些推介為基礎。這些推介產生下一堆數據會更接近原先的特質(一如投資上的reflexivity),只是分類更精細的建議。之後用家覺得更合心意,繼續加入類似數據。餘此類推,整個行為變成「自我實現的預言」。

更要命的是:其實有大數據的又豈只一家。當數據量和維度增加後,掌握數據的那幾家公司,其數據的分別已有限。分析數據的那些統計模型,亦來來去去就是那幾套,於是結果都是推差不多的東西:這樣競爭當然大。原本希望用大數據找所謂藍海的企圖,變成在紅海裏打泥漿摔角。

在這裏不是說Big data壞話。但如何運用Big data,除只會找模式外,如何加上隨意性,投石問路,以圖得出不同結果,甚至啟發,這恐怕才是Big data發展的方向。

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads