熱門:

2016年11月9日

車品覺 全民大數據

大數據根基在利益分配

任何零散的數據一旦連結形成大數據,便會威力無窮。就拿醫療數據為例,如果我們把人類生物學的複雜性比作一部動畫電影,那麼在一百年前,我們對這種複雜性的了解大約相當於電影畫面的一個圖元。可是,若看完整部電影,我們便很容易知道它說的到底是怎樣的一個故事。醫療大數據的建立,正是了解整部電影的最佳視窗,所以說當各大醫療數據成功實現了聯防,癌症便不再值得害怕。

尋共同「痛點」助鼓勵分享

在龐大的市場及科研潛力面前,夏特(Eric Schadt)這位試圖讓醫療數據共用成為現實的先驅者,顛覆傳統創立了自己的基因數據公司Sema4,一個致力創建千萬級基因技術庫的基因數據平台。雖然這件事情非常偉大和有意義,但其面臨的困難亦無疑很巨大。連夏特本人也無奈承認,「儘管已經投入數十億美元,用於對現有數據網路進行現代化改造和提供安全保障,但數據洩露事件仍然時有發生。」若不徹底根治這問題,支撐項目的信任基礎將變得脆弱。

然而,病患的醫療數據屬於個人擁有?還是醫生與病人共同創造的呢?任何大數據的形成必須經歷兩個過程,即開放與規範,兩者為遞進關係,前者是深度連結的前提,後者涉及數據的可用性。實現從零到一的過程中,首先就必須找到個體與機構之間的平衡點:人們有意願把自己的基因數據分享嗎?憑什麼?企業結集了這些大數據之後,又如何對個體有益呢?若不能達到互利,又怎樣讓更多人願意貢獻出自己的基因數據呢?

下一步要解決的問題,是如何鼓勵已擁有大量數據的醫療機構願意共用數據,讓各企業或者業務單元放棄自己的數據孤島。從我過去在阿里巴巴的經驗中,唯一的方法就是找出共同的「痛點」,當得到的利益高於他們之間的競爭,共用會變得理所當然。

接着便是規範化,我們費勁辛苦收集到的數據,該以什麼方法加工,然後成為解決問題的原材料呢?數據界大致分為兩派,一派堅持原始數據,即盡可能保持數據的原貌(裸數據)。另一派較喜歡把收集的數據規範化和格式化,根據使用的場景進行預處理。其實,數據是虛的,Solution才是實在的,沒有場景作目標的大數據如同散沙,但太實相的大數據又不靈活。所以說,不論金融大數據抑或醫療大數據,都會經歷從無到有、從有到高度連結、從連結到即時流通,最後經過工程化把數據提煉成隨時可用的「業務石油」。到那時,毋庸置疑,它會產生龐大的商機及無與倫比的回報率,但是投入的代價也着實並不便宜。

車品覺

紅杉資本中國基金專家合夥人、原阿里巴巴集團副總裁

 

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads