熱門:

2018年6月28日

李亞力 數裏見真章

機器學習牛刀小試 預測恒指升跌

上期我們介紹了用K個最近鄰域(K nearest neighbors,KNN)的方法來進行機器學習(machine learning)來預測恒指升跌。首先我們選定了18個解釋變量,羅列如下:

X1︰恒指每日簡單回報百分比(1日前)

X2︰恒指上升(1)或下跌(0)(2日前)

X3︰恒指每日簡單回報百分比(3日前)

X4︰道瓊斯指數上升(1)或下跌(0)(1日前)

X5︰道指每日簡單回報百分比(2日前)

X6︰道指上升(1)或下跌(0)(3日前)

X7︰ 納斯特100指數每日簡單回報百分比

(1日前)

X8︰納指100上升(1)或下跌(0)(2日前)

X9︰納指100每日簡單回報百分比(3日前)

X10︰ 標準普爾500指數上升(1)或下跌(0)

(1日前)

X11︰標普500每日簡單回報百分比(2日前)

X12︰ 標普500指數上升(1)或下跌(0)

(3日前)

X13︰ 恒生中企指數每日簡單回報百分比

(1日前)

X14︰恒中企指上升(1)或下跌(0)(2日前)

X15︰恒中企指每日簡單回報百分比(3日前)

X16︰滬指上升(1)或下跌(0)(1日前)

X17︰滬指每日簡單回報百分比(2日前)

X18︰滬指上升(1)或下跌(0)(3日前)

我們試圖用這18個變量(稱為解釋變量,explanatory variables)來預測恒指升跌(稱為響應變量,response variable)。這18個變量是在算法測試階段(testing stage)中證明具有良好的預測能力後被選上的變量。

對以上的解釋變量,我們收集了3組數據,分別為:2016年3月4日至2017年3月8日;2017年3月9日至2018年3月8日;2018年3月9日至2018年4月18日。第一組數據用於培訓,第二組數據用於測試,第三組數據共26天,用來檢驗成效。培訓和測試數據用於選擇哪個解釋變量對響應變量(response variable)具有最佳預測能力。我們把K個最近鄰域方法用於培訓及測試數據,用不同的K值去進行檢驗餘下26天的準繩度,結果見【附表】。

在附表中,我們分別用K=1、3、5、7、9來進行機器學習,對升跌預測的結果,準確度都大於50%。例如,當K=1時,機習算法會使用最接近的歷史先例來幫助預測恒指是否會上升或下降。當K=3時,該機習算法會使用3個最接近的歷史先例作預測,再用投票規則來作最終預測。例如,假設3個歷史先例中2個預測上升,而剩下的一個預測下降,則算法將預測上升;對於K=5、7或9也是如此。最後,我們用傳統的邏輯回歸(logistic regression)去進行預測,從表列結果可以看出,K個最近鄰域方法有較大的準確度, 表示機器學習打倒了傳統的分析。

在附表中,由於檢驗數據中有26個交易日,所以正確和不正確的總和永遠是26。

表中的P值是統計測試的顯著度,其中零假設(null hypothesis)認為機習算法並不勝於拋硬幣(coin toss)所得的50%概率,而備選假設(alternative hypothesis)認為上述概率大於0.5。換句話說,備選假設認為機習算法優於拋硬幣。當P值小於5%(0.05)時,我們可以得出機習算法有顯著優勢的結論。在附表中我們看到︰只當K=1時,機器學習才有顯著的成效。

儘管從統計角度來看,預測準確性異常重要,但最終的試金石是投資的年化回報。假設我們遵循下面的簡單交易策略:當機習算法預測上漲(下跌),我們在交易日開始時即買入(賣空)1張恒指期貨合約,並在交易日結束時平倉。附表的最後一行給出了各種算法以及買入和持有策略的交易表現。正如所料,預測準確度愈高,交易表現就愈好(K=1回報為68.36%,較其他回報高)。此外,我們也不妨看看「長期持有」(Buy and hold)這個被效率市場信奉者推崇的策略,其年化回報只是-11.61%。

以上初步的研究指出︰雖然KNN機習算法非常簡單,但仍然可以輕鬆地處理預測升跌及用於制定投資策略。在未來的研究中,這樣簡單的機習算法是否可以處理更難的任務,比如預測不止兩個類別(漲幅超過1%,變幅在1%至-1%之間,跌幅超過1%)?

另外,在財務數據進行任何實驗性測試時,我們通常都會關注數據監聽(data snooping) 的問題。在本文中我們只提出一個測試結果,但如果我們用不同的數據集或不同變量,測試結果會否更佳?

有關機器學習的不少文獻都指出︰機器學習算法一般勝於傳統的統計分析。本文有關KNN機習算法能擊敗邏輯回歸其實是預料之內。文獻中尚不清楚的是,這樣簡單的機習算法是否也可以在某些選定的財務預測中擊敗其他比較複雜的深度學習算法(deep learning),這就有待更深入的研究了。

作者為香港大學統計及精算學系講師

 

 

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads