2015年11月28日
今時今日,大數據已成了中小企業、大型企業、 互聯網公司的流行術語(buzz word)。當前,無論各行各業,都面臨資料洪流(data deluge)的衝擊。
環顧其他行業,一般有規模的公司都希望能夠預測消費者行為、預測產品的銷售、預測客戶需求等,而大數據的用途主要是提升這些預測的精準。
其實,股票投資的行業一早已採用大數據規模的Time Series作預測股價。只不過,我們習慣稱為高頻數據。許多短炒散戶只會以圖表技術分析進行股價預測,對於專業的短炒投資者而言,估計股價波動率(volatility)是必須做的工夫。為的是捕捉不確定的股票回報程序,從中研發在不同時期合適交易策略(trading strategy)。
一直以來,估計股價的波動率(volatility)的方法,習慣上是用上「參數模型」(parametric model),例如ARMA模型、GARCH模型等。可惜在實際的應用上,這些股價預測的方法,仍存在不少的誤差。所以,Merton在1980年提出用高頻數據,來增加估計股價波動率的準確性。
高頻數據與大數據相似
整體而言,不論是高頻數據的分析預測,或是大數據的分析,兩者有相似的發展,就是已經進入一個新層面。在新的層面中,任何類形的資料分析,不再依賴任何理論的模型。因為大數據是採用所有數據,不是隨機樣本分析。
2008年,Chris Anderson發表了理論的終結(The End of Theory)的言論。他指出,大數據和新發展的處理資的料統計工具,分析預測的工作,不需要建基於合乎科學化的理論模型,因為大數據資料的相互關係取代了因果關係。
從2006年開始,當時筆者在加州大學洛杉磯分校(UCLA)經濟系修讀博士學位,正是用高頻數據來估計股價波動率。
2011年,筆者完成的博士論文,研究的是關於交易日內的股價波動率(volatility)。這研究用的是一個「非參數法」(non-parametric approach)的計算方法,即是說估計股價波動率的背後,沒有一定的理論模型、只是直接利用「日內交易」(intraday)數據去計算出股價波動率。
筆者採用了道瓊斯工業平均指數(DJIA)中30間上市公司,加上根據美國標準普爾500指數走勢作標準的ETF,把它們從2001年至2009年這段期間在紐約證券交易所(NYSE)的TAQ數據庫的股價資料作分析。
筆者如何搜集DJIA的成分股及SPDR ETF的股價波動率呢?這不折不扣是「眾裏覓它千百度」的做法。
筆者把從2001年到2009年當中69220個交易日的每一個交易日,分成78個5分鐘間隔(5 minutes interval)、再以300個一秒頻率的對數收益率函數(log return)的累和(cumulative sum)來計算,以作每5分鐘間隔(5 minutes interval)的日計波動率。這做法比以往一些估計高頻數據股價的學術研究,以每5分鐘間隔(5 minutes interval)作計算日計波動率所得的數據更為細緻,更能捕獲投資者的動態。
從以上方法得出的秒頻股價波動率,是高頻數據的一個例子,就也是股價的大數據。
參考:
Robert C. Merton, On estimating the expected return on the market:An exploratory investigation, Journal of Financial Economics, Volume 8, Issue 4, December 1980, Pages 323–361.
Chris Anderson, The End of Theory: The Data Deluge Makes the Scientific Method Obsolete, 2008. http://www.wired.com/2008/06/pb-theory/
Marcus Liu,Stock Price Volatility within a Trading Day, Ph. D. Dissertation, UCLA. June 2011.
作者為理工大學專業進修學院客座講師
訂戶登入
下一篇: | 短期欠動力 日股展望仍樂觀 |
上一篇: | 資產價格處高位 揀派息股為上 |