一、理論構建
量化投資策略必須基於可論證的經濟理論.投資邏輯或市場經驗,理論邏輯基礎可以來自學術論文、研究報告或自身對市場的觀察。
數據準備
量化投資策略開發需要基於較長時間段的穩定的市場數據,不僅在於歷史模式的統計歸納,也包括樣本外檢測的數據長度要求。選擇合適頻率和長度的市場數據不僅爲建立量化投資策略的有效性提供了統計意義上更強大的支持,同時也爲擯棄外部因素對證券市場的影響,更好地觀測市場微觀結構提供了途徑。
市場數據的準備主要包括數據的提取和數據的清洗兩部分。
數據的提取
根據量化投資策略開發的需要選擇合適頻率的數據,宜統一採用統一數據源的數據,可以避免不同數據來原的數據由於整合方式的不同導致的不匹配現象。在提取數據時應避免在原始數據中用到未來的數據信息。
數據的清洗
直接從數據供應商處獲取的市場數據需要進行嚴格的數據清洗,爲了保證量化投資策略的可複製性,對數據清洗應按照統一的規則進行。邏輯處理:主要採用市場公認的邏輯判定對數據進行初步處理,包括非交易日或非交易時間的冗餘數據剔除,同一時點重複數據或中突數據的剔除,對高開低收的大小關係進行判定,及股價日波動幅度超過土10%的限制,對張跌幅的判定結合是否是上市首日及股價的四舍五人等。自主處理:股票因停牌而缺省的數據沿用上一有交易時點的數據,由於技術原因未錄入的缺省數據可用線生插值法,沒有末端數據的情況可採用對應指數收益率補齊。
樣本的選取
樣本的選取是構建量化投資模型的基礎工作,統計分析的核心思想就是利用樣本點的統計特徵來刻畫描述總體的特徵。在量化投資交易系統的統計檢驗中,樣本通常是指針對某一交易系統的原始數據,例如某一股票的歷史交易價格、交易量、盈利情況、交易系統的收益率等。
在構建量化投資模型時,研究人員需要將樣本數據輸入模型進行計算從而得到交易信號,在這個過程中,最理想的結果就是選取的樣本具有絕對的代表性,即盡量能夠包含所有可能的市場情形(如牛熊市,趨勢盤整),從而在未來的交易中可以出現符合模型預期的收益。但是金融市場的結構往往是複雜的、變化的,今天的市場結構並不一定能夠代表明天的市場結構。例如,2010年滬深300股指期貨推出的前後,中國資本市場的微觀結構就發生了很大的變化。因此,樣本的選取必須與當前市場結構儘量保持一致,具有代表性的樣本選取對統計檢驗的作用是至關重要的。
在選取樣本的過程中,樣本的大小也是影響樣本質量的一個重要指標,越近的樣本,具有的代表性越好,離今天越遠的樣本,代表性越差甚至產生不利的影響,從而在對樣本數據的長度進行選取時需要仔細地衡量選取樣本的長度和代表性兩個方面。
參數優化
參數優化同樣也是量化投資策略構建時的一個基礎問題,參數優化的目的在於通過調整模型參數來提高投資策略收益,並減少收益率曲線的波動性,從而構建獲得高風險調整後收益的策略。在構建投資模型時,參數優化是其中一個必不可少的環節,合理的參數優化可以使得投資模型在整個交易過程中(樣本內和樣本外)均有良好的表現。然而,無效的參數優化會使投資模型在樣本內測試階段獲得非常好的收益率,但是這個高收益率不能在樣本外延續,進而影響在實戰階段的投資業績。
績效評估
在對量化投資策略的結果進行評估的時候,首先,要列出交易流水報告以便於驗證策略回測結果的正確性,得出策略的淨值曲線及相應的收益率、勝率和夏普比率等風險收益指標;要對參數進行分析,對於自上而下的策略開發邏輯,要在統一的市場上對不同的參數進行檢驗,通過檢驗參數的敏感性來反映策略一邏輯的有效性,對自下而上的策略開發邏輯,要使用同一參數在不同的市場上進行檢驗,已確認策略一邏輯的有效性;要對收益的結果進行統計檢驗,以便反映策略表現水平,更好地理解策略和認識策略的收益來源(如t檢驗、自相關序列檢驗)。
撰寫技術文檔
量化投資策略的開發應有配套的技術文檔,以用作記錄、查詢、培訓及推廣。技術文檔應該詳細論述策略的投資理論和邏輯基礎及有效性檢驗論證,並詳細記錄樣本內外數據的選取、模型的建立、樣本內外的測試結果及風險收益和績效統計分析結果。如果對策略進行修改或參數優化,在技術文檔中應對所做的修改和優化進行詳細的記錄。
當量化投資策略開發完成後,進場時機的選擇是一個非常重要的問題,好的進場時點可以在短時間內迅速獲得利潤;而離場條件的確定是一個策略能夠獲得正收益且保住收益的非常關鍵的1步,如何確定離場標準是一個非常值得研究的問題,通常的離場判定標準主要考慮止損、止盈和止平三個方面。
在實際應用中,通過財務指標和量化選股方法,結合期指套保對沖風險,構建能持續戰性指數的股票投資組合是有效可行的。在引入新型量化投資策略和量化投資方式的同時,也應該引入優質的量化風險管理機制、模型、系統等,確保“創新和風控”並重。