一、理论构建
量化投资策略必须基于可论证的经济理论.投资逻辑或市场经验,理论逻辑基础可以来自学术论文、研究报告或自身对市场的观察。
数据准备
量化投资策略开发需要基于较长时间段的稳定的市场数据,不仅在于历史模式的统计归纳,也包括样本外检测的数据长度要求。选择合适频率和长度的市场数据不仅为建立量化投资策略的有效性提供了统计意义上更强大的支持,同时也为摈弃外部因素对证券市场的影响,更好地观測市场微观结构提供了途径。
市场数据的准备主要包括数据的提取和数据的清洗两部分。
数据的提取
根据量化投资策略开发的需要选择合适频率的数据,宜统一采用统一数据源的数据,可以避免不同数据来原的数据由于整合方式的不同导致的不匹配现象。在提取数据时应避免在原始数据中用到未来的数据信息。
数据的清洗
直接从数据供应商处获取的市场数据需要进行严格的数据清洗,为了保证量化投资策略的可复制性,对数据清洗应按照统一的规则进行。逻辑处理:主要采用市场公认的逻辑判定对数据进行初步处理,包括非交易日或非交易时间的冗余数据剔除,同一时点重复数据或中突数据的剔除,对高开低收的大小关系进行判定,及股价日波动幅度超过土10%的限制,对张跌幅的判定结合是否是上市首日及股价的四舍五人等。自主处理:股票因停牌而缺省的数据沿用上一有交易时点的数据,由于技术原因未录入的缺省数据可用线生插值法,没有末端数据的情况可采用对应指数收益率补齐。
样本的选取
样本的选取是构建量化投资模型的基础工作,统计分析的核心思想就是利用样本点的统计特征来刻画描述总体的特征。在量化投资交易系统的统计检验中,样本通常是指针对某一交易系统的原始数据,例如某一股票的历史交易价格、交易量、盈利情况、交易系统的收益率等。
在构建量化投资模型时,研究人员需要将样本数据输入模型进行计算从而得到交易信号,在这个过程中,最理想的结果就是选取的样本具有绝对的代表性,即尽量能够包含所有可能的市场情形(如牛熊市,趋势盘整),从而在未来的交易中可以出现符合模型预期的收益。但是金融市场的结构往往是复杂的、变化的,今天的市场结构并不一定能够代表明天的市场结构。例如,2010年沪深300股指期货推出的前后,中国资本市场的微观结构就发生了很大的变化。因此,样本的选取必须与当前市场结构尽量保持一致,具有代表性的样本选取对统计检验的作用是至关重要的。
在选取样本的过程中,样本的大小也是影响样本质量的一个重要指标,越近的样本,具有的代表性越好,离今天越远的样本,代表性越差甚至产生不利的影响,从而在对样本数据的长度进行选取时需要仔细地衡量选取样本的长度和代表性两个方面。
参数优化
参数优化同样也是量化投资策略构建时的一个基础问题,参数优化的目的在于通过调整模型参数来提高投资策略收益,并减少收益率曲线的波动性,从而构建获得高风险调整后收益的策略。在构建投资模型时,参数优化是其中一个必不可少的环节,合理的参数优化可以使得投资模型在整个交易过程中(样本内和样本外)均有良好的表现。然而,无效的参数优化会使投资模型在样本内测试阶段获得非常好的收益率,但是这个高收益率不能在样本外延续,进而影响在实战阶段的投资业绩。
绩效评估
在对量化投资策略的结果进行评估的时候,首先,要列出交易流水报告以便于验证策略回测结果的正确性,得出策略的净值曲线及相应的收益率、胜率和夏普比率等风险收益指标;要对参数进行分析,对于自上而下的策略开发逻辑,要在统一的市场上对不同的参数进行检验,通过检验参数的敏感性来反映策略一逻辑的有效性,对自下而上的策略开发逻辑,要使用同一参数在不同的市场上进行检验,已确认策略一逻辑的有效性;要对收益的结果进行统计检验,以便反映策略表现水平,更好地理解策略和认识策略的收益来源(如t检验、自相关序列检验)。
撰写技术文档
量化投资策略的开发应有配套的技术文档,以用作记录、查询、培训及推广。技术文档应该详细论述策略的投资理论和逻辑基础及有效性检验论证,并详细记录样本内外数据的选取、模型的建立、样本内外的测试结果及风险收益和绩效统计分析结果。如果对策略进行修改或参数优化,在技术文档中应对所做的修改和优化进行详细的记录。
当量化投资策略开发完成后,进场时机的选择是一个非常重要的问题,好的进场时点可以在短时间内迅速获得利润;而离场条件的确定是一个策略能够获得正收益且保住收益的非常关键的1步,如何确定离场标准是一个非常值得研究的问题,通常的离场判定标准主要考虑止损、止盈和止平三个方面。
在实际应用中,通过财务指标和量化选股方法,结合期指套保对冲风险,构建能持续战性指数的股票投资组合是有效可行的。在引入新型量化投资策略和量化投资方式的同时,也应该引入优质的量化风险管理机制、模型、系统等,确保“创新和风控”并重。