量化投资的常用统计检验方法有哪些?

  |  

随着量化投资在金融市场中的应用越来越广泛,很多量化投资策略和模型被研发出来并应用到实际的投资管理中,但是对于量化模型有效性的评估和检验方法却不为大多数人所熟知。研究人员通常使用夏普比率,信息比率、交易胜率和样本外测试收益率等指标来评估量化模型的收益情况。然而,这样的指标并不能完整地反映模型的真实表现情况。

许多量化投资模型在做历史回溯期间能够获得比较满意的收益,然而在随后的样本外测试及实际交易过程中,效果往往不尽如人意。究其原因通常在于在量化投资模型的测试过程中对其进行了过度的数据挖掘和优化。而对于大多数投资经理、交易员或投资者来说,往往对任何使用过参数优化的模型都避而远之,因为他们担心优化所产生的收益将不会在未来的实战交易中延续。有效的交易策略能够在某种程度上对市场的未来行为进行准确预测。数据挖掘领域的常见做法是交叉验证,也就是将数据划分为建模样本和验证样本。有效的交易策略应该能够在建模样本和验证样本上体现出较好的预测效力。

然而,通过对量化投资模型合理地运用统计检验的方法,不仅可以对不同的量化模型在同一框架下进行对比,也可以使投资经理、研究人员或投资者提前识别出策略是否存在人造收益或者过度优化的问题,为量化策略在实战中保持良好的收益提供保障。尽管通过统计检验的方法来评估模型的回溯绩效和实战交易绩效并不能保证其优秀的历史业绩能够持续,但是投资经理、研究人员和投资者却可以通过统计检验的结果来判断量化模型的收益是否真实地捕捉到市场无效的部分,抑或只是在研究过程中人为地制造了漂亮的收益曲线。如果是后者,在未来的交易中,策略的优良表现则较难延续。

为了衡量量化策略在历史回溯阶段的收益在未来能够延续的可能性,需要对策略的历史收益情况进行统计检验,虽然这里的统计检验会出现检验假设的不满足、检验的结果并不一定能够保证策略在未来的实战交易中获得优异的投资业绩,但仍能够帮助投资经理增加对量化模型了解的信息,有效提升对量化投资模型的运用。平时常用的量化投资策略统计检验方法为:t检验。相关性检验,数据窥探偏差检验。

t检验

t检验,亦称studentt检验(Student'sttest),是威廉·戈斯特于1908年提出的,t检验常用来检验单总体,t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。例如,在投资管理中,t检验能够反映一系列交易后的投资组合平均盈亏在某一置信水平下是否显著地大于某一阈值。同样,t检验也适用于对收益率的检验,即t检验可以反映某一组合的日度、周度、月度收益率的期望是否显著大于某一國值。最后,t检验同样可以对策略未来的表现给出一个置信区间,即“在95%的置信区间水平下,策略未来收益率的平均值将在某个区间内”。

相关性检验

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。经过相关性分析可以求出两个变量的相关性程度及在统计意义上相关性的显著性。在金融市场中,相关性检验方法通常用于寻找对资产收益率有一定预测能力的市场因子,如在人工神经网络模型、多因子模型等量化投资方法建模。

相关性检验也可用于对量化投资策略历史回溯收益盈亏序列是否存在自相关性的检验,如某投资策略的收益率序列是否存在簇现象等,即正收益率和负收益率总是呈簇形的连续出现,若相关性检验结果表示确实存在这样的情况,即收益率序列自相关性显著性大于某一正阈值,那么交易者就可以考虑这样的交易方式,即在每笔交易盈利之后继续交易甚至增加头寸,到某一笔交易出现亏损后,停u止真实交易(模拟交易同时进行),直到模拟交易中再次出现正收益,重新建仓,如此反复,那么投资者的真实交易收益率将会优于原始策略收益。

数据窥探偏差检验

对于使用高频数据的量化策略来说由于可供采集的历史数据时间较长,做交叉验证很容易。而对于频率较低的策略来说,可供采集的数据时间较短,往往需要基于同一套数据进行模型的开发与验证,这就涉及数据窺探(DataSnooping)问题。在对同一组数据测试大量的交易策略时,由于随机性,不可避免会有某些投资策略的收益表现较好。例如,如果设所有量化投资策略的分布服从正态分布,根据正态慨率分布函数,则将有5%的策略的绩效高于平均绩效1.65个标准差,将有1%的策略的绩效高于平均绩效2.33个标准差。假设投资者认为绩效高于平均绩效2.33个标准差的策略就是有预测力的策略(优异策略),则每测试100个投资策略,仅仅由于随机性就会有1个策略被当做优异策略而选出来。之所以会出现这种情况,是因为在对策略进行测试共用一套数据时,除第一条策略之外的策略“窥探"了数据造成的。有两个著名的统计检验可以用来控制数据窥探偏差:真实性检验和优异预测能力检验。两个检验的核心思想是,如果一个交易策略集合中的最优规则是真正有预测能力的,其回报一定要比随机情况下该策略集合可能出现的最大回报来得大。鉴于控制数据窺探偏差的重要性,西蒙斯的团队有可能采用了上述检验及其替代形式。

推荐阅读

相关文章

不必太看重年底机构预测

涨跌密码11:不必太看重年底机构预测揭秘涨跌通常证券机构在年底都会推出一些预测报告、投资策略报告等,供投资者参考。

价升量缩的经典运用(拓维信息)

在众多涨停基因中,“价升量缩”是唯一一个可以用单个基因来做预报的。对“上海物贸”这只股票,我们用“价升复缩”这一个涨停基因来预报,这5次预报5次全部成功。此前我们于2013年6月7日、6月26日、8月20日对“中青宝”的多次盘前预引也都是采用了“价升量缩”这个基因。成功率也很高。

分时图上均价线止损法则

分时图上均价线止损法则 技术特征第一,分时图上止损的法则有很多种,在这里重点介绍破位止损法则。如下图所示。第二,股价运行到盘头阶段末期,均线系统已经疲态毕现,早盘股价跳空低开,直接下行,放量下跌,毫无抵抗。第三,随后,加速下跌,垂直跳水,封死在跌停板上。

利用MACD的指标寻找支撑或阻力

寻找支撑、阻力是MACD指标的另一个重要作用。它主要通过以下两个方法来实现。第一,零轴。当DIFF线在零轴下方运行时,零轴对其有重要的阻碍作用;而一旦DIFF线突破零轴。零轴对它就具有重要的支撑作用。这种支撑、阻碍作用在实战中往往成为重要的买卖点。

量化投资策略开发的流程详解

一、理论构建量化投资策略必须基于可论证的经济理论.投资逻辑或市场经验,理论逻辑基础可以来自学术论文、研究报告或自身对市场的观察。 数据准备量化投资策略开发需要基于较长时间段的稳定的市场数据,不仅在于历史模式的统计归纳,也包括样本外检测的数据长度要求。

人们为什么买股票

公司发行股票有很大的好处,那我们买股票又有什么好处呢,是不是为了能够像那个卖橘子的人的朋友一样分成呢?是这样的,既然我们买了这个公司的股票,成了它的股东,也就理所当然地可以分享它的利益,或者说分红。通常公司采用以下几种方法来使它的股东得到好处:(1)分红派息。

2根均线金叉买入法则

2根均线金叉买入法则技术特征第一,在周线均线交易系统里,趋势明确上行,短期均线发生金叉。如下图所示。 第二,这2根均线一般选择3周均线和5周均线,周线金叉意味着上升的趋势已经确立。 第三,周线金叉是大级别行情到来的重要信号,此时需要积极参与,千万不要错过。

KDJ指标金叉和死叉及选股法(图解)

KDJ指标的金叉形态当股价经过一段很长时间的低位盘整行情,并且K、D、J三线都处于50线以下时,一旦J线和K线几乎同时向上突破D线时,表明股市即将转强,股价跌势已经结束,将止跌朝上,可以开始买进股票,进行中长线建仓。这是KDJ指标“黄金交叉”的一种形式。

江南红箭K线图(2009.10-2010.3)的趋势是什么样的?

如图2-4,江南红箭(000519): 自2008年11月初该股股价见历史大底以来,到2009年12月下旬,该股股价已经持续上涨一年多,且涨幅达到惊人的7倍多。2009年12月下旬该股股价已到达历史高位,进入高位横盘筑顶阶段。

如何解决KDJ指标的钝化

KDJ指标是技术分析人员经常使用的一种指标,此种指标的优点在于反应敏感,能给出非常明显的进货信号和出货信号,如黄金交叉进货,死亡交叉出货,使用者易于掌握,只要看信号进货出货就可以了。

相关词条

技术、媒体和电信 (TMT) 部门

什么是技术、媒体和电信 (TMT) 部门?技术、媒体和电信 (TMT) 部门是一个行业集团,其中包括大多数专注于新技术的公司。 TMT 与 1990 年代的新经济理念之间存在大量重叠。 TMT 行业有时也称为技术、媒体和通信 (TMC)。由于技术在经济中的作用已经扩大,技术部门不再能够容纳所有依赖创新的公司。

中型股定义

什么是中型股?中型市值(或中等资本化)是用于指定市值(资本化)或市值在 2 至 100 亿美元之间的公司的术语。顾名思义,中盘公司介于大盘(或大盘)和小盘公司之间。大盘股、中盘股和小盘股等分类是公司当前价值的近似值;因此,它们可能会随着时间而改变。

连续复利

什么是连续复利?连续复利是复利可以达到的数学极限,如果它在理论上无限期计算并再投资到账户余额中。虽然这在实践中是不可能的,但连续复利的概念在金融中很重要。这是复利的一个极端情况,因为大多数利息是按月、每季度或每半年计算的。

经验丰富的问题

什么是经验丰富的问题? 经验丰富的发行是来自已建立证券的公司的额外证券发行,该公司的证券已经在 二级市场交易。经验丰富的发行也称为经验丰富的股票发行或 后续公开募股 (FPO)。蓝筹股公司发行的新股被认为是经验丰富的股票。在二级市场交易的未偿债券也被称为经验丰富的债券。

优先股定义

什么是优先股?优先股,通常称为优先股,是公司股票的股份,在普通股股利发放之前已向股东支付股利。如果公司破产,优先股股东有权在普通股股东之前从公司资产中获得报酬。大多数优先股都有固定的股息,而普通股一般没有。优先股股东通常也不拥有任何投票权,但普通股股东通常拥有。

二级既定课程定义

什么是二次发行?二次发售是指在二级市场上向公众出售投资者所拥有的股份。这些是公司在首次公开募股(IPO)中已经出售的股票。二次发行的收益将支付给出售股份的股东,而不是支付给公司。一些公司可能会提供后续产品,也可以称为二次产品。这些产品可以采取两种不同的形式:非稀释性和稀释性二次产品。关键要点当投资者在首次公开募股 (I