阅读《打开量化投资的黑箱》摘录和心得(6)

发布于: 雪球转发:0回复:0喜欢:1

每件事都应力求简单,但不是过于简单。——阿尔伯特·爱因斯坦

回报率随时间的变化,说明了平均回报率的不确定性,这个特征有助于我们决定是否持有某项投资策略。一般来说,回报率水平变化越小,这项策略就越好。举个例子,如果一个投资组合的年平均回报率为20%,这个回报率每年的标准差为2%(就是说在67%的时间里,年回报率将在平均20%上下浮动两个百分点的区间内,或者说年回报率处在18%-22%)。这比那种标准差为20%(也就是说在67%的时间里,年回报率的范围在0-40%)的交易策略好多了。这个思想是说,人们应该对那些回报率不确定性表较低的策略更有信心,更有信心才是好事。

我们关注一项统计指标,即凹凸度(Iumpiness)。该指标是回报率显著高于平均值那段时间中的回报在策略总回报中所占的比例。这是另外一种检验回报一致性的方法。尽管这个度量很重要,但一致性并不总是首要的目标。然而,如果没有比辨别清楚策略行为何时会改变的更好的理由,那么知道投资者和策略实施者所期望的也是不错的。在我们的标准普尔500指数策略中,整个检验过程中,日回报率的年化标准差为21.2%。

峰谷间的最大损失这项度量是指盈利曲线从累计盈利波峰的最大回撤。如果一项策略赚了10%,又亏损了15%,然后又赚了15%,那么这段时间内的复合回报就是+7.5%。尽管是正回报,但是峰谷间的损失是15%。也就是说,一个投资者为了获得7.5%的盈利而冒着损失15%的风险。一项策略的峰谷间最大损失越少越好,许多宽客不仅分析一次峰谷,还分析多个以了解他的策略历史当中那些极端的、一般的下行风险。损失之后的恢复时间也是重要的度量,可用以了解模型表现不佳之后的行为。如果策略的回报在某时发生大损失,那么就会有很长一段时间内的回报是负的,这种长时间才能将盈利得以恢复的现象是不受欢迎的。在历史数据的检验中,标准普尔500指数策略的最大峰谷间损失是-39.7%,这是因为在1987年夏天卖空所导致的。在1987年10月,的崩塌之前,策略还表现得很好。

预测力R²这个重要的统计量表示的是,用于预测的量能够解释需要预测的量的变差程度。换句话说,就是目标变量的变差被信号解释的程度。这个统计量取值范围是0-1,用相关系数的平方能够简单计算出来。等于1就意味着,用于预测的量的数据百分之百地解释了需要预测的量的变差。不加特别说明,我们说就需要预测的量时,是指股票、期货或者其他我们想要交易的金融产品。在量化金融中,因为我们很自由地预测金融产品未来的价格,除非方法有误,否则R²等于1的情形不会出现。事实上,现实中R²等于0.05就已经非常令人兴奋了。公司的一位前雇员说道:“如果你没有犯错而得到R²超过0.15的预测,那么你最好换个方法去预测,否则美国证券交易委员会可能以为你进行内部交易而逮捕你”。注意,R²等于0.15意味着用于预测的量的数据预测了未来15%的变差。就像另一个宽客所说的,“人们已经习惯了0.02的R²”。标准普尔500指数策略1982-2000年的R²不到0.01。

胜率或者盈利时间占比,胜率这个百分比是另一种对一致性的度量。它告诉研究人员策略的赢利是来自于很小比例的、偶尔表现不错的交易,还是来自大量的、每次表现一般和赢利贡献很小的交易。类似的简单度量是赢利时间占比,即赢利的时间(正的)在整个时间周期中的比例。这些度量指标被称为胜率或赢利天数。在两个指标度量中,人们对一致性更强的策略有更高的置信度。在标准普尔500指数策略中,这项研究的结果好像并不十分常见,因为这项策略并不是每天都发出信号,而是偶尔出现的足够吸引人的信号做出反应。正因为如此,这个模型在65%的时间里不发出交易信号。这个模型做出的交易在19%的时间里赢利而在16%的时间里亏损。在非零信号的时间里,大约有54%的时间在赢利,这是一个不太糟糕的结果。