量化投资的误区之一——未来函数

昨天小票跌的厉害,中证1000下跌了2.39%,国证2000下跌了2.35%,正股小票居多的可转债也再次下跌。按照集思录统计,373只可转债平均下跌了1.67%。另外集思录还提供了可转债价格的分段统计,105只130元以上的平均下跌了3.14%、120-130元的下跌了1.70%,110-120元的平均下跌了1.07%,100-110元的平均下跌了0.76%,90-100元的平均下跌了0.51%,90元以下的目前没有。

从集思录提供的分段统计的历史数据看,基本上呈现了高价涨跌都大,低价涨跌都小的特点,那么,如果我每天平均持有不同分段的可转债,结果如何呢?

好在从2018年开始的数据都在,做个统计很方便,但结果却使得我大跌眼镜。130元以上的,3年多平均年化高达171.59%,而小于90元的,平均年化竟然是付的12.57%。

我知道高价可转债的收益率肯定比低价的要高,但这样的结果我第一感觉是哪里错了。我核对了10月12日分段统计的结果:

 差异的主要原因就是这个分段,比如说集思录的大于130元的分段数量是105只,但我统计下来有110只,为什么会有5只差异呢?因为集思录统计的是当天收盘后价格大于130元的数量有105只,但如果按照开盘前统计,有110只,其中星帅转债楚江转债万顺转2思特转债富瀚转债新星转债等6只可转债开盘前价格大于130,但收盘后跌破130元;还有一只鸿路转债,开盘前小于130,涨了1.13%正好大于130元了。5个差异就是这么来的。

这样的话很容易使得大于130元这一档的数据多统计了,而小于90元一档数据少统计了。按照10月12日大于130元的差额0.15%估算,每天如果是0.15%的话,一年243个交易日复利就是44%,影响还是非常大的。

按照收盘后的数据分段统计平均值,每天的影响其实不大的,关键是如果累计起来影响就非常大了。量化统计的初学者很容易犯这个毛病,有个名词叫“未来函数”就是说的这个,也就是去“偷”了未来的数据。

其实这个问题还是很常见的,比如统计单溢价因子,你是看收盘后的最低溢价,还是看收盘前的,这个差异还是非常大的。回测容易犯这个毛病,但如果你是真金白银的去做,就不可能这样去“偷”数据了。

雪球转发:6回复:12喜欢:22

精彩评论

金光照2021-10-13 09:00

这个统计错误的关键,是将跌下去的算到低一档,将涨上来的算到高一档,就会使高价的涨幅明显放大,低价的涨幅明显缩小。

全部评论

持有封基2021-10-14 12:00

三五年能确保盈利而又能跑赢通胀的真挑不出

白杨树1232021-10-14 11:53

封基老师,你好!
如果有一笔钱,比如几十万,三五年不用的,但又不甘心储蓄跑不过通胀,应该怎么处理好?有合适的基金吗?(当然要承担短期波动的回撤风险)

砸锅卖铁炒股2021-10-14 07:14

比如含有ZIG类函数的指标(之字转向函数)

买的好2021-10-13 22:57

具体啥指标?

纳斯达克QQQ2021-10-13 20:51

用前一天的收盘价是没有问题的