带我们飞少年!
可以看到,如果是5%有点略多,0.5%有点略少,1.0%池子大小感觉上正好(这个实际上是取决于策略池容纳的资金规模,这里暂不深入)。
4. 样本池表现:
那么这三个样本数的平均表现到底如何呢?请看下图:
可以看到0.5%组这个收益率远远领先于1%和5%。具体收益率是这样的:
0.5%组:1465倍(是的,你没有看错)
1.0%组:432倍
5.0%组:57.6倍
因此实际上当取的样本数越少,效果越恐怖。那么问题来了,如果取1呢?难道不是收益率爆炸才对吗?理论上看上去似乎是这样,实际上在市场里面会遇到各种各样的黑天鹅,哪怕没有黑天鹅冲击成本也会高到令人无法忍受。所以一个或者两三个样本对回测也许有一些意义,对于实际操作意义不大。
鉴于5%这个样本数过多,而过多的样本很可能掩盖掉因子特征,因此我们将选择1%样本池进行进一步的研究。下文中所有的小市值因子考察都是基于1%样本组进行。5. 指数相关性:
考察相关性的主要目的,还是为了选取一个方便好用的观察指数(作为相关择时指标),为了考察小市值因子和各大主流指数(上证中证深证相关指数)的相关性,做了下面的表,部分指数样本数据并未完全覆盖2010开始的这个时间区间,也有说明。另外有部分指数可能会很有参考但是样本数过少,所以只能暂时不考察:
从这个结果可以看到,没有任何一个指数和小市值因子具有极强的线性相关(>0.8),不过中小板综指是其中和小市值线性关系最接近的一个主流指数,所以如果有需要择时的地方,不妨可以选择中小板综指。
6. 底在何方:
这问题我要是知道答案,我就是神。不过比起拍脑门儿来说,我们还有历史数据这个救命稻草,不过在2017年上半年史无前例发行200+新股的态势下,这个历史数据也就是给一个参考,还是不靠谱那种,但是也总比没有要好,你说是吧。
于是我们取2010年以来小市值样本组的平均市值做一个平均市值曲线:可以看到,我们抛开什么通胀或者M2因素,但就数值而言,这里离底部的距离还很遥远。
7. 附录:
按月度统计的收益情况:
按年度统计的收益情况: