如何提升选股因子效果-因子的正交


未经授权,严禁转载

本期研究内容参考海通证券研究报告《选股因子系列研究(十七)——选股因子的正交》

研报作者:冯佳睿、袁林青。

点击文末阅读原文可查看更多内容。


引言


>>> 研究目的

近年来,随着投资者对于因子选股体系研究的深入,选股因子值的处理也在逐渐细化,本文将主要对于选股因子的正交进行分析讨论。之所以讨论因子的正交是因为在传统的多因子模型中,选取的因子之间往往存在着相关性,而这种相关性并不稳定,且相关性的存在会复杂因子权重的分配。

对于等权分配因子权重的多因子模型,由于因子之间相关性的存在,模型可能实际上对于某一因子有更高的暴露(例如,市值因子)。 对于权重优化的模型,相关性的影响可能会更大。因此,本文考虑在构建因子的时候对于相关性进行剔除从而达到更为可控的因子暴露。


>>> 研究框架

研报中主要分为三部分。第一部分对于因子正交的必要性以及正交过程中的相关处理方式进行了说明。 第二部分回测对比了正交多因子模型与原始多因子模型的历史表现。第三部分对于正交顺序的确定进行了讨论。

本研究主要参考第一部分的处理方法,对第二部分内容进行了实证,按照这个思路,展开研究,下面是研究的内容分布:

1)因子数据获取:

设置股票池,获取指定时间范围的月度因子数据,按照研报思路,我们直接获取了聚宽因子库中的因子数据,并加入行业因子,按日期将因子值存入字典,记录保存了原始因子值,方便进行计算构造正交因子。

2)因子数据处理:

将计算出来的因子值按日期遍历获取,根据需要进行数据处理。

在T期因子值中加入T+1期收益值,方便因子分析统计。

3)因子统计分析:

针对每期截面进行因子IC统计。

汇总为时间序列上的IC数据,进行展示。

4)分组回测分析:

根据所选的因子,在每个调仓日进行股票排序,分层进行收益净值观察。

根据所选因子,在每个调仓日进行股票排序,进行多头组合收益分析。


>>> 参数设置

1)时间范围:

2014.6 ~ 2019.6

2)研究指数:

中证500

3)股票池:

中证500指数成分股

剔除 ST、停牌、涨跌停、上市不满 6 个月

月初调仓

4)费用设置:

暂无交易成本设置


>>> 研究内容及结论

本文参考研报中关于选股因子正交的讨论,通过使用正交选股因子来得到更加可控的因子暴露,并采取研报中给出的参考顺序进行了正交化处理,通过实际组合的构建以及初步回测, 相比于原始因子收益及夏普有所提升。 在三因子与八因子两种模型中,对因子IC均有提升,在多头组合中也得到了印证。


处理过程


>>> 因子数据获取

根据研报中提到的因子,我们直接通过聚宽因子库获取,后面会用到行业因子数据,将手动计算加入。


>>> 因子数据处理

进行因子数据处理、进行去极值、标准化、中性化。

加入收益数据:将T期因子值中加入T~T+1的收益数据进行记录。

我们对原始因子值去极值、标准化之后,参考以下研报中给出的顺序进行中性化处理。

>>> 因子计算与分析

IC统计

根据IC值计算等权多因子组合打分


>>> 等权多因子模型与最大化收益预期多因子模型

接下来的研究中,以较为经典的三因子模型(市值因子+反转因子+换手率因子)为例, 按照因子模型分为等权多因子模型、最大化收益预期多因子模型;按照因子处理方式分为原始因子、正交因子分别进行记录,分组如下。

我们将对以上分组的因子IC值进行统计记录,以上四种分类下的IC值与累计IC值结果如下:

从上面四组结果统计中,可以获得如下信息:

将原始因子进行正交,且在等权分组下IC值最高,也就是factor_b表现最好。

两种因子模型中,正交因子IC值均大于原始因子IC。

等权多因子模型因子IC远超最大化收益预期因子IC。

以上是针对八个风格因子进行因子正交的结果统计,通过因子IC计算,获得如下信息:

最大化收益预期模型下,且进行因子正交的表现最好,五年IC均值为0.0318,也就是factor_d分组。

和三因子的测试效果一样,两种因子模型中,正交因子IC值均大于原始因子IC值。

在八个风格因子的测试中,最大化收益预期模型要优于等权多因子模型。


>>>分组回测

接下来,我们将对所有因子值进行分组收益统计,并记录各分组总收益、年化收益、夏普率、最大回撤、每日收益情况,并将分组年化收益进行统计。

这里分组收益结果与IC值统计结果一致,回归模型正交因子的分组收益会较好一些。


>>> 因子相关性检查

我们选取某一期因子数据进行相关性检查,八个风格因子在处理前后的秩相关系数矩阵如下表所示。

正交处理后,因子之间的相关性基本上达到了零。


结论

本文参考研报中关于选股因子正交的讨论,通过使用正交选股因子来得到更加可控的因子暴露,我们采取研报中给出的参考顺序进行了正交化处理,通过实际组合的构建以及初步回测, 相比于原始因子收益及夏普都有所提升。 在三因子与八因子两种模型中,对因子IC均有提升,在多头组合中也得到了了印证。

点击【阅读原文】,查看原文及研究源码~

雪球转发:1回复:0喜欢:5