【云通量化多因子】Barra这么热,你想要的细节都在这里(下篇)

发布于: 雪球转发:0回复:0喜欢:3

上一期,我们给大家介绍了Barra模型的概述、基本原理、构建方法、优缺点等内容,详情请戳:【云通量化多因子】Barra这么热,你想要的细节都在这里(上篇)。 本期,我们来探讨Barra模型的其他相关问题。

适用对象:知道Barra模型是一个多因子模型的宝宝。

阅读文本的正确姿势:理解Barra模型算法背后的逻辑,远比看懂它的数学推导重要。投资逻辑会让你有一个直观的感受,从而明白算法的合理性,数学推导只是将这种合理性用更加严谨的语言表达出来而已。

您可以收获:Barra模型的建模逻辑,使用Barra模型的正确姿势(如何避免掉入陷阱)。

题记:打个比方,一个梨很甜,用数学的语言可以表述为糖分含量90%,但只有亲自咬一口,你才能真正感觉到这个梨有多甜,也才能真正理解数学上的90%的糖分究竟是怎么样的。如果Barra模型是个梨,本文的目的就是带领大家咬一口。

1.Barra模型概述

1

Barra模型为什么有三种类型?

Barra模型三种分类:短期模型、长期模型日频模型。

长期模型主要是为了预测的稳健性,适用于战略投资者;

短期模型主要是为了预测的准确性,适用于中短期战术投资者;

日频模型主要是为了预测的灵敏性,适用于短期战术投资者。

从而三种模型可以适用于日度、周度、月度、季度等不同的调仓频率。

2

Barra给中国股票市场编写了几个版本的因子?

Barra给中国股票市场编写了三个版本因子CNE5,CHE2,CHE1,但是他们的可比性很差:

2.1.用了不同的样本

CHE1:A股,B股和H股;

CHE2:A股和B股;

CNE5:A股;

注:Barra第三代模型USE3(1997)才引入日频模型,CHE2(2005)已经用到Barra第三代模型的技术了。

2.2.用了不同的因子模型构建和因子代理变量构造方法

下面重点讲一下CNE5和CHE2两个版本之间的区别:

2.2.1.模型构建

在两个版本的 Barra 模型中, 从横截面上对股票收益率进行回归时均需包含行业因子和风格因子 。CNE5 版本相对于 CHE2 版本的最大改进之处在于,前者在回归中显式地加入了截距项因子,这样处理的好处在于可以将市场因子从行业因子中剥离出来,从而观察纯净的行业因子表现情况。

3

Barra模型为什么要加入国家因子?

如果市场存在共振(同涨同跌现象,即相关性时变),原则上来说不能假设残差之间的独立性,因为正是由于残差因子的相关性,才导致了多因子模型虽然有相同的期望值,却能引发异方差性,即同涨同跌,从而为了保持预测的稳定性和捕捉中国股市同涨同跌现象(表现为行业在股市繁荣和衰退的时候,相关性加强),从而可以把影响行业的共同因子(国家因子,相当于行业的资本加权指数,有点像A股指数)剥离出来,从而可以将相关性降低,增强模型外推效果。剥离国家因子之后的残差之间的相关性大大降低,从而再假设残差不相关不至于太离谱。

4

加入国家因子之后的行业因子理解

加入国家因子之前,行业因子为某行业100%纯多头,和其他行业0权重的组合收益;加入国家因子之后,行业因子代表货币中性:行业因子收益可以看成100%的某行业多头,100%国家因子空头。

5

风格因子载荷分子采用资本加权、分母标准差采用等权重进行标准化处理的原因

风格因子分子采用资本加权标准化处理的原因是为了保证全市场基准指数对每个风格因子的暴露程度均为 0,分母标准差采用等权重原因是避免大盘股对风格因子暴露产生过度影响。从而风格因子收益率可以看成1个单位某风格因子暴露,0单位其他风格因子暴露。

下面介绍一下处理过程:

描述性变量(Descriptor)是描述各种因子的量化指标。从原则上来说,良好的描述性变量应该有实际经济意义,对市场的划分比较合理,对风险的分类描述比较全面。同时,由于原始数据的量纲不一致,例如规模因子在取对数之后仍然是BP因子的数十倍甚至百倍,因此在实际回归中为保证数据之间的可比性和可叠加性,要对原始数据进行标准化、去量纲的工作,即需要对单个因子在横截面上进行标准化,从而得到均值为0、标准差为1的标准化因子(优点是能够更多保留因子载荷之间原始的分布关系)。由于少数极端值会对因子载荷和收益率之间的相关关系估计造成严重干扰,而多因子模型本身是一个追求投资宽度的模型,所以在进行因子载荷标准化之前,我们需要对极端值进行处理。

5.1. 因子载荷异常值的处理

我们采用“中位数去极值法”对风格因子载荷异常值进行去极值处理:

其中,序列的中位数,序列的中位数,去极值修正后的值。

5.2. 因子载荷进行标准化处理

数据去极值后的风格因子载荷在截面上分子采用资本加权、分母标准差采用等权重进行标准化处理:

其中,

6

预测准确性窗口调整长度如何选择?

理想情况下,时间间隔应当反映投资周期(再平衡的频率)如果组合月度再平衡一次,数据颗粒度应该为1个月,但是由于数据误差的存在,我们宁可选择更高频的数据,而不是低频颗粒,原因是高频结果可以推测低频结果,反过来不成立。同理,预测准确性窗口调整长度应该选取一年、一季度或者一个月取决于客户的绩效考核区间,或者关心预测表现区间。实操中,日度模型可以用12天,中短期战术模型和长期战略模型可以用12个月

7

为什么对风险矩阵估计采用一系列调整方法?

Muller(1993)等多位研究者已经证明,风险模型有低估最优组合风险的倾向,连续高估或低估风险的现象,样本量缺失以及肥尾现象也会带来的估计偏差。从而为了保证样本内外估计的一致性、增加估计结果的准确性,一般先后采用 Newey-West 自相关调整、特征值调整和波动率偏误调整对风格因子矩阵进行估计,采用 Newey-West 自相关调整、结构化模型调整、贝叶斯收缩调整和波动率偏误调整对股票特异风险进行估计。

8

为什么要采用市值的平方根加权最小二乘WLS 方法进行回归?

在Barra 模型中我们假设每只股票的特质收益率互不相关,但是每只股票的特质收益率序列的方差并不相同,这就导致了回归模型出现异方差性。为解决这一问题,可以采用加权最小二乘WLS 方法进行回归,对不同的股票赋予不同的权重。在计量经济学方法中,WLS 回归模型的权重 W 通常选定为特质收益率方差的倒数,然而在模型解出之前股票的特质收益率是未知的,无法直接使用。很多研究观察到股票特质收益率方差通常与股票的市值规模成反比,即大市值股票的特质收益率方差通常较小,因此在实际回归中我们将以市值的平方根占比作为每只股票的回归权重。

9

如何利用A 股市场数据验证用户复制或改造Barra模型的有效性?

基于以上对Barra模型框架构建及求解过程的介绍,云通构建了多因子风险收益归因系统,并将其运用到 A股市场上,从截距项、行业收益、风格收益三方面验证模型有效性,观察市场风格的变化及投资组合的风险收益来源。

9.1.从截距项验证模型有效性

参考CNE5模型对 A 股市场进行实证分析, 绘制截距项因子fc 与中证全指日度收益之间的关系。由前述分析可知,理论上截距项因子即为市值加权的全样本投资组合收益。事实上,如果可以看到二者走势高度相关,则说明市场因子(国家因子)有效。二者可能不会完全相等,云通认为原因有二,其一, 中证全指成分股权重计算采用派许加权法,与Barra模型中的市值加权并不完全相同;其二,Barra模型在数据处理中剔除了当日停牌、任意因子值为 NaN 的股票,样本数量与中证全指成分股并不完全相同。 

9.2.从行业收益验证模型有效性

市场投资者对于特定行业前景的一致看好,使得 A 股市场展现出较强的行业轮动效应。 CNE5模型中截距项的引入,可以将市场收益从行业收益中剥离出来,从而得到纯净的行业因子收益。 然而在实际情况中, 每个行业在不同风险因子上都长期存在特定的暴露,因此我们并不预期纯净的行业因子与该行业指数的走势保持完全一致。

事实上,如果观察到行业指数超额收益(相对中证全指而言)及对应的纯净行业因子收益有较强的相关性,则说明行业因子有效。

9.3.从风格收益验证模型有效性

接下来观察各类风格因子的表现情况,展示各类纯净风格因子的净值走势和累计收益。 尽管各类风格因子对于收益的影响有正向和反向之分,但投资者总可以选择性地在某些风格因子上进行或多或少的暴露,因此如果风格因子的累计收益率和市场风格现象相符则认为风格因子有效。

10

如何把宏观因子纳入Barra模型框架?

先对宏观因子进行一定时间窗口长度的单因子时间序列回归得出宏观因子载荷,再将宏观因子载荷和财务因子载荷同样处理进行截面回归。

11

如何对barra模型进行本土化改造?

Barra模型给出了十个公认比较有效的风险因子(实际应用中,这十个因子可能并不显著,原因是投资者挖掘该因子,并大量使用,从而导致该因子失效),以及用来表示行业的行业因子,在这些因子的基础上,当你发现一个新的因子时,它的阿尔法性需要经过这些因子的检验(被它们回归),只有当被已有因子回归完后仍然有超额收益的因子才能被当成阿尔法,否则只能认为是原有因子在某种程度上的拆分重组。

需要注意的是这里的基础因子指的是有效的风险因子,它本身可以不是阿尔法。所以当你想着对Barra作本土化修正时,比如增减几个有效没效的因子时,最主要是从解释风险的能力考虑而不是它的阿尔法性质。

通过本文,大家对Barra模型是不是已经有了初步的认识呢?大批多因子系列的文章已经在路上了,欢迎各位有识之士前来交流~

后续预告:

【云通量化多因子】在“阿尔法为王”的年代里,我一句话不说也不好

【云通量化多因子】撩拨神经的多因子模型真的把麦粒和麦糠分开了吗?

【云通量化多因子】基金绩效归因的大杀器--云通基金多因子体系简介