基于非线性模型预测商品期货收益

发布于: 雪球转发:0回复:0喜欢:1

导读

1、 作为西学东渐--海外文献推荐系列报告第九十九篇,本文推荐了Clemens Struck和Enoch Cheng于2019年发表的论文《The Cross Section of Commodity Returns: A Nonparametric Approach》。

2、目前预测金融市场未来收益通常采用线性多因子模型,本文选择信息透明、流动性高、交易成本低的美国商品期货市场,分别采用线性模型和决策树模型对未来收益进行预测。

3、首先,本文发现决策树模型的预测能力远超线性模型,采用决策树模型可以预测3.74%的样本外收益变化,是线性模型的10倍,并由此推断数据结构可能存在非线性的特征,采用线性模型估计可能得到错误结果。

4、其次,本文实证结果显示决策树模型对样本内收益变化的预测能力可以达到56.21%,这与有效市场假说认为的无法基于历史信息预测未来收益相违背,并由此推断过往文献可能高估了市场的有效性。

5、最后,本文发现采用决策树模型构建的投资组合在绝对收益和风险调整后收益上均优于线性模型,且该结果在不同时间跨度均成立,证明了结果的稳健性。以整体样本外区间为例,两种决策树模型的夏普比率均高于1,而LASSO和Logit模型夏普比率分别为0.174和0.187。

风险提示:文献中的结果均由相应作者通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。

1、引言

目前已有大量学术文献探讨过金融市场收益的可预测性,但关注的重点主要是单个收益因子和Fama-French(1992)提出的线性模型。在研究时,多数文章作出了三个严格的参数假设:(1)用一个简单的函数描述预期收益和预测因子之间的关系,(2)预测因子之间不相关,(3)模型通常只包含有限的预测因子,这三点假设削弱了模型对收益的预测能力。

本文对比了标准线性模型和决策树模型的收益预测能力,其中决策树模型不需要进行特定的参数假设。具体而言,我们研究了28种商品期货的月度收益率与59个预测因子之间的关系。选择商品期货是因为这种资产更接近有效市场的假定:信息透明、高流动性、低交易成本。同时,与股票市场相比,商品期货市场不存在幸存者偏差。

本文有三个主要的研究结论:首先,采用决策树模型可以预测3.74%的月度收益,尽管这个数字很小,但与标准线性模型相比预测能力已经提高了10倍;其次,线性模型和决策树模型对样本内数据的预测能力分别为0.58%和56.21%,对样本外数据的预测能力分别为0.33% 和3.74%;第三,不论从绝对收益还是风险调整后收益来考虑,采用决策树模型构建的投资组合表现都优于采用线性模型构建的投资组合。

有效市场假说认为,在有效市场中人们无法仅基于过去信息预测未来收益,除非采用的因子代表了某种风险。目前许多文献已经分离出很多单因子,可以分别解释一部分收益变动,例如Fama和French(1993, 2016)、Longstaff(1995)、Asness,Moskowitz和Pedersen(2013)、Novy-Marx(2013)、Farhi和Gabaix(2016)。但大多数文章仅采用线性模型研究了一部分互相独立的因子。而我们的研究结果表明,在商品期货市场中,决策树模型的预测能力可以达到线性模型的10倍。

当我们将简单线性模型转换为决策树模型后,预测能力发生了巨大的变化,这一现象说明数据中具有特定的结构。因此,先前基于线性模型的研究可能会导致错误的定性解释。例如,多数文献对某一因子进行研究,发现其在统计学上显著,从而得出这个因子反映了一定风险的结论。然而,当加入其他因子后会发现,由于因子间的相互作用,该因子可能不再显著,也并不代表任何风险。

本文对线性模型的有效性提出了质疑,并认为一些异常的收益波动可能仅仅是统计上的结果。目前许多研究都把重点放在避免样本选择偏差和多重检验问题上,例如Lo和MacKinlay(1990)、Black(1993)、Kothari,Shanken和Sloan(1995)、Jorion和Goetzmann(1999)、Schwert(2003)、Bailey和López de Prado(2014)、Mclean和Pontiff(2016)、Harvey,Liu和Zhu(2016)以及Harvey和Liu(2019)。但我们认为不合理的模型选择也会导致最后的结论错误。

通常对因子进行检验是看该因子是否可以提升模型的解释能力,但本文提出了另一种检验新因子的方法:检验将因子加入现有因子集合后模型的解释力是否提升,这种方法将因子之间的相互作用和非线性也考虑在内。我们的观点与Feng,Giglio和Xiu(2019)类似,他们提出了一种线性的两阶段模型来筛选因子。因为我们发现因子之间的相互作用和非线性较强,我们认为线性模型对于预测未来收益并不适用。

我们的研究方法与最近采用决策树方法研究股票市场收益的文章有相似之处。Gu,Kelly和Xiu(2020)采用了多种回归模型,对94个独立因子和74个行业虚拟变量在美股市场进行了研究,最后发现由动量、流动性和波动性相关因子构成的因子集合对于预测资产收益更为有效,而且非线性模型可以更好预测未来收益。他们也证明了相比标准线性回归模型,决策树模型在对未来收益的预测能力上有较大提升。

尽管考虑了数据的非线性特征,我们的结果依然只能解释约50%的样本内收益变化。这可能是由于两个原因:首先,尽管我们的因子集合已经大于过往文献,但仍有进一步扩展的空间,例如可以进一步加入与宏观因子的交互项;其次,出于简化计算流程的考虑,我们构建的两个决策树模型都没有使用最复杂的结构。

我们在这两方面做的简化都表明模型的收益预测能力还有进一步提升的空间。但我们认为我们的模型已经接近预测能力上限:从标准线性模型转为决策树模型使样本内的收益预测能力从0.58%提高到56.21%,但样本外的预测能力仅从0.33%提高到3.74%,因此提高样本内预测能力对样本外预测能力的影响是有限的。我们认为即使将样本内预测能力由56.21%提高到100%,也不会使样本外预测能力有显著增加。

虽然我们的研究结果确实表明,以往的线性模型大大低估了收益的可预测性,但是使用了决策树模型后,依然有超过95%的样本外收益变化是无法被预测的。从这个角度来看,我们的研究结果与有效市场假说一致,即利用过去的信息无法预测未来的收益。

后文结构如下:第二章阐述了我们的实证方法,第三章描述了我们做出的假设以及实证结果,第四章对主要研究成果进行了解释,第五章为结论。

2、实证方法

2.1

Logit回归

我们将在后文中的实证部分,采用样本外数据计算Logit模型的收益预测能力。

2.2

LASSO回归

Logit模型的一个主要问题是,它需要我们首先挑选出有效的预测因子。为了简化运算,在实证部分我们使用整个预测因子集合来估计 Logit模型,但是因子数量较多可能会导致模型存在多重共线性。为了系统性地筛选变量,我们对Logit模型进行了改进,采用LASSO方法进行回归。LASSO是一种修正后的对数线性回归,将筛选变量作为回归目标之一。它在Logit的对数似然函数中加入了一个惩罚项,使贡献近乎为0的预测因子的β值为0,从而实现变量筛选。LASSO模型的对数似然函数形式为:

2.3

决策树模型

前两种方法的主要问题是它们没有考虑数据的非线性结构和预测因子之间的相互作用。决策树模型可以解决这个问题,目前也已应用在许多领域。本文使用了两种决策树模型:提升树(Boosted Tree)和袋装树(Bagged Tree)。我们首先描述了如何构建一个样本树,再对两种模型进一步解释。

图表1中的决策树由4个预测变量构成:3月与1月期货价格之差(Curve3minus1)、过去1月收益的波动(Vola1M)、过去3个月收益的波动(Vola3M)和过去260个交易日的收益偏度(SkewCom)。按照Curve3minus1将初始集合分为两组。对左边节点采用Vola1M进一步分组,对右边节点采用SkewCom进一步分组,对其中一组更进一步采用Vola3M划分。

2.3.1、袋装树(Bagged Trees)

传统决策树方法的一个主要缺点是稳定性低,即采用相同的数据集重复生成单个树,每次的结果可能不同。除了稳定性之外,决策树方法还会产生数据碎片。每次分割后节点上的观测值都会相应减少,平均来看每个路径只包含了一部分预测因子,这意味着最终预测是基于预测因子子集做出的。因此,我们可能在生成树时意外地忽略了有价值的预测因子。

目前已有文献提出了一些改进方法来解决上述问题,最常用的是集成方法,装袋算法(Bagging)就是一种集成方法。这种算法通过自举法(Bootstrap)从原始数据中创建出不同样本,采用每一个样本生成独立的决策树(Breiman(1996)、Dietterich(2000))并构建一个森林(Breiman(2001)、Criminisi,Shotton和Konukoglu(2012))。单个树的预测结果依然采用最后分组中的多数观测值,多个树的集合预测结果采用下式计算:

构建森林可能会导致不同树之间选择了相同因子,我们通过随机选择预测因子的子集来解决这个问题。实践中我们选择的子集因子数量为预测因子总数的平方根。由于自举样本之间的差异,采用袋装树预测的结果可以减少过度拟合,从而更加稳健。

2.3.2、提升树(Boosted Trees)

提升树是袋装树的变体,提升树中的自举样本并不是随机选出的。提升算法会依次构建决策树,当一个决策树生成后,会用整个样本对其进行检验。在下一个自举样本中,先前分类错误的观察值会再次出现,算法通过最小化以前所有树的错误预测来生成新的决策树,参见Schapire和Singer(1999)。随着每棵树的生成,森林可以不断地提高预测精度。我们使用的提升算法叫做温和适应性提升。

3、实证研究

3.1

数据

我们选取了一个由所有流通的商品期货组成的固定样本集合,这些期货在1987年1月至2019年10月的样本区间内是可交易的。数据来自于彭博。通过选择固定的期货集合,我们避免了由幸存者偏差引起的问题。幸存者偏差是股票市场中普遍存在的现象。为了保持不同时间之间的可比性,我们只关注1月、2月和3月期的合约,其中2月和3月期的合约只是为了构造因子,交易完全基于1月期合约。

商品期货包括:豆油CBOT(BO)、玉米CBOT(C)、糖ICE(QW)、可可ICE(CC)、WTI原油Nymex(CL)、布伦特原油ICE(CO)、棉花#2 ICE(CT)、饲养牛CME(FC)、黄金Comex(GC)、铜Comex(HG)、加热油Nymex(HO)、咖啡‘C’ICE(KC)、堪萨斯小麦CBOT(KW)、铝LME(LA)、活牛CME(LC)、生猪CME(LH)、铅LME(LL)、镍LME(LN)、锌LME (LX)、天然气Nymex(NG)、铂金Nymex(PL)、柴油Nymex(QS)、大豆CBOT(S)、糖#11 ICE(SB)、银Comex(SI)、豆粕CBOT(SM)、小麦CBOT(W)以及RBOB汽油Nymex(XB)。

我们采用了标准的期货滚动流程来计算每种商品期货日收盘价的连续收益序列。如果合约的最后交易日期在合约月之前,我们将在最后交易日期前10天对期货合约进行滚动。对于一些商品期货,第一个通知日是在最后一个交易日之前,在第一个通知日之后该合约的交易量会显著下降。因此,我们选择在最后一个交易日前10天对期货合约进行换手,以确保合约流动性。例如,对于一份2019年9月到期的布伦特原油合约,9月合约的最后交易日期是2019年7月31日。因为最后交易日期在合约月之前,所以我们会在合约最后一个交易日(2019年7月31日)的前10天进行换手。如果合约的最后交易日期在合约月内或之后的月份,我们将在合约月第一天的前10天进行滚动换手。例如,对于一份2019年12月到期的小麦合约,12月合约的最后交易日期是2019年12月13日。因为最后的交易日是在对应的合约月份,所以我们将在合约月的第一天(即2019年12月1日)前10天对合约进行滚动。如果合约月的第一天是非交易日,我们将在下一个交易日的前10天进行换手。

3.2

预测因子

商品期货的一个特点是价格几乎完全反映了经济基本面的信息,包括现货价格、仓储成本以及未来供需情况。我们方法的一个关键点是选择预测因子,这些预测因子是根据可观测的历史市场价格构建的。我们主要参考了过往文献中提出的一些因子,比如波动率、动量、价值、规模、流动性和隐含尾部风险等,参见Sharpe(1964)、Fama和French(1992)、Longstaff(1995)、Asness,Moskowitz和Pedersen(2013)、Farhi和Gabaix(2016)等。Fuertes,Miffre和Fernandez-Perez (2015)研究了商品期货市场的风险因子,他们在过去研究发现的这些因子中还加入了历史收益的偏度和峰度。

3.2.1、动量

3.2.2、波动率

我们的第三组预测因子衡量的是期货日度收益的波动率,与Sharpe(1964)提出的风险度量指标相似。公式如下:

3.2.3、价值

我们采用了三个因子来反映价值。首先,我们采用了两个变量来衡量期货曲线的陡峭程度。期货价格曲线通常是以升水(向上倾斜)来解释储存成本,更陡峭的曲线可能意味着商品供应暂时过剩,商品价格也会相应的暂时走低。反之亦然,处于贴水(向下倾斜)的期货曲线可能表明商品的暂时短缺,商品价格也相应的出现上涨。前两个价值因子的公式如下:

3.2.4、其他

Farhi和Gabaix(2016)在货币市场中研究了一个风险因子,关注的是95%看跌和105%看涨的虚值期权30天隐含波动率的差异。期权隐含波动率的差异反映了期权价格的差异,进而体现1月期合约的收益风险是左偏还是右偏。公式如下:

按照Fuertes,Miffre和Fernandez-Perez(2015)的方法,我们还使用了过去一年日收益的偏度和峰度,公式如下:

其中Q为260个工作日。

最后一个指标是每种商品相对于其他商品的市场规模,采用商品期货过去一段时间的平均交易额与八种核心商品期货平均交易额的比值,公式如下:

3.2.5、虚拟变量

最后,我们还加入了一些虚拟变量。首先,考虑到一些商品期货的季节性(比如天然气),我们加入了12个虚拟变量代表不同月份。其次,为了代表商品期货特有的特征,我们加入了28个虚拟变量,每个虚拟变量对应一种商品期货。

我们总共使用了59个预测因子,并按照Struck和Cheng(2019)的方法对数据进行标准化。该方法首先观察每个预测因子的实际分布,再按照逆分布函数将因子标准化为服从(0,1)的正态分布。数据标准化对量化结果的影响非常小,不会改变我们的任何结论。

3.3

参数

由于标准袋装树估计对采用的随机数序列高度敏感,我们从不同点开始采用相同的随机数序列重复估计了近100次,以确保我们的结果是稳健的。最后我们对所有估计结果进行平均。

为了避免多重检验问题,我们使用的样本内和样本外数据没有重叠,样本内区间为1987年1月至2013年12月,样本外区间为2014年1月至2019年10月。我们选择的样本内区间更长一些,主要有2个原因:第一,如 Rietz(1988)、Barro(2006)、Farhi和Gabaix(2016)、Struck和Cheng(2019)所述,尾部风险是影响许多因子策略表现的关键,因此样本内数据应该包括尽可能多的尾部事件;第二,我们希望表明,我们的研究结果在本文发表的前几年依然是可靠的。

由于长期大宗商品价格在整个抽样期间相对稳定(虽然全球对大宗商品的需求不断增加,但科技发展也使供应量有所提升,因此价格相对稳定,参见Acemoglu (2002)),我们根据模型对大宗商品的收益预测进行了排序,来构建市场中性的投资组合。我们按照排序选择前五的商品期货等权构建多头组合,并选择后五的商品期货等权构建空头组合。为了对不同的风险因子策略进行检验,我们还使用28个商品期货等权构建了一个多头组合。

我们采用4周的标准预测窗口,同时我们也选择每4周对组合进行再平衡。最后,考虑到我们以比较低的频率交易期货合约,我们估计每年的交易成本低于8个基点。

3.4

主要发现

我们的实证分析分为四个步骤:首先,我们计算了四种模型(Logit、LASSO、袋装树、提升树)对样本内和样本外数据的收益预测能力,结果见图表2;其次,我们比较了四种模型的样本外表现及构建的多头组合表现,结果见图表3和图表4;接着,我们关注每个模型赋予单个预测因子的权重,排名见图表5;最后,我们重点研究了基于决策树构建的投资组合与其他资产之间的相关性,结果见图表6和图表7。

图表2展示了四种模型预测收益和实际收益之间的相关性(均以4周为预测长度)。第i行和第ii行是包含了所有28个商品期货的投资组合收益之间的相关性。第iii行和第iv行是仅使用每段时间前五个和后五个商品期货(采用预测收益排序)构建的多空组合收益之间的相关性。第v行和第vi行是仅使用每段时间前三个和后三个商品期货(采用预测收益排序)构建的多空组合收益之间的相关性。

图表2中有五个关键点:首先,对于样本外数据,Top 3/Bottom 3的平方相关系数高达3.74%;其次,对于样本外数据,袋装树模型构建的组合相关性是线性模型(Logit、LASSO)的10倍以上;第三,所有模型对样本外数据的预测能力都随着投资组合选取资产数量的减少而增强,例如袋装树模型对Top 3/Bottom 3的预测能力为3.74%,高于对Top 5/Bottom 5的预测能力(2.02%)和全样本的预测能力(0.99%);第四,我们采用的决策树模型获得了远超线性模型的样本内相关性;最后,决策树模型具有较高的样本内相关性,但样本外相关性并没有这么高。

图表3展示了不同模型的样本外表现,并将样本外区间分为五个阶段:整个样本外时期、过去3年、过去2年、过去1年及年初至今。表中分别展示了不同区间每种模型的年化平均日收益和波动率,以及最大回撤,还对每种模型计算了两个风险调整后收益指标:夏普比率(根据日收益和波动率计算)和收益回撤比。图表4是样本外表现走势。

图表3和4中有两个值得注意的结果。首先,从风险调整收益(夏普比率和收益回撤比)来看,两种决策树模型(袋装树和提升树)表现都显著优于线性模型(Logit和LASSO)和多头组合,且这个结果在所有样本时期都成立(整个样本外区间、过去3年、过去2年、过去1年和年初至今)。线性模型的夏普比率介于-0.461和0.526之间,多头组合的夏普比率介于-0.609和0.487之间,而决策树模型的夏普比率介于0.736和1.562之间。此外,线性模型的收益回撤比在-0.349至0.274之间,多头组合的收益回撤比在-0.182和0.140之间,而决策树模型的收益回撤比在0.75至2.007之间。Moritz和Zimmermann(2016)、Gu,Kelly和Xiu(2020)都发现美股市场中决策树模型的风险调整收益高于线性模型。虽然研究的是不同市场和不同时间跨度,很难直接进行比较,但他们的定量发现与我们的大致相同。

其次,仔细研究图表3和图表4可以发现,决策树模型的风险调整收益较高主要是由于组合收益较高,而不是由于更低的波动率或回撤。在相似的回撤或波动率水平下,两种决策树模型的年化收益比线性模型和多头组合高至少8%。但决策树模型的波动率与线性模型相比没有显著优势,以年初至今来看,袋装树模型的波动率为11.4% ,而Logit模型只有9.3%;以过去一年来看,提升树模型的波动率为9.1%,低于LASSO模型的9.9%。类似地,决策树模型的最大回撤可能高于线性模型(整个样本外区间提升树的最大回撤为15%,而Logit模型只有13.7%),也可能低于线性模型(过去3年袋装树模型的最大回撤为6.8%,低于LASSO的最大回撤13.9%)。

因子重要性排序的差异进一步导致了不同模型结果的相关性较低。图表6和图表7分别为袋装树和提升树模型与其他模型的40天滚动相关性。图表6中袋装树和Logit模型的相关系数在-0.2至0.8之间,长期均值接近0.35。图表7中提升树和Logit模型的相关系数在-0.6至0.8之间,长期均值接近0.2。相关性和预测因子重要性的差异也表明数据的实际结构并不是简单的线性结构。

此外,这两个图表还表明,决策树模型与多头组合和股票市场(标普500)的相关性也较低。因此,采用决策树模型构建的组合可以为股票多头组合提供额外收益,并且这种收益既不能被线性风险因子完全解释,也不能被商品期货多头策略完全解释。

4、探讨

基于我们的定量结果,我们提出了两个观点:首先,市场的有效性可能低于历史文献认为的水平;其次,对因子的孤立研究可能会导致对数据的错误解释。

我们的第一个观点是基于对商品期货市场的理解,这个市场信息透明、流动性高、交易成本低,非常接近有效市场假说的定义。同时因为我们研究的是固定的商品期货集合,所以避免了影响股票市场研究的幸存者偏差。此外,与股票市场研究不同的是,我们只使用了基于历史市场价格的因子。

到目前为止,历史文献已经研究了许多可以解释部分收益变化的因子,然而大多数文献都只关注了少量线性独立的因子。有效市场假说认为,人们无法基于过去信息预测未来收益,除非过去信息反映了某种风险。但我们的研究表明在模型中加入因子的交互作用和非线性后,模型的预测能力比线性模型提高了10倍,并且该结果通过了大量的稳健性检验。

考虑到我们使用的方法虽然在统计上比较直观,但难以解释,我们无法确定我们的模型是否反映了某种市场风险。但结果显示模型对收益率的预测能力远远大于先前的假设,这与有效市场假说不一致。

我们的第二个观点也基于我们的发现,即收益的可预测性比过往文献发现的要高得多。正如前文所述,绝大多数文献在研究收益可预测性时都做了过于简化的统计假设,其中许多文献都只是孤立地研究一个预测因子。简化的统计模型使这些文章的结果易于解释,但根据我们的研究,因子之间的相互作用和非线性对于预测收益也非常重要。

没有考虑相互作用和非线性的研究可能会对数据做出错误的解释。例如,一些文献在单独研究某一因子时发现其在统计学上显著,因此得出该因子可能反映某种风险或行为偏差的结论。但当和其他因子共同研究时,该因子可能不再显著,表明其并不代表某种风险或行为偏差。

当我们从简单线性模型转换为决策树模型时,模型预测能力有显著提升,这表明数据结构具有非线性。因此,我们的模型不仅能够更好地预测未来收益,也对过往针对几个甚至单一因子进行研究的文献提出了质疑。

我们研究结果的局限性是什么?尽管考虑了数据中的复杂结构,图表2的结果表明我们依然只能解释约50%的样本内收益变化。这可能是由于两个原因:首先,尽管我们的因子集合比过往文献更大,但仍有进一步扩展的空间——例如,纳入与汇率变动等宏观因子之间的交互项;其次,我们构建的两个决策树模型没有使用非常复杂的结构。如前文所述,我们使用了贪婪算法来提高运算效率,而不是寻找全局最优树。

对模型的这两点简化说明收益预测能力还有进一步提升的潜力。但我们依然认为我们的结果接近预测能力上限,理由如下:从线性模型转换为决策树模型使样本内预测能力由0.58%提高至56.21%,但样本外预测能力仅从0.33%提高至3.74%。因此,样本内预测能力的提高对样本外预测能力的影响是有限的。所以我们认为即使将样本内预测能力由56.21%提高至100%,样本外预测能力可能也不会有显著提升。

虽然我们的研究结果表明,以往的线性模型大大低估了收益率的可预测性,但是使用了决策树模型后,依然有超过95%的样本外收益率变化是无法预测的。从这个角度来看,我们的研究结果与有效市场假说一致,即利用过去信息无法预测未来收益。

5、结论

金融市场的收益率是否可被预测?常规的线性模型对数据添加了三个特别假设,削弱了其收益预测能力。本文对比了标准线性模型和决策树模型在商品期货市场中的收益预测能力。本文选择商品期货市场,是因为其信息透明、流动性高、交易成本低,接近有效市场假说对理想环境的定义。

本文有3个主要发现:首先,采用决策树模型可以预测3.74%的月度收益,是线性模型的10倍;其次,从线性模型转换为决策树模型后,样本内(样本外)预测能力由0.58%(0.33%)提升至56.21%(3.74%);第三,采用决策树模型构建的投资组合在绝对收益和风险调整后收益上均优于线性模型。

基于我们的研究结果,我们提出了两个观点:首先,决策树模型的收益预测能力远高于线性模型,对此一种可能的解释是,过往文献高估了市场的有效性;其次,当我们从简单线性模型转换为决策树模型时,模型预测能力有显著提升,这表明数据结构具有非线性。因此,当我们对新因子进行检验时,不能对其单独检验来判断是否具有解释能力,也不能将新因子加入到一个简单的线性模型中判断是否增加了解释能力,而应该将新因子加入到考虑因子相互作用和非线性的因子集合中来检验其解释能力。

参考文献

[1] Acemoglu, D. 2002. “Directed Technical Change.” The Review of Economic Studies 69 (4): 781–809.

[2] Asness, C. S., T. J. Moskowitz, and L. H. Pedersen. 2013. “Value and Momentum Everywhere.” The Journal of Finance 68 (3): 929–985.

[3] Athey, S. The Impact of Machine Learning on Economics. Chicago: University of Chicago Press, 2019.

[4] Athey, S., and G. W. Imbens. 2019. “Machine Learning Methods That Economists Should Know About.” Annual Review of Economics 11 (1): 685–725.

[5] Bailey, D. H., and M. López De Prado. 2014. “The Deflated Sharpe Ratio: Correcting for Selection Bias, Backtest Overfitting, and Non-Normality.” The Journal of Financial Data Science 40 (5): 94–107.

[6] Barro, R. J. 2006. “Rare Disasters and Asset Markets in the Twentieth Century*.” The Quarterly Journal of Economics 121 (3): 823–866.

[7] Bishop, C. M. Neural Networks for Pattern Recognition. Oxford: Oxford University Press, Inc., 1995.

[8] Black, F. 1993. “Beta and Return.” The Journal of Financial Data Science 20 (1): 8.

[9] Breiman, L. 1996. “Bagging Predictors.” Machine Learning 24 (2): 123–140.

[10] Breiman, L. 2001. “Random Forests.” Machine Learning 45 (1): 5–32.

[11] Brock, W., J. Lakonishok, and B. Lebaron. 1992. “Simple Technical Trading Rules and the Stochastic Properties of Stock Returns.” The Journal of Finance 47 (5): 1731–1764.

[12] Criminisi, A., J. Shotton, and E. Konukoglu. 2012. “Decision Forests: A Unified Framework for Classification, Regression, Density Estimation, Manifold Learning and Semi-Supervised Learning.” Foundations and Trends in Computer Graphics and Vision 7 (2–3): 81–227.

[13] De Bondt, W. F. M., and R. Thaler. 1990. “Do Security Analysts Overreact?” American Economic Review 80 (2): 52–57.

[14] De Long, J. B., A. Shleifer, L. H. Summers, and R. J. Waldmann. 1990. “Noise Trader Risk in Financial Markets.” Journal of Political Economy 98 (4): 703–738.

[15] DellaVigna, S., and J. M. Pollet. 2009. “Investor Inattention and Friday Earnings Announcements.” The Journal of Finance 64 (2): 709–749.

[16] Dietterich, T. G. 2000. “An Experimental Comparison of Three Methods for Constructing Ensembles of Decision Trees: Bagging, Boosting, and Randomization.” Machine Learning 40 (2): 139–157.

[17] Elton, E. J., M. J. Gruber, and C. R. Blake. 1996. “Survivorship Bias and Mutual Fund Performance.” The Review of Financial Studies 9 (4): 1097–1120.

[18] Fama, E. F. 1970. “Efficient Capital Markets: A Review of Theory and Empirical Work.” The Journal of Finance 25 (2): 383–417.

[19] Fama, E. F., and K. R. French. 1992. “The Cross-Section of Expected Stock Returns.” The Journal of Finance 47 (2): 427–465.

[20] Fama, E. F., and K. R. French. 1993. “Common Risk Factors in the Returns on Stocks and Bonds.” Journal of Financial Economics 33 (1): 3–56.

[21] Fama, E. F., and K. R. French. 2016. “Dissecting Anomalies with a Five-Factor Model.” The Review of Financial Studies 29 (1): 69–103.

[22] Farhi, E., and X. Gabaix. 2016. “Rare Disasters and Exchange Rates.” Quarterly Journal of Economics 131 (1): 1–52.

[23] Fayyad, U. M., and K. B. Irani. “Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning.” Proceedings of the 13th International Joint Conference on Artificial Intelligence. Chambéry, France, August 28–September 3, 1993, pp. 1022–1029.

[24] Feng, G., S. Giglio, and D. Xiu. “Taming the Factor Zoo: A Test of New Factors.” Working paper no. 25481, National Bureau of Economic Research Working Paper Series, 2019.

[25] Fuertes, A. M., J. Miffre, and A. Fernandez-Perez. 2015. “Commodity Strategies Based on Momentum, Term Structure, and Idiosyncratic Volatility.” Journal of Futures Markets 35 (3): 274–297.

[26] Garcia, S., J. Luengo, J. A. Saez, V. Lopez, and F. Herrera. 2013. “A Survey of Discretization Techniques: Taxonomy and Empirical Analysis in Supervised Learning.” IEEE Transactions on Knowledge and Data Engineering 25 (4): 734–750.

[27] Grinblatt, M., and B. Han. 2005. “Prospect Theory, Mental Accounting, and Momentum.” Journal of Financial Economics 78 (2): 311–339.

[28] Gu, S., B, T. Kelly, and D. Xiu. 2020. “Empirical Asset Pricing via Machine Learning.” The Review of Financial Studies 35 (5): 2223–2273.

[29] Harvey, C. R., and Y. Liu. 2019. “False (and Missed) Discoveries in Financial Economics.” The Journal of Finance (forthcoming).

[30] Harvey, C. R., Y. Liu, and H. Zhu. 2016. “... and the Cross-Section of Expected Returns.” The Review of Financial Studies 29 (1): 5–68.

[31] Hirshleifer, D. 2015. “Behavioral Finance.” Annual Review of Financial Economics 7 (1): 133–159.

[32] Jorion, P., and W. N. Goetzmann. 1999. “Global Stock Markets in the Twentieth Century.” The Journal of Finance 54 (3): 953–980.

[33] Kothari, S. P., J. Shanken, and R. G. Sloan. 1995. “Another Look at the Cross-Section of Expected Stock Returns.” The Journal of Finance 50 (1): 185–224.

[34] Lo, A., and A. C. MacKinlay. 1990. “Data-Snooping Biases in Tests of Financial Asset Pricing Models.” The Review of Financial Studies 3 (3): 431–467.

[35] Longstaff, F. A. 1995. “How Much Can Marketability Affect Security Values?” The Journal of Finance 50 (5): 1767–1774.

[36] López de Prado, M. L. Advances in Financial Machine Learning. Hoboken: Wiley, 2018.

[37] MacKinlay, A. C. 1995. “Multifactor Models Do Not Explain Deviations from the CAPM.” Journal of Financial Economics 38 (1): 3–28.

[38] Mclean, R. D., and J. Pontiff. 2016. “Does Academic Research Destroy Stock Return Predictability?” The Journal of Finance 71 (1): 5–32.

[39] Moritz, B., and T. Zimmermann. “Tree-Based Conditional Portfolio Sorts: The Relation between Past and Future Stock Returns.” Working paper, 03, SSRN, 2016.

[40] Moskowitz, T. J., Y. H. Ooi, and L. H. Pedersen. 2012. “Time Series Momentum.” Journal of Financial Economics 104 (2): 228–250.

[41] Novy-Marx, R. 2013. “The Other Side of Value: The Gross Profitability Premium.” Journal of Financial Economics 108 (1): 1–28.

[42] Rietz, T. A. 1988. “The Equity Risk Premium a Solution.” Journal of Monetary Economics 22 (1): 117–131.

[43] Schapire, R. E., and Y. Singer. 1999. “Improved Boosting Algorithms Using Confidence-Rated Predictions.” Machine Learning 37 (3): 297–336.

[44] Schwerhoff, G., and M. Stuermer. “Non-Renewable Resources, Extraction Technology, and Endogenous Growth.” Working paper 2015(09), Federal Reserve Bank of Dallas, 2019.

[45] Schwert, G. W. 2003. Chapter 15 Anomalies and Market Efficiency, Vol. 1, pp. 939–974. Elsevier, 2003.

[46] Sharpe, W. F. 1964. “Capital Asset Prices: A Theory of Market Equilibrium under Conditions of Risk.” The Journal of Finance 19 (3): 425–442.

[47] Shleifer, A., and R. W. Vishny. 1997. “The Limits of Arbitrage.” The Journal of Finance 52 (1): 35–55.

Struck, C., and E. Cheng. 2019. “Time-Series Momentum: A Monte Carlo Approach.” The Journal of Financial Data Science 1 (4): 103–123.

风险提示:文献中的结果均由相应作者通过历史数据统计、建模和测算完成, 在政策、市场环境发生变化时模型存在失效的风险。

海外文献推荐系列第九十八期:重温奥卡姆剃刀:合理估计资产长期收益

海外文献推荐系列第九十七期:价值因子与利率:低利率是否导致了价值因子的回撤?

海外文献推荐系列第九十六期:共同基金的尾部风险与横截面收益?

海外文献推荐系列第九十五期:如何正确使用因子风险贡献比率指标?

海外文献推荐系列第九十四期:挑战传统智慧——近20年主动管理基金文献回顾

海外文献推荐系列第九十三期:如何获得宏观经济中的风险溢价?

海外文献推荐系列第九十二期:基于修正LASSO模型的投资组合复制策略

海外文献推荐系列第九十一期:机器交易:理论、进展和应用

海外文献推荐系列第九十期:无形资产与价值因子:你的价值因子是否过时了?

海外文献推荐系列第八十九期:最大回撤研究

海外文献推荐系列第八十八期:基于核PCA的动态市场风险信号研究

海外文献推荐系列第八十七期:利用下行波动率管理投资组合

海外文献推荐系列第八十六期:基于债券市场风险因子分析投资经理业绩

海外文献推荐系列第八十五期:基于高阶矩的风险平价方法

海外文献推荐系列第八十四期:共同基金的拥挤投资对股票收益的影响

海外文献推荐系列第八十三期:无处不在的因子动量

海外文献推荐系列第八十二期:如何设计价值投资策略

海外文献推荐系列第八十一期:基于市场转换的资产配置VS静态资产配置:让数据说话

海外文献推荐系列第八十期:对债券业绩归因模型的探索

海外文献推荐系列第七十九期:基于分层聚类的资产配置方法

海外文献推荐系列第七十八期:归因——事前和事后归因的统一框架

海外文献推荐系列第七十七期:投资组合因子配置——不仅仅是资产配置

海外文献推荐系列第七十六期:因子择时

海外文献推荐系列第七十五期:基于非参数的状态识别与预测

海外文献推荐系列第七十四期:共同基金投资者是否会高估基金极端正收益发生的概率?

海外文献推荐系列第七十三期:基于尾部风险和相关性的动态资产配置

海外文献推荐系列第七十二期:信号加权

海外文献推荐系列第七十一期:资产配置与因子配置——是否可以建立一个统一的方法?

海外文献推荐系列第七十期:从因子到资产:将因子暴露映射到资产配置

海外文献推荐系列第六十九期:如何克服海量因子库难题?—新因子的检验方法

海外文献推荐系列第六十八期:如何根据不同的经济环境进行资产配置?

海外文献推荐系列第六十七期:最差时期的最佳策略:投资组合能否抵御危机?

海外文献推荐系列第六十六期:基于市场状态转换的动态资产配置

海外文献推荐系列第六十五期:提升因子模型的定价能力

海外文献推荐系列第六十四期:盈余公告后漂移中的价格跳跃

海外文献推荐系列第六十三期:基于参数化策略的因子测试框架

海外文献推荐系列第六十二期:预测股票市场收益:分项加总的效果优于整体

海外文献推荐系列第六十一期:基于共同基金业绩分析羊群行为能否展示基金经理能力

海外文献推荐系列第六十期:基于预期收益的风险平价模型的构建与改进

海外文献推荐系列第五十九期:基于机器学习方法的宏观因子模拟投资组合构建

海外文献推荐系列第五十八期:现金指标是否比利润指标更能预测收益?

海外文献推荐系列第五十七期:如何将因子信息融入到指数基金和主动基金之中

海外文献推荐系列第五十六期:全球区域配置框架:构建全球FOF型ETF

海外文献推荐系列第五十五期:基于宏观经济因子的战术资产配置

海外文献推荐系列第五十四期:公司治理、ESG与全球股票收益关系

海外文献推荐系列第五十三期:协方差矩阵预测方法的比较

海外文献推荐系列第五十二期:如何有效利用ESG数据构建Smart Beta指数

海外文献推荐系列第五十一期:风险轮动中的风险规避

海外文献推荐系列第五十期:基于风险溢价的投资组合—一类风险分散的新方法

海外文献推荐系列第四十九期:横截面收益中的稀疏信号研究

海外文献推荐系列第四十八期:基于机构投资者交易情绪的动态资产配置研究

海外文献推荐系列第四十七期:主动投资中的 Timing 与 Sizing

海外文献推荐系列第四十六期:市场对称性及其在组合选择中的运用

海外文献推荐系列第四十五期:股票、债券和因果关系

海外文献推荐系列第四十四期:如何确定股票的联动效应?基于网络模型的择时研究

海外文献推荐系列第四十三期:ESG投资基础:ESG对股票估值、风险和收益的影响研究

海外文献推荐系列第四十二期:使用机器学习方法预测基金持

海外文献推荐系列第四十一期:防御性宏观因子择时研究

海外文献推荐系列第四十期:股票收益的周内效应研究

海外文献推荐系列第三十九期:战术性资产配置的宏观经济仪表盘

海外文献推荐系列第三十八期:宏观量化投资新基础

海外文献推荐系列第三十七期:如何预测中国股市的下行拐点

海外文献推荐系列第三十六期:行业分类方法重构的有效性研究

海外文献推荐系列第三十五期:目标波动性策略最优性研究

海外文献推荐系列第三十四期:价值投资、成长投资的基本原则及“价值陷阱”的解释

海外文献推荐系列第三十三期:因子溢价与因子择时-跨越世纪的实证结果(二)

海外文献推荐系列第三十三期:因子溢价与因子择时-跨越世纪的实证结果(一)

海外文献推荐系列第三十二期:构建纯多头多因子策略:投资组合合并与信号合并

海外文献推荐系列第三十一期:如何对分析师预期数据进行建模?-基于贝叶斯方法的研究

海外文献推荐系列第三十期:什么是质量因子

注:文中报告节选自兴业证券经济与金融研究院已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

证券研究报告:《西学东渐--海外文献推荐系列之九十九》。

对外发布时间:2020年10月22日

报告发布机构:兴业证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)

--------------------------------------

分析师:徐寅

SAC执业证书编号:S0190514070004

电话:18602155387,021-38565949

E-mail: xuyinsh@xyzq.com.cn

--------------------------------------

更多量化最新资讯和研究成果,欢迎关注我们的微信公众平台(微信号:XYZQ-QUANT)!