海内外量化长跑者们在坚持什么?

发布于: 修改于:Android转发:0回复:0喜欢:1

量化长跑者们的矛与盾

海内外量化投资领域,那些致力于打破「信息茧房」的量化长跑者们,以独特的视角和策略,在投资领域掀起了一股新浪潮。
全球化的今天,量化投资作为一种高效、科学的投资方式,也逐渐受到越来越多投资者的青睐。它运用先进的数学模型和算法,对市场数据进行深度挖掘和分析,从而发现隐藏在数据背后的投资机会。海内外量化领跑者,正以其精湛的技术和敏锐的洞察力,引领着量化投资的新潮流。
PART/ 01
量化的投资观是什么?
看过《Billions》的人应该记得这句话,'Quant is just another word for wild fucking guess with math.' 这似乎是不理解量化投资的人们,对于quantitative finance的一种「高度偏见」,因为量化分析虽然使用数学模型和算法来进行投资决策,但也存在不确定性,危机时期的量化集体回撤,让一切科学理论,看起来像一场「笑话」。

真的是这样吗?量化的投资方法论失效了吗?量化要进入死亡漩涡了吗?后面再看。
【非对称风险】的作者塔勒布曾说过:“对于不可预计的突发事件的发生,金融市场是没有准备的。而人生最大的风险是不冒风险。要想发表观点,首先要「入局」。另外,不要浪费任何一场危机。”
那么"量化的投资观到底是什么?量化眼中的价值又是什么?”近期在【面基】一期访谈中,我听到了一个简单易懂的答案。
对于投资观:
- 量化战胜的是胜率和广度
- 让策略失效的并非策略本身,而是市场状态变化
- 能力圈和迭代
- 不进则退的残酷行业规律
- 想法→数据和分析→因子→模型→风险优化→交易落地验证→迭代
- 可归因!
- 策略会随着认知越来越细分
- 市场状态选择了优势策略
- 从大类资产配置到大类策略配置
对于价值:
- 时间尺度不同,价值的定义也多种多样
- 价格本身既是价值
- 没有错的价格,价格本身就包含市场行为轨迹
- 任何指标都是高维经济系统的低维投影
这对大众来讲,应该比较好理解。
“量化之王”——文艺复兴科技的创始人詹姆斯-西蒙斯已离世,也借此缅怀伟大的智者。西蒙斯的量化投资观影响了很多人。“量化对冲基金有两类,一类叫文艺复兴科技,另一类叫其他。”这应该是印象最深的一句评价了。
目前来看,科技引领的量化投资在经历着一场巨大变革。
“金融市场价格如何对供求波动形成反应?”,这个问题有很多专业机构和学者讨论过,时间回到2018年,Two Sigma的创始人Justin Sirignano,从深度学习的视角,揭示了价格形成的复杂机制与规律,发现并利用金融市场中的复杂非线性关系,更好的理解市场动态,更高效的预测市场走势。
这篇文章《Universal features of price formation in financial markets: perspectives from Deep Learning》通过大规模的深度学习方法,应用于包含数十亿美国股票高频市场报价和交易的数据库,来探索金融市场中价格形成机制的普遍特征。如何运用高频数据构建机器学习模型,训练深度学习模型来尝试预测价格波动、用强化学习来尝试确定最优执行策略。在历史回测中,一些长期有效的因子可以提升预测能力,捕捉价格动态中路径依赖的证据,指导投资决策。
里面理论层面的东西较多,但核心在于,它能帮助更好的理解金融市场的运作规律,为投资者提供一些更加有效的投资策略和风险管理方法。事实证明,实践的可行性也有很大意义。
简单理解,深度学习模型的优势在于,可以通过持续学习新数据来适应市场变化,提高决策的适应性和时效性。但技术永远存在瓶颈,再先进的模型算法也有自身存在的“信息茧房”问题。当机器过分依赖模型的输出,依赖特定的样本数据集,模型会对新环境的适应性不足,从而产生错的决策。这就是为什么一些量化私募历史业绩很好,一旦经历一些极端尾部事件,模型失效不堪一击,或者回撤修复能力很差。这就对模型开发迭代和风险管理提出了更高的要求。
如果有一句话对我的价值观产生过重要影响,我认为是“相关不代表因果Correlation does not imply causation”。任何在统计学上有意义的规律,都有「软逻辑」的缺点。短期内的某些相关性,可能并不具有长期的稳定性,在有效市场假说中,所有可用信息都被迅速地反映在价格中。即使有相关性,也不一定意味着存在未被市场充分反映的信息。
历史也在不断印证这一点。如近两年小市值风格走势喜人,尤其微盘,因为微盘与经济周期的相关性较低,自身带有逆周期投资属性,哪里赚钱效应好,市场资金就会去哪。而市场化趋势选择的结果,让过去2年量化选股方向上出现了整体偏小市值的结构。你会发现,量化指增与小盘相关度逐渐升高,而一场危机后,引发量化赎回潮导致小市值出现抛压,但这并不代表量化投资就等同于小微盘股投资。微盘股的暴露确实跟更高的alpha收益相关,但不代表量化指增产品的alpha收益都是来自微盘股的暴露。“市值下沉”是表象,“同质化+过度杠杆”才是危机背后的因果。在广度上,量化模型本来就有天然优势,对市场的小市值股票有更强的定价权,超额挖掘能力也更强。私募量化有自身明确的风险约束控制,只是各家对微盘暴露程度不同,需要投资者审慎甄别,量化投资经理是否知行合一,是否是正经量化,是否足够了解收益来源是什么。
今年2月的流动性危机,是刷新对市场认知的一个好例子,外力干预下的市场,是不是优质资产都被收割,引发pure alpha出现「踩踏效应」,而海内外的前车之鉴,这种流动性危机都具有「高度暂时性」,也就是说来去匆匆,容不得一点反应时间。Montier在《What Happened to the Quants in August 2007》中提到,“当某类策略领域流入大量资金之后,对于这一领域的大型基金而言,依靠历史数据,已经无法评估当前价格冲击带来的波动风险,风险变得更具“内生性”。“本质上,对量化策略造成的短期较大幅度的冲击,更像是不确定性中的必然。当然有没受伤的,这里暂不展开。
量化有自身的弱点,但更多的是优势。
海外优秀的量化机构很多,且发展领先于国内,但各自的投资策略和业务模式也存在差异。2016年是全球化退潮最明显的风水岭。这一年,是海外量化发展的瓶颈期,却是国内量化投资策略的快速发展期。回顾过去一年尽调的量化私募管理人,从海外量化投资机构回国发展起来的,确实在管理规模和业绩上的优势更明显,从「产品、渠道、策略」各方面都在多元化发展。
海外有一些耳熟能详的量化领跑者,这里做个简单对比。
「WorldQuant、Citadel和Two Sigma的异同」
GPT-4-turbo给我的答案:
WorldQuant、Citadel和Two Sigma是金融行业中非常知名的量化投资公司,都使用复杂的数学模型和大规模数据分析来驱动投资决策。尽管这三家公司在方法论和技术上有很多相似之处,但各自的业务模式、公司文化和特定策略也有所区别。
1. WorldQuant
WorldQuant由前DE Shaw的研究员Igor Tulchinsky于1992年创立。它专注于全球股票市场的统计套利和相对价值策略。WorldQuant特点是其全球化的研究团队和虚拟研究中心,使得公司能够吸引全球范围内的人才,也非常注重开发和利用先进的算法模型来预测市场动态。
2. Citadel
Citadel由Ken Griffin于1990年创立,起源于传统的多策略对冲基金,也涉足量化投资。Citadel不仅是量化投资,它还运行着一系列非量化策略,如基本面分析和宏观交易。Citadel的量化部门Citadel Securities,是市场上最大的做市商之一,它使用高频交易策略及其他算法交易策略。Citadel的业务非常多样化,涉及证券、资产管理、做市等多个方面。
3. Two Sigma
Two Sigma成立于2001年,由David Siegel、John Overdeck和Mark Pickard创立,起源于学术界。小写的Sigma“σ”代表着投资收益的波动性和超额回报,大写的Sigma“Σ”代表着求和。公司以其科技驱动的方法而闻名,使用各种科学技术(如人工智能、机器学习和大数据分析)来生成投资策略。Two Sigma特别强调技术的应用,在模型开发和交易执行方面非常依赖技术创新。
相同点:
1. 技术驱动:三家公司都非常依赖于技术,尤其是机器学习和大数据分析,来发展和执行复杂的交易策略。
2. 全球视野:它们都在全球范围内操作,并利用全球数据来优化其模型和策略。
3. 顶尖人才:三家公司都吸引了顶尖的工程师、数据科学家和金融专家。
不同点:
1. 规模和业务范围:WorldQuant 规模最大,管理资产规模达到数千亿美元;Citadel业务范围最广,包括非量化投资和大规模的做市业务。Two Sigma更专注于纯粹的量化投资业务。
2. 公司文化和管理模式:Citadel更像是传统的对冲基金,拥有多元化的投资策略和较为严格的管理结构, 更注重交易执行和信息优势。Two Sigma和WorldQuant更倾向于科技公司的风格,强调创新和技术。WorldQuant更注重量化研究和系统建设;Two Sigma更强调团队协作和系统化管理,且非常注重风险管理。
3. 投资策略侧重点:WorldQuant偏重于全球股票市场的统计套利,更注重开发大规模、高频的量化交易策略。Two Sigma 更注重利用前沿的机器学习技术开发策略;Citadel注重运用其多策略的优势进行交易,在量化交易的基础上,结合了一定的基本面分析,也涉及大量人工交易。
核心投研团队还有个共同点,不再卷是否是金融背景,更多卷向计算机科学、数学、工程等精英人才,凸显了对技术的极度重视,国内的形势,似乎也越来越趋同。昨天看到一句话,海外对冲基金千禧年的技术负责人Olga Naumovich近期说到:“人最重要是数学的思维方式,机器无法取代,因为无法复制任何需要反思和联想的东西”。看来,在AI驱动量化投资的变革中,人的价值仍然不能忽视。
PART/ 02
一些国内量化PM的投资交流心得(一)
机器学习和深度学习模型现在卷到什么程度了?头部量化暂且不谈,说说前一段参加线下xx私募量化的策略交流会,我了解到的一些PM的看法。LP投资经理孙林总前身是Two Sigma,回国创业多年,谈到现在国内很多机构也开始用到端到端深度学习,但他们依然比较谨慎,下面是和PM交流过程中的一些观点(仅做分享)
孙总谈到:“海外整个行业的业态,比国内对于回撤的要求要高很多,对夏普要求也要高很多,也就是说,海外不管是投资人还是管理人,都特别讨厌variance,也就是讨厌风险这件事情。这也是为什么我2018回国之前,其实国内已经有人说自己在做机器学习,我也很确定是有公司在做,而在美国基本上没有人做机器学习。因为机器学习模型主要好处在于它能calibrate很好,缺点在于它可能有一个大的variance。回归到统计学中的Bias-Variance Tradeoff,简而言之,它容易让你overfitting出一个模型你觉得很好,但其实很多都是噪音。所以传统上来讲,以前在美国其实基本上都是线性,2018年离开美国时,可能除了Two Sigma有一点之外,别的公司压根没有。”
“但这几年,不管在国内国外,非线性模型都发展得非常多,现在美国来看,非线性模型占比也是非常高的。我们是属于最典型,职业发展在海外,创业之前没有在国内工作过的投资经理,虽然在国内要学习,但我们以往对于风险的态度是极度厌恶的。对风险厌恶的研究员一般会比较喜欢简单的模型,但另一方面,机器学习或端对端的深度学习,这是技术发展中的产物,我们肯定要做这个事,所以我们会以线性模型为基础,再往上加“机器学习模型、深度学习模型,端对端”,然后重新调整权重,现在一半是线性,一半是非线性。”
“我的看法依然是,得去用它,因为你不用,它发展起来了,你就会被它替代掉。但重要的是,得是一个非常审慎的态度,机器学习权重不能给太大,大家可能发现,那些特别注重端对端的公司,在年前那一波流动性危机下,量化回撤会很大。原因很简单,当你太在乎Bias,把Bias降到最少之后,Variance一定会变大,尤其是又没有在Barra风格因子上控的特别严格,就容易遇到最大回撤,这是一个完全符合预期的结果,之前的收益和之后的回撤,都是相辅相成的,因为盈亏同源。”
我们的常规理解可能是模型越复杂,预测能力不应该越强?否则为什么要开发那么多复杂的非线性模型?实则不然。Bias体现模型的拟合能力,Variance体现模型的鲁棒性,两者的微妙关系决定了最终的表现。《Understanding the Bias-Variance Tradeoff》中强调,“直觉会误导人们过分关注偏差而忽视方差,偏差和方差与模型复杂性有关,模型越复杂,意味着偏差越低,方差越高。”
简单的线性模型,不具备足够的能力捕捉数据中的复杂关系,会导致欠拟合;但复杂的非线性模型,对于训练数据的一些噪声和细节会过度敏感,又导致过拟合。换句话说,历史有的数据它表现不错,一旦出现样本外新数据,就会容易崩,2月份的量化危机考验了所有人。所以,建立一个拟合度好又具有鲁棒性的预测模型,需要找到“偏差”和“方差”之间的最佳平衡点,但这一点,好像确实没想得那么简单。
“国内和国外做对比,在中国做深度学习端对端的比重会比美国要高很多,一个主要原因就是业态,大家对风险的认知不同造成的。”孙总对于国内外现在的量化发展直言不讳。
”现在金融领域里,对于非线性模型的应用,仍处于一个没有那么fancy的阶段。但非线性模型确实很大一部分是年轻优秀人才做出来的。问题在于,这种特别复杂的模型最大的敌人就是variance,因此,需要有足够有经验的人去协助他们如何控制住风险,因为投资人最大的敌人往往就是追求风险。” 可能这也是很多量化管理人面临的问题。
之前与RT的投资经理交流,也谈到了这个问题,“端到端对我们来说,是一个更黑箱的状态,但从训练结果看,它确实能够提供一些更外维的信息,能从更源头挖掘一些非线性特征,所以端到端可能是会有一定的提升,但需要更长时间的训练优化和验证,我们目前对此比较谨慎,也需要更长时间的模拟盘做验证。”
所以,一个好的策略是什么?是应该具备能够应对“市场环境改变与多任务间动态关系的灵活性”,也就是说,持续优化迭代后,能够建立更适应环境行为模式的“动态期望”,体现在业绩上,是一个稳定的、可持续的、可归因的收益回报。但事实上,机器学习和深度学习模型的瓶颈——「黑箱」,可解释性问题仍没有完全突破,当然,能持续稳定赚钱的“好策略”也不存在,这是做FOF能体会到的直观感受。
为什么说一旦尾部风险出现,发生几倍标准差以外的行情时,所有量化即使是高频,也很难在极短时间作出响应?【交易门】里有一个关于策略决策的表述,我觉得可以很好理解这个问题,“策略决策端,交易下单的买卖决策是离散的,但内部模型计算是连续运行的,需要时刻掌握变化和对资产价格变动的连续影响,但在跟踪变化的环节,根本没有狭义时间容身的空间。”
也就是说,从数据进入到模型决策下单发出,中间都是实时连续的预测,一旦数据维度的长期逻辑被打破了,非市场自发行为的规律就不起作用了,任何模型都没有超出常理的反应能力。所以你会看到,尤其量化指增策略,即使市场流动性危机蔓延,也坚守满仓参与。“永远满仓,偶有受伤。” 但这种历史极值区域出现的量化策略“失效”,往往会成为被舆论放大的“众矢之的”。
PART/ 03
一些国内量化PM的投资交流心得(二)
YS和ML合并后首场路演交流中,对魏总提到几点印象深刻。
(1)任何策略都具有周期性。“整个量化前两年都在卷深度学习,卷模型,卷机器。深度学习出来的这些信号,确实在过去几年里会完全战胜其他的传统信号。但去年下半年,这些机器学习模型,尤其在某些层面,反而不如普通线性因子的收益。这些传统信号可能只是量化1.0,一个处于鄙视链下端的产物。因此,不管一个策略多牛,都逃不开周期性。任何类型的策略,都要接受它的周期性的好,周期性的差。”
(2)策略周期性资金出清后,下半年小盘的pure alpha空间会比较客观。“头部私募size控制都是比较严格,在这种有一定相关性的策略都集中在大票上时,策略的周期性资金在一定程度上是出清的,未来三个季度,小盘的Pure Alpha 空间反倒是放大的。”
(3)风控的前提逻辑基础,是收益周期性的一种现实性反馈。任何风险控制,都是对收益的一种折损。
这一点,我也听到过很多看法。MF的刘总提到过一个观点:“要获得比较好的超额,行业与市值暴露可以被允许,只不过需要考量,由此带来的风险,是否能够换回足够强的超额,以及错误暴露带来的单次损失,是否能限制在比较小的范围之内。量化策略技术的变革,要更重视风险控制,也要防止伪装成alpha的 smart beta。”
「新事物永远会代替旧事物」
回顾来看,规模超跑、风格漂移、市值下沉,敞口暴露,杠杆过度使用,因子同质化交易等等,直到私募行业的出清洗牌到二次洗牌,行业格局生态开始经历重塑,但也为量化交易的发展路径,提供了更清晰的方向。LP的孙总最后说了一句话,"我们也确实看到了国内很多优秀的量化私募应该有的样子,尽管监管新规可能会增加行业的经营成本,尤其会增加头部效应,使新进入者的门槛更高,但这对整个行业发展是有益的,有助于避免大家「走火入魔」。”
过去两年,你会听到有人说,“国内的量化交易支撑的整个泛行业的科研和技术储备都相对落后,这不仅是能力问题,更是技术环境问题。” 现在重新审视这个问题,似乎是一种偏见。
前几天,纽约大学教授陈溪,在【第九届巴菲特股东大会中美投资人酒会】中提到,“人工智能会给量化投资带来一场革命,而中国的私募,无论在算法或者算力上,正在赶超美国顶级的对冲基金。” 了解头部量化管理人的,应该都感受得到这种变化。
「算法交易的层出不穷」
2023年的量化科技白皮书中提到,国内主流的算法交易服务商,其发展速度也是惊人的,如“第三方算法交易服务商”,一批最具市场化意识的行业竞争者,卡方(从私募层面切入)、迅投、争锋、自诚、创智、皓兴、跃然、宇量、聚宽“等。具备技术实力的科技公司,跨行进入算法领域,以“非凸科技、启能达科技等”为代表的潜在竞争者,也势均力敌。
而后的“券商PB 交易系统的技术服务商”,依托自身对交易链路的优势,向算法领域吞并或是自研,或是联合三方供应商进一步发展,头部券商自研能力强大的华泰金工、中信证券等,也在不断发展自身策略并横线扩张。快速发展的量化私募自研算法,高手更是比比皆是。
现在看来,那些优秀的量化长跑者们,仍在不断探索新的数据来源和分析方法,积极拥抱新技术,利用大数据、人工智能等先进工具,提升数据处理和分析能力。同时注重跨界融合,拓展投资视野,这也是这个行业带给我的震撼。
相信随着技术的不断发展和市场的日益成熟,量化投资会发挥更重要的作用,为投资者带来更多价值。
回到主题,我确实也没回答这个问题,量化领跑者们到底在坚持什么?在坚持科技创新,赋能行业发展?
很认同SGD何总的一句话,“量化行业本质上是资金、交易逻辑和市场容量三者之间的协调关系。量化交易中策略会失效,但投资逻辑是不会失效的,关键在于投资者的坚持度,如果坚持度很低,那么将永远买在高点,卖在低点。”
量化和主观投资并不是对立面,有不同的投资逻辑和投资信仰,两者也都不具有“一招制胜”的投资策略。过度神化某一种投资策略,只会伤了自己。
很喜欢电影《大空头》开头那句引语:It ain't what you don't know that gets you into trouble! It's what you know for sure that just ain't so. 让我们陷于困境的不是我们的无知,而是看似正确的谬误。#量化交易# #AI#