海内外量化长跑者们在坚持什么？量化长跑者们的矛与盾海内外量化投资领域，那些致力于打破「信息茧房」的量化长跑者们，以独特的视角和策略，在投资领域掀起了一...

量化长跑者们的矛与盾

海内外量化投资领域，那些致力于打破「信息茧房」的量化长跑者们，以独特的视角和策略，在投资领域掀起了一股新浪潮。
全球化的今天，量化投资作为一种高效、科学的投资方式，也逐渐受到越来越多投资者的青睐。它运用先进的数学模型和算法，对市场数据进行深度挖掘和分析，从而发现隐藏在数据背后的投资机会。海内外量化领跑者，正以其精湛的技术和敏锐的洞察力，引领着量化投资的新潮流。
PART/ 01
量化的投资观是什么？
看过《Billions》的人应该记得这句话，'Quant is just another word for wild fucking guess with math.' 这似乎是不理解量化投资的人们，对于quantitative finance的一种「高度偏见」，因为量化分析虽然使用数学模型和算法来进行投资决策，但也存在不确定性，危机时期的量化集体回撤，让一切科学理论，看起来像一场「笑话」。

真的是这样吗？量化的投资方法论失效了吗？量化要进入死亡漩涡了吗？后面再看。
【非对称风险】的作者塔勒布曾说过：“对于不可预计的突发事件的发生，金融市场是没有准备的。而人生最大的风险是不冒风险。要想发表观点，首先要「入局」。另外，不要浪费任何一场危机。”
那么"量化的投资观到底是什么？量化眼中的价值又是什么？”近期在【面基】一期访谈中，我听到了一个简单易懂的答案。
对于投资观：
- 量化战胜的是胜率和广度
- 让策略失效的并非策略本身，而是市场状态变化
- 能力圈和迭代
- 不进则退的残酷行业规律
- 想法→数据和分析→因子→模型→风险优化→交易落地验证→迭代
- 可归因！
- 策略会随着认知越来越细分
- 市场状态选择了优势策略
- 从大类资产配置到大类策略配置
对于价值：
- 时间尺度不同，价值的定义也多种多样
- 价格本身既是价值
- 没有错的价格，价格本身就包含市场行为轨迹
- 任何指标都是高维经济系统的低维投影
这对大众来讲，应该比较好理解。
“量化之王”——文艺复兴科技的创始人詹姆斯-西蒙斯已离世，也借此缅怀伟大的智者。西蒙斯的量化投资观影响了很多人。“量化对冲基金有两类，一类叫文艺复兴科技，另一类叫其他。”这应该是印象最深的一句评价了。
目前来看，科技引领的量化投资在经历着一场巨大变革。
“金融市场价格如何对供求波动形成反应？”，这个问题有很多专业机构和学者讨论过，时间回到2018年，Two Sigma的创始人Justin Sirignano，从深度学习的视角，揭示了价格形成的复杂机制与规律，发现并利用金融市场中的复杂非线性关系，更好的理解市场动态，更高效的预测市场走势。
这篇文章《Universal features of price formation in financial markets: perspectives from Deep Learning》通过大规模的深度学习方法，应用于包含数十亿美国股票高频市场报价和交易的数据库，来探索金融市场中价格形成机制的普遍特征。如何运用高频数据构建机器学习模型，训练深度学习模型来尝试预测价格波动、用强化学习来尝试确定最优执行策略。在历史回测中，一些长期有效的因子可以提升预测能力，捕捉价格动态中路径依赖的证据，指导投资决策。
里面理论层面的东西较多，但核心在于，它能帮助更好的理解金融市场的运作规律，为投资者提供一些更加有效的投资策略和风险管理方法。事实证明，实践的可行性也有很大意义。
简单理解，深度学习模型的优势在于，可以通过持续学习新数据来适应市场变化，提高决策的适应性和时效性。但技术永远存在瓶颈，再先进的模型算法也有自身存在的“信息茧房”问题。当机器过分依赖模型的输出，依赖特定的样本数据集，模型会对新环境的适应性不足，从而产生错的决策。这就是为什么一些量化私募历史业绩很好，一旦经历一些极端尾部事件，模型失效不堪一击，或者回撤修复能力很差。这就对模型开发迭代和风险管理提出了更高的要求。
如果有一句话对我的价值观产生过重要影响，我认为是“相关不代表因果Correlation does not imply causation”。任何在统计学上有意义的规律，都有「软逻辑」的缺点。短期内的某些相关性，可能并不具有长期的稳定性，在有效市场假说中，所有可用信息都被迅速地反映在价格中。即使有相关性，也不一定意味着存在未被市场充分反映的信息。
历史也在不断印证这一点。如近两年小市值风格走势喜人，尤其微盘，因为微盘与经济周期的相关性较低，自身带有逆周期投资属性，哪里赚钱效应好，市场资金就会去哪。而市场化趋势选择的结果，让过去2年量化选股方向上出现了整体偏小市值的结构。你会发现，量化指增与小盘相关度逐渐升高，而一场危机后，引发量化赎回潮导致小市值出现抛压，但这并不代表量化投资就等同于小微盘股投资。微盘股的暴露确实跟更高的alpha收益相关，但不代表量化指增产品的alpha收益都是来自微盘股的暴露。“市值下沉”是表象，“同质化+过度杠杆”才是危机背后的因果。在广度上，量化模型本来就有天然优势，对市场的小市值股票有更强的定价权，超额挖掘能力也更强。私募量化有自身明确的风险约束控制，只是各家对微盘暴露程度不同，需要投资者审慎甄别，量化投资经理是否知行合一，是否是正经量化，是否足够了解收益来源是什么。
今年2月的流动性危机，是刷新对市场认知的一个好例子，外力干预下的市场，是不是优质资产都被收割，引发pure alpha出现「踩踏效应」，而海内外的前车之鉴，这种流动性危机都具有「高度暂时性」，也就是说来去匆匆，容不得一点反应时间。Montier在《What Happened to the Quants in August 2007》中提到，“当某类策略领域流入大量资金之后，对于这一领域的大型基金而言，依靠历史数据，已经无法评估当前价格冲击带来的波动风险，风险变得更具“内生性”。“本质上，对量化策略造成的短期较大幅度的冲击，更像是不确定性中的必然。当然有没受伤的，这里暂不展开。
量化有自身的弱点，但更多的是优势。
海外优秀的量化机构很多，且发展领先于国内，但各自的投资策略和业务模式也存在差异。2016年是全球化退潮最明显的风水岭。这一年，是海外量化发展的瓶颈期，却是国内量化投资策略的快速发展期。回顾过去一年尽调的量化私募管理人，从海外量化投资机构回国发展起来的，确实在管理规模和业绩上的优势更明显，从「产品、渠道、策略」各方面都在多元化发展。
海外有一些耳熟能详的量化领跑者，这里做个简单对比。
「WorldQuant、Citadel和Two Sigma的异同」
GPT-4-turbo给我的答案：
WorldQuant、Citadel和Two Sigma是金融行业中非常知名的量化投资公司，都使用复杂的数学模型和大规模数据分析来驱动投资决策。尽管这三家公司在方法论和技术上有很多相似之处，但各自的业务模式、公司文化和特定策略也有所区别。
1. WorldQuant
WorldQuant由前DE Shaw的研究员Igor Tulchinsky于1992年创立。它专注于全球股票市场的统计套利和相对价值策略。WorldQuant特点是其全球化的研究团队和虚拟研究中心，使得公司能够吸引全球范围内的人才，也非常注重开发和利用先进的算法模型来预测市场动态。
2. Citadel
Citadel由Ken Griffin于1990年创立，起源于传统的多策略对冲基金，也涉足量化投资。Citadel不仅是量化投资，它还运行着一系列非量化策略，如基本面分析和宏观交易。Citadel的量化部门Citadel Securities，是市场上最大的做市商之一，它使用高频交易策略及其他算法交易策略。Citadel的业务非常多样化，涉及证券、资产管理、做市等多个方面。
3. Two Sigma
Two Sigma成立于2001年，由David Siegel、John Overdeck和Mark Pickard创立，起源于学术界。小写的Sigma“σ”代表着投资收益的波动性和超额回报，大写的Sigma“Σ”代表着求和。公司以其科技驱动的方法而闻名，使用各种科学技术（如人工智能、机器学习和大数据分析）来生成投资策略。Two Sigma特别强调技术的应用，在模型开发和交易执行方面非常依赖技术创新。
相同点：
1. 技术驱动：三家公司都非常依赖于技术，尤其是机器学习和大数据分析，来发展和执行复杂的交易策略。
2. 全球视野：它们都在全球范围内操作，并利用全球数据来优化其模型和策略。
3. 顶尖人才：三家公司都吸引了顶尖的工程师、数据科学家和金融专家。
不同点：
1. 规模和业务范围：WorldQuant 规模最大，管理资产规模达到数千亿美元；Citadel业务范围最广，包括非量化投资和大规模的做市业务。Two Sigma更专注于纯粹的量化投资业务。
2. 公司文化和管理模式：Citadel更像是传统的对冲基金，拥有多元化的投资策略和较为严格的管理结构，更注重交易执行和信息优势。Two Sigma和WorldQuant更倾向于科技公司的风格，强调创新和技术。WorldQuant更注重量化研究和系统建设；Two Sigma更强调团队协作和系统化管理，且非常注重风险管理。
3. 投资策略侧重点：WorldQuant偏重于全球股票市场的统计套利，更注重开发大规模、高频的量化交易策略。Two Sigma 更注重利用前沿的机器学习技术开发策略；Citadel注重运用其多策略的优势进行交易，在量化交易的基础上,结合了一定的基本面分析，也涉及大量人工交易。
核心投研团队还有个共同点，不再卷是否是金融背景，更多卷向计算机科学、数学、工程等精英人才，凸显了对技术的极度重视，国内的形势，似乎也越来越趋同。昨天看到一句话，海外对冲基金千禧年的技术负责人Olga Naumovich近期说到：“人最重要是数学的思维方式，机器无法取代，因为无法复制任何需要反思和联想的东西”。看来，在AI驱动量化投资的变革中，人的价值仍然不能忽视。
PART/ 02
一些国内量化PM的投资交流心得（一）
机器学习和深度学习模型现在卷到什么程度了？头部量化暂且不谈，说说前一段参加线下xx私募量化的策略交流会，我了解到的一些PM的看法。LP投资经理孙林总前身是Two Sigma，回国创业多年，谈到现在国内很多机构也开始用到端到端深度学习，但他们依然比较谨慎，下面是和PM交流过程中的一些观点（仅做分享）
孙总谈到：“海外整个行业的业态，比国内对于回撤的要求要高很多，对夏普要求也要高很多，也就是说，海外不管是投资人还是管理人，都特别讨厌variance，也就是讨厌风险这件事情。这也是为什么我2018回国之前，其实国内已经有人说自己在做机器学习，我也很确定是有公司在做，而在美国基本上没有人做机器学习。因为机器学习模型主要好处在于它能calibrate很好，缺点在于它可能有一个大的variance。回归到统计学中的Bias-Variance Tradeoff，简而言之，它容易让你overfitting出一个模型你觉得很好，但其实很多都是噪音。所以传统上来讲，以前在美国其实基本上都是线性，2018年离开美国时，可能除了Two Sigma有一点之外，别的公司压根没有。”
“但这几年，不管在国内国外，非线性模型都发展得非常多，现在美国来看，非线性模型占比也是非常高的。我们是属于最典型，职业发展在海外，创业之前没有在国内工作过的投资经理，虽然在国内要学习，但我们以往对于风险的态度是极度厌恶的。对风险厌恶的研究员一般会比较喜欢简单的模型，但另一方面，机器学习或端对端的深度学习，这是技术发展中的产物，我们肯定要做这个事，所以我们会以线性模型为基础，再往上加“机器学习模型、深度学习模型，端对端”，然后重新调整权重，现在一半是线性，一半是非线性。”
“我的看法依然是，得去用它，因为你不用，它发展起来了，你就会被它替代掉。但重要的是，得是一个非常审慎的态度，机器学习权重不能给太大，大家可能发现，那些特别注重端对端的公司，在年前那一波流动性危机下，量化回撤会很大。原因很简单，当你太在乎Bias，把Bias降到最少之后，Variance一定会变大，尤其是又没有在Barra风格因子上控的特别严格，就容易遇到最大回撤，这是一个完全符合预期的结果，之前的收益和之后的回撤，都是相辅相成的，因为盈亏同源。”
我们的常规理解可能是模型越复杂，预测能力不应该越强？否则为什么要开发那么多复杂的非线性模型？实则不然。Bias体现模型的拟合能力，Variance体现模型的鲁棒性，两者的微妙关系决定了最终的表现。《Understanding the Bias-Variance Tradeoff》中强调，“直觉会误导人们过分关注偏差而忽视方差，偏差和方差与模型复杂性有关，模型越复杂，意味着偏差越低，方差越高。”
简单的线性模型，不具备足够的能力捕捉数据中的复杂关系，会导致欠拟合；但复杂的非线性模型，对于训练数据的一些噪声和细节会过度敏感，又导致过拟合。换句话说，历史有的数据它表现不错，一旦出现样本外新数据，就会容易崩，2月份的量化危机考验了所有人。所以，建立一个拟合度好又具有鲁棒性的预测模型，需要找到“偏差”和“方差”之间的最佳平衡点，但这一点，好像确实没想得那么简单。
“国内和国外做对比，在中国做深度学习端对端的比重会比美国要高很多，一个主要原因就是业态，大家对风险的认知不同造成的。”孙总对于国内外现在的量化发展直言不讳。
”现在金融领域里，对于非线性模型的应用，仍处于一个没有那么fancy的阶段。但非线性模型确实很大一部分是年轻优秀人才做出来的。问题在于，这种特别复杂的模型最大的敌人就是variance，因此，需要有足够有经验的人去协助他们如何控制住风险，因为投资人最大的敌人往往就是追求风险。” 可能这也是很多量化管理人面临的问题。
之前与RT的投资经理交流，也谈到了这个问题，“端到端对我们来说，是一个更黑箱的状态，但从训练结果看，它确实能够提供一些更外维的信息，能从更源头挖掘一些非线性特征，所以端到端可能是会有一定的提升，但需要更长时间的训练优化和验证，我们目前对此比较谨慎，也需要更长时间的模拟盘做验证。”
所以，一个好的策略是什么？是应该具备能够应对“市场环境改变与多任务间动态关系的灵活性”，也就是说，持续优化迭代后，能够建立更适应环境行为模式的“动态期望”，体现在业绩上，是一个稳定的、可持续的、可归因的收益回报。但事实上，机器学习和深度学习模型的瓶颈——「黑箱」，可解释性问题仍没有完全突破，当然，能持续稳定赚钱的“好策略”也不存在，这是做FOF能体会到的直观感受。
为什么说一旦尾部风险出现，发生几倍标准差以外的行情时，所有量化即使是高频，也很难在极短时间作出响应？【交易门】里有一个关于策略决策的表述，我觉得可以很好理解这个问题，“策略决策端，交易下单的买卖决策是离散的，但内部模型计算是连续运行的，需要时刻掌握变化和对资产价格变动的连续影响，但在跟踪变化的环节，根本没有狭义时间容身的空间。”
也就是说，从数据进入到模型决策下单发出，中间都是实时连续的预测，一旦数据维度的长期逻辑被打破了，非市场自发行为的规律就不起作用了，任何模型都没有超出常理的反应能力。所以你会看到，尤其量化指增策略，即使市场流动性危机蔓延，也坚守满仓参与。“永远满仓，偶有受伤。” 但这种历史极值区域出现的量化策略“失效”，往往会成为被舆论放大的“众矢之的”。
PART/ 03
一些国内量化PM的投资交流心得（二）
YS和ML合并后首场路演交流中，对魏总提到几点印象深刻。
（1）任何策略都具有周期性。“整个量化前两年都在卷深度学习，卷模型，卷机器。深度学习出来的这些信号，确实在过去几年里会完全战胜其他的传统信号。但去年下半年，这些机器学习模型，尤其在某些层面，反而不如普通线性因子的收益。这些传统信号可能只是量化1.0，一个处于鄙视链下端的产物。因此，不管一个策略多牛，都逃不开周期性。任何类型的策略，都要接受它的周期性的好，周期性的差。”
（2）策略周期性资金出清后，下半年小盘的pure alpha空间会比较客观。“头部私募size控制都是比较严格，在这种有一定相关性的策略都集中在大票上时，策略的周期性资金在一定程度上是出清的，未来三个季度，小盘的Pure Alpha 空间反倒是放大的。”
（3）风控的前提逻辑基础，是收益周期性的一种现实性反馈。任何风险控制，都是对收益的一种折损。
这一点，我也听到过很多看法。MF的刘总提到过一个观点：“要获得比较好的超额，行业与市值暴露可以被允许，只不过需要考量，由此带来的风险，是否能够换回足够强的超额，以及错误暴露带来的单次损失，是否能限制在比较小的范围之内。量化策略技术的变革，要更重视风险控制，也要防止伪装成alpha的 smart beta。”
「新事物永远会代替旧事物」
回顾来看，规模超跑、风格漂移、市值下沉，敞口暴露，杠杆过度使用，因子同质化交易等等，直到私募行业的出清洗牌到二次洗牌，行业格局生态开始经历重塑，但也为量化交易的发展路径，提供了更清晰的方向。LP的孙总最后说了一句话，"我们也确实看到了国内很多优秀的量化私募应该有的样子，尽管监管新规可能会增加行业的经营成本，尤其会增加头部效应，使新进入者的门槛更高，但这对整个行业发展是有益的，有助于避免大家「走火入魔」。”
过去两年，你会听到有人说，“国内的量化交易支撑的整个泛行业的科研和技术储备都相对落后，这不仅是能力问题，更是技术环境问题。” 现在重新审视这个问题，似乎是一种偏见。
前几天，纽约大学教授陈溪，在【第九届巴菲特股东大会中美投资人酒会】中提到，“人工智能会给量化投资带来一场革命，而中国的私募，无论在算法或者算力上，正在赶超美国顶级的对冲基金。” 了解头部量化管理人的，应该都感受得到这种变化。
「算法交易的层出不穷」
2023年的量化科技白皮书中提到，国内主流的算法交易服务商，其发展速度也是惊人的，如“第三方算法交易服务商”，一批最具市场化意识的行业竞争者，卡方（从私募层面切入）、迅投、争锋、自诚、创智、皓兴、跃然、宇量、聚宽“等。具备技术实力的科技公司，跨行进入算法领域，以“非凸科技、启能达科技等”为代表的潜在竞争者，也势均力敌。
而后的“券商PB 交易系统的技术服务商”，依托自身对交易链路的优势，向算法领域吞并或是自研，或是联合三方供应商进一步发展，头部券商自研能力强大的华泰金工、中信证券等，也在不断发展自身策略并横线扩张。快速发展的量化私募自研算法，高手更是比比皆是。
现在看来，那些优秀的量化长跑者们，仍在不断探索新的数据来源和分析方法，积极拥抱新技术，利用大数据、人工智能等先进工具，提升数据处理和分析能力。同时注重跨界融合，拓展投资视野，这也是这个行业带给我的震撼。
相信随着技术的不断发展和市场的日益成熟，量化投资会发挥更重要的作用，为投资者带来更多价值。
回到主题，我确实也没回答这个问题，量化领跑者们到底在坚持什么？在坚持科技创新，赋能行业发展？
很认同SGD何总的一句话，“量化行业本质上是资金、交易逻辑和市场容量三者之间的协调关系。量化交易中策略会失效，但投资逻辑是不会失效的，关键在于投资者的坚持度，如果坚持度很低，那么将永远买在高点，卖在低点。”
量化和主观投资并不是对立面，有不同的投资逻辑和投资信仰，两者也都不具有“一招制胜”的投资策略。过度神化某一种投资策略，只会伤了自己。
很喜欢电影《大空头》开头那句引语：It ain't what you don't know that gets you into trouble! It's what you know for sure that just ain't so. 让我们陷于困境的不是我们的无知，而是看似正确的谬误。#量化交易# #AI#

海内外量化长跑者们在坚持什么？

作者：红岸研究