信弘天禾章毅对量化股票策略的全面解析

发布于: 雪球转发:1回复:1喜欢:2

时间:2023年12月

内容:信弘天禾章毅对量化股票策略的全面解析

主讲人:基金经理章毅

前言

回顾过去这两年来,我和大家共同经历了A股市场的整个震荡下行,这一段行情里面集中了很多不同的特点,包括疫情的不可控性、国际地缘政治经济的不确定性、国内经济转型的阶段性等等的特点都集中在一起,并伴随了整个A股市场投资者结构的微观变化,这些综合因素让整个市场的贝塔一直在下行,阿尔法也呈现一定的衰减。信弘作为一家量化管理人,我们所坚持和努力的研究方向还是秉承了对数理模型、机器学习深度学习的信仰,以求真为投研原则来探索整个A股市场运行的一些微观规律,在微观规律中创造价值。这次分享主要包括5个方面,分别是信弘的基本情况、策略研发、产品业绩、风控以及公司优势。

信弘的基本情况

信弘成立于2012年,是中国证券基金业协会登记备案的私募管理人。策略以数理统计和机器学习深度学习为基础,中间结合了很多华尔街量化投资方法的实践经验,以及整个中国A股市场的一些特点包括A股市场的交易规则。目前整体管理规模在130亿左右。我们主张把公司打造成科技类公司,成为头部的资产管理机构,所以在整体的研发方向上面,注重科技驱动和创新。然后在团队合作上面,相信更好的管理可以赋能给公司团队更好的协作。

回顾下信弘的发展历史,今年是信弘成立发展的第11个年头,2012年成立,最早期的时候在清华举办了量化大赛,应该也是当时最早在清华举办类似活动的机构之一。2020年之前,主要都是以配置型的策略为主,整体的管理规模接近20亿。在2020年,信弘做了一次重大的股权变更,也是那个时候我成为了信弘的实际控制人和大股东,与现在的合伙人共同开启了信弘的新征程,首发的量化选股系列也取名征程系列。经过了这两年多的发展,目前的技术平台相当于有了三个阶段的打磨和迭代,然后投研团队也扩充了不少,在今年我觉得一切的业绩表现和发展兑现了这三年整个团队的努力,今年也是获得了年度的相对价值金牛奖,以及大几十项的不同的奖项荣誉。

目前我负责公司的全面管理,并且担任CTA的策略研发。过去我的职业经历里面,担任了国内外的金融机构的高管,具备一定的管理经验,同时对高频交易的策略具有较深的研究,还有一些实践经验;张华是信弘现在的投资总监,他曾经是World Quant中国区最早的研发成员,目前他负责公司的股票策略研究合伙人林国锡,他拥有是超过10年的机器学习和深度学习的实践经验,精通主流的深度学习的算法模型,所以他目前整体承担公司的研发总监和算法,负责带领算法团队去探索和研发国际最前沿的一些算法模型;张鹏拥有多年的华尔街和国内的投资经验,是信弘的创始合伙人,但是目前已经不参与公司的具体经营。

这一页展示了整体的团队构成,目前核心成员都毕业于国内外的知名院校。非常关注核心成员的多元化还有差异性,希望团队的小伙伴们来自不同的专业,这样有利于研究工作当中的思维碰撞。这里做了展示,有数学系、物理系、电子信息工程、金融工程,也非常注重团队每个个成员的进取心和在它们自身专业领域的研究深度和造诣。因此整个团队,统计下来引发的顶刊论文应该不计其数了,在高中时期和大学时期或者研究生时期也获得过全国甚至全球的数学竞赛、物理竞赛还有机器学习比赛的一流战绩。从过往的工作履历来看,成员主要来自于不太相关的一些领域,有国外的一些投资公司、银行,有国内券商、互联网公司、科技公司。整体打造团队的初衷和理念,希望大家之间有互补性有差异化,更有利于做策略中降低整个不同策略之间的相关性。

这一页是组织架构图,组织架构非常扁平化,与投研相关的主要就是两个部门,一个是研究中心,一个是信息技术部。研究中心里面分了4个大组,数据组、因子组、算法模型和风控。这里跟很多类似的机构是不太一样,很多机构在做研究的时候,分小组比如A组、B组、C组,那ABC三个组可能承担共同的研发职责,每个个小组里面又拆开来有不同的研究岗位。对于我们来说,是一个大的研究中心,直接按照职能划分。所以直接分了4个职能化大组,大组和大组之间的配合就相当于形成了上下游的关系。这样子彼此之间既有贡献又有讨论,还有碰撞,同时还有相互促进。

信息技术部主要分了两个组,一个做系统开发,另一个做交易支持。系统开发里面,像传统的做高频柜台系统的对接、高频算法的研发,然后同时现在做一些深度学习的一些自主研发的框架设计交易支持,更多是在交易执行方面的算法。

右边这部分,是给员工鼓励的公司价值文化的缩写。还是鼓励大家:

第一,要睿智、要有进取心,要成为一个相对聪明的人;

第二,需要大家以诚信为原则;

第三,希望大家有主人翁意识,更加有内驱力去做研究;

第四,希望大家去做务实一点的研究,以务实为前提。

策略研发

下一部分主要讲策略研发,首先技术一直会不断迭代和变革,包括算法也好,模型也好。但是做研究的基本原则我认为是要持续坚持,而且长期来看变化会很少,所以认为研究理念是特别重要。在研究理念上面,强调4个原则

第一个是思辨,我们非常注重技术,但是同时要去对每个技术和每个算法背后提出质疑,一定要去解析它背后的经济学原理或者算法背后的原理;

第二个是独立,我们要求每个人,包括从公司的管理层到所有的研究人员,每个个岗位都要有独立的思考方式和思想,这样子相互之间才能真正达到创新;

第三个是简约,因为现在模型越来越复杂,前沿算法也越来越复杂。像右边这个图是非常基础的全链接神经网络。只是做了简单的展示,但是看起来都相对来说有点复杂,对于大量的研究人员产出的复杂算法,提的第一个要求是如果能用简单简约的方式去解决问题,不要把问题复杂化,因为量化是非常复杂的庞大的系统工程,所以要求在里面尽量简约。这样子对于效率、可解释性都会提高;

第四个是分散,认为策略也好,思路也好,各方面应该要极度分散,这样子整体呈现出来的业绩跟同行也会呈现低相关性。

下面主要讲具体的研发流程,因为量化对于大部分人来说就像是黑盒。经常有投资者交流的时候会认为是神秘而复杂,一直想要解开却一知半解,本质上我们认为量化是相对标准化和工程化的研究设计程序。讲到程序会觉得复杂,讲到流程大家就会比较理解,所以用这个图来展示日常研究工作的缩影,这也是量化的整个模型产生的过程。里面一共分了6大步骤

第一步,概念设计和模型设计,就是灵感产生和想法产生;

第二步,想法实践,需要哪些数据做支持。前面讲到了研究部门里面分的4个组,第一个组就是数据组,它们会根据想去寻求需要的数据,然后做清洗和标准化。目前量价数据占比将近70%;基本面数据占比25%,另类数据占比5%

第三步,策略设计,有数据想法后,需要用代码去实现它。目前在研发阶段支持各类代码研发,但实盘真正去交易的时候,一般都会编译成C++,提高它的效率。在策略设计阶段,简单模型产生的一些策略可以称之为子策略,也可以称为因子。所以在第一层的时候,这边列了从因子1到因子2,大家如果把它当成小的子策略来理解会更容易。这部分因子目前实盘上线共4000多个

第四步,模型将多因子信号做组合,分为两大类模型,第一类是线性模型,第二类是非线性模型。非线性模型,更多的前面讲到的神经网络模型,目前信弘模型80%聚焦在非线性模型里面,有比较常见的Crmlstm,那也有前段时间比较火的ChatGPT里面的Transformer,20%主要是线性模型,更容易被更多的人接受和理解,因为它就是相当于在每个因子前面乘以了系数,做了权重分布,最终加在一起,所以就是多元方程式。在多模型之下,最终会做一部把模型打包在一起的线性组合,组合完成后再进入生成实盘模型;

第五步,叠加风控。因为知道市场上大家接触的量化策略有指增、量化选股、多空等等。它们在前期的模型里面都是差不多的,但真正产生差异化就是在第五步,叠加了风控之后加了不同的风控约束,就会产生不同的变化;

第六步,算法交易。通过算法交易去执行盘中交易,我们一般会给算法任务,要求它在执行阶段打赢日均价格Twap或者Vwap,目前信弘的算法是自己做的,并且将算法做了知识产权,然后反采到券商做落地,我指的是自主的交易系统。

目前整体IT的系统平台建设主要考虑两点,短期要符合极强极快速的交易需求,长期要支持策略迭代,尤其深度学习迭代的效率。目前整体从IT的布局来看,最重要的一块就是本地部署的核心超算平台,目前还是部署在本地,这样效率和保密性最高。对于研究效率没有高的研究机器,一般是采用托管集团和云端部署,另一部分服务器放在了交易所机房,前面讲到自主交易的算法系统都部署在交易所的托管机房,以保证第一时间接收行情做交易。

这一部分是软件,我们生成的自己的交易系统,所以现在在券商端交易的系统,第一柜台是券商的,然后交易系统都是自己做一些自主研发的交易系统。

后面给大家做一些展示,主要还是看前面讲的各种各样的模型,最终在目前产品里面的一些历史表现情况。首先我认为如果要了解量化的产品和业绩表现,然后做横向的对比,或者做一些剖析和归因,前提很重要的一点是大家先要对A股市场本身的全貌和特点做了解,只有知道了这些规律之后做归因和对比的时候,大家就会在同维度去思考这个事情。这里简单做了展示,首先数据是从2010年开始到2023年的6月30号,里面柱状图的高矮代表了它们在当年的年化收益率,左下角代表的是2010~2023年整体的统计平均值,把A股市场所有的股票分成了10个大组,市值最大的组第十组叫D10,市值最小的是D1,沪深300在最前面,微盘指数基本上在最后D1。

先看下面全年的统计的情况,随着市值的增加,它在过去多年以来的整体收益率是有一单调递减的规律,所以符合大家的主观印象,就小票有时候涨得快,大票相对来说成长性差一点,这是整体的这10多年的年化统计。

分开来看每一年的情况,2010-2012年也是基本上都是呈现牛市、熊市和震荡市,大部分呈现的都是跟过去的统计规律是一样的,市值变大了,收益相对来说变小,市值小的收益高。但是在2017年实现了风格反转,300涨得特别好,是漂亮50的情况。但是到2018年开始又变了,大家都跌得时候,又是小市值的跌得少一点,但是大市值相对跌得也少,中间这部分股票跌得最多。2019年也是微笑曲线,2020年也有点像微笑曲线,但是2021年到今年都是下行的单调趋势。主要想要表达一个观点:这是市场资金面和A股市场上市公司整体之间客观的数据情况,然后对于量化从业者来说,每天的任务就是在是不同的组里面把它里面最好的股票(战胜平均收益的股票)把它挑选出来,每个部分的相对表现好的股票都挑出来,之后开始产品化。如果把它们都打包在一起,这10个组的股票相对均匀分散的去做,就是称之为量化选股,就是全A的选股系列。

如果做300指增,就会着重在这部分风格,然后同时也选一部分其它部分的股票加到这里面来,但是风格又要跟它相对比较接近,于是就有了300指增、500指增、1000指增甚至小市值指增,包括国证2000。反正在这10个组里面不断按市值规律去做切换。所以了解整个不同的市值组的收益分布的时候,对大家去选产品有很大的好处,你会在不同的年份里面,如何判断指数,如何做产品的选择。但是这部分高收益的票有最大的限制或者瓶颈,它整体的市值占A股市场相对来说比较小,而这部分收益率虽然不高的股票,但是它占得市值占比特别高,所以会发现当私募基金的规模真的是特别大的时候,必然在交易圈的股票数量就会和市值就会变多,自然它的收益率就相对它规模小的时候会有一定的下滑,也就是为什么发现规模大了之后业绩容易往下走,但这不是恒定的关系。因为刚才提到的是在同一个管理人,规模大和规模小的情况下,而且它有阈值,一般来说在200~300亿左右的时候,整体的A股市场的流动性还是完全支撑大家去做一些自由交易。

简单再讲一点,微盘的风险在哪里。微盘股今年涨了50%,主要担心的一点就是会不会之前微盘的收益高,然后突然间变到像2017年大市值最好,微盘最差。会不会有这样子的风格切换?风格切换本身蕴含很多方面的信息,分析到A股的时候,是多维度去分析它,但是仅仅从指数上涨到下跌的过程来说,并不是2023年呈现了微盘或者中小市值股票的成长性特别高,而是从长期的规律来看,大部分的时间也是这样的规律,只是说在真正具体去交易的时候,如何一边去吃到这部分的收益,另外要防范流动性出来的风险,这是各家管理人都要去努力去做的。但同时又可以减少产品波动,又可以创造更高的超额收益。

分享万得全A等权指数,算法就是把刚才横坐标上面的10组股票做了算术平均数,也就是代表A股市场的平均收益。可以看到从2018年开始到2023年,整个全A等权指数的收益是正的,有20%,但是三大宽基指数都是负的。这么一个指数对比,也就反映了前面讲的分组里面不同股票的业绩表现,如果不讲前面这个图直接对比,大家可能会觉得很奇怪,也就是今年大家去比较平均得买入不同的股票,表现比三大指数都要好。同时反映了另外一个问题,就是如果去做一些排除法,再去等权买入一些相对来说排除过的股票的池子,收益就会更高,这就是如何再通过量化截面选股选出来一部分,比指数跑得更好的一些股票。

这里面还有可以简单分享一下,等权概念到底是怎么样的。比如正常去看大市值的股票和小市值的股票,它们之间会把市值的因素考虑进去,但等权的时候大家就不会去考虑这个,而且等于说任何股票都买一块钱,而不会大的股票我买10块钱,小的股票买1块钱,不存在这个情况,所有的都是等权本金去下单。

产品业绩

信弘产品线主要分了两大类,一类是股票的,一类是非股票。今天着重介绍的是股票类策略,目前130亿的管理规模,主要占比放在量化选股里面,前面我指的针对全A市场,所有的股票都叠加在里面。另一个产品线是分指数段的300 500 1000的指增。还有围绕多头和空头做了量化对冲产品线。

这里简单概括下,量化选股和指增的差别长期来看量化选股,它可以回避风格集中的影响,因为只要去做指增势必是受到指数的影响,如果判断指数会上涨得特别好,比如认为某指数会上涨得特别强势,那对于投资者来说,投这一类的指增是好上加好,但是长期来看,前面也看过整个A股市场的风格收益,所以长期来看量化选股更容易为大家去捕获不同指数段的收益,也就是投了量化选股之后,在今年风格切换的时候,理论上还不错。反过来,从整个建仓情况来看,从选股自由度来说,指增肯定是要受到指数风格约束,你不一定全部都买成份股,但是买的任何股票都会做风格约束,至少跟成份股的相关性很高。

第二部分是赛道拥挤度,量化选股相对来说比较宽松,就是整个策略研究出来,你认为哪个股票好就直接做,但是对于指增来说,因为现在指增产品线是量化的主赛道,所以赛道里面相对竞争比较激烈,也看到超额衰减也有一定的趋势。

然后这边是量化选股的交易要素,有几个关键词:一个是通过高频算法,在预测整个的市场整体的持仓相对来说并没有特别多,但也不少,一般现在是800只左右,然后整个个股的上限是在5‰,虽然持有股票是800多只,并没有持有2000-3000只股票,但是我在个股上面的上限非常低,这样完全可以防范一些极端行为比如某个股票交易的很好的,突然间黑名单被异常交易监控了,或者进入了ST,对于我们来说,哪怕出现这种极端情况,它在整个持仓里面只占了5‰,大盘有时候一天都波动1%,所以占比风险影响很小。

另外目前换手率在50倍到80倍,这是今天分享时间点的信息。然后会根据信号强弱,还有整个市场的成交额的变化而变化,目前整个预测的频段,是日内到月度的综合性频段,这样子有利于业绩和超额的稳定性。

简单过下整个业绩,发行的产品有点生不逢时,在21年的9月开始交易。那时候整个A股市场呈现的就是下跌趋势,可以看到整个多头产品也是跟着A股市场正常波动。只是长期交易下来,可以看到右边的数据,区间内三大指数都是呈现负收益,从-24%到-28%,但是在同区间里面,我们的策略是+27%收益。

很多人担心曲线波动挺大的,会不会因为收益更高产生了更高的波动率。从最大回撤指标来看,三大指数回到最大回撤超过28%,300超过了30%,对于我们的产品来说,最大回撤只有17%,所以从整体来看,希望长期能够实现的方式是在指数下跌的时候,能够通过超额扛住贝塔下跌,在上涨时能够捕获这部分贝塔的同时,有叠加阿尔法的效应。

这部分展示的是业绩一致性,我们看到不同时间点信弘发行的基金产品,它们的整体波动情况非常一致,从每个周的业绩披露,投资者收到的估值情况也都是高度一致。这个是目前还认为相对比较自豪的一点。

这部分是指增策略的要素展示,跟前面量化选股的展示都比较接近,我就不逐个列举了。首先分了三个大类和300 500 1000,先讲300指增,黄色的这条线是它的超额曲线,看超额曲线非常希望客户去关注动态回撤,就是超额的最大回撤,300的超额的来源更多的是来自于300的成份股,300的指数它本身从各个机构来说,不管公募还是私募,300超额是最难获取的,所以也可以认为300的超额的质量要求非常高,所以一般关注300的超额收益来看,大家都会聚焦在8%到15%之内,15%算特别小众的高,但是在这个区间范围之内,大家的超额收益差别不会那么大,更多的去关注超额的回撤和波动。因为它的超额回撤,相对来说如果超额回撤变成2%,超额收益可能就会提高很多。但是这时候回想一下,最前面讲到的A股市场的分组的业绩表现,如果超额高得很高,很有可能你是买了很多300以外的很多股票的超额,并没有特别兼顾300的风格,这时候当300指数真的出现在2017年,300的收益应该最高的,其它股票的收益都相对来说比较低,出现那种情况的时候,你为了获取相对高的超额,暴露了更多的风格的时候,这时候你的超额回撤会远远超过2%,你的贝塔可能甚至是会腰斩,可能获不得获得不了贝塔收益,所以说大家如果去关注300指增的时候,不要因为300的超额有几个点的差异而去选择这个产品,而更多的去关注在300超额之下的波动是怎么样的?总结一下,关注跟踪误差和信息比率,这是海外投资机构看的最多的。因为在超额收益相差不大的情况下,信息比率完全反映了超额的质量,一般超过3说明超额的Pure α含金量就很高。

这部分是500指增,相对来说500指增因为大家的整体回撤基本都差不多都是在3%左右,所以在同样回撤的情况下,让大家更多的去关注它的超额收益的获取。目前根据一些业绩展示,500指增的超额应该也是属于业内第一梯队,年化达到了20%以上,今年500超额截止到上周也差不多到20%。

中证1000也是一样,是最近这两年因为小市值比较好,所以更多的投资者关注了中证1000,公募也发现了很多中证1000ETF,包括股指期货的IM也上市了。中证1000相对来说它的超额获取从往年长期的统计规律来看,它比500和300要更容易获取一些。所以在特别高的收益之下,它的波动虽然是比300要高一点,但是整体的信息比率的指标还是很不错的。然后整体的超额年化,今年和去年也都是取得了比较靠前的业绩,

这部分是量化对冲的要素,在之前多头的基础之上叠加了空头端做了多空对冲的策略表现。这里记住一点,多头用的是量化选股,空头会用ETF一篮子券,还有股指期货做对冲。这里展示代表产品明珠一号,因为多头端是量化选股,所以空头端会去选择更加匹配多头端的融券也好,ETF也好,或者股指期货指数去做对冲。在最开始的时候,中证1000股指期货还没有上市,对冲指数选的是500,然后在后阶段,随着模型迭代以及1000 ETF的券池的增加和股指期货1000 IM的成熟,也关注基差很长一段时间了。最终从今年3月开始,转成了对冲1000的股指期货,可以看得到如果从单纯从基差角度来看,IM的基差还比IC的基差要更高一点。信弘为什么想着去用1000去做对冲,因为多头端用的是量化选股,我们认为两者在风格的匹配度和历史业绩的最大回撤来看,匹配1000更好,业绩稳定性会更高。所以做量化对冲产品线主要想要给大家带来绝对收益,并不是说希望收益就有特别高,第一前提不要暴露市值敞口,不要暴露过大波动,更多给大家带来长期稳定的业绩表现。今年整个量化对冲的业绩截止到上截止到上周,也已经超过12%。

跟大家简单去分享一下,比如如何做量化下面的风险控制。一般的风险控制,都是认为有事前、事中事后,然后包括事后的再一步的完善,一般都是分这4大步骤。其中最重要的一点,就是前面在盘中的时候,既然盘中都在码代码都在做研究,那盘中谁来看行情的情况,主要是人工和机器同步去监控。人工更多的去监控两个指标,第一个就是机器是否运行正常,然后是不是每个策略要素的交易特征指标是不是都是符合预测。第二个去监测不同的产品,今天的交易盘中的交易执行情况是不是一致,也就前面讲到如何做到策略的一致性。首先预测模型要一样,其次在盘中加人为去监控然后会按周度,每个周末的时候,也都是一直在加班,周末的时候会把所有的数据重新拿出来。因为有历史的模型,会在实盘交易的数据交易的结果和用通过历史数据,因为这一周已经成为历史了,再用理论化的数据做模型的解析,然后最终两者做对比来对比模型实盘的效果和在监测环境下面的效果之间的差异,来提高在目前的实践。这边简单讲了一下,线路是否连通,然后GPU的状态、算力、多核运行是不是正常,所有的券商是不是都连接正常。做这些监控。

总结信弘优势

从合伙人和核心层面来说,我们是非常早期,应该最早从08年开始就对A股市场做了一些量化的建模和研究,所以这三年很多人觉得信弘成为市场黑马,但我们经常自嘲是市场老马,今年的业绩更多的是多年积累兑现。

团队在多元多学科融合上面,在交叉的思维碰撞和促进上面做得非常好,所以我们认为合伙人到投研团队彼此,相互之间对彼此的依赖度和需求是很高的,在一起的合作关系是相互吸引,而不是大家特长都差不多,相互之间是互斥的过程。在相互吸引的过程当中,更容易团队合作,把业绩做成团队的天花板,然后也让团队的粘性更高,更加稳定。

Ⅲ 结合了最早传统的经典量化多因子的模型的基础之上,在2020年开始布局量化的时候定位未来是围绕着AI或者围绕着深度学习神经网络为主的研发方向。所以这三年一直在迭代和构建和完善算力平台和超算框架,所以在此基础之上,可能在明年会有更多的好的模型可以产出,更高效得在未来更加白热化的竞争过程当中,迭代的效果应该会有一定好的基础做支撑。

对于投资者来说,在去做基金配置的时候,肯定是希望找到低相关性的基金,目前大部分的私募基金产品相关性还是很高。所以认为在大家在配置的时候首先选择多样的,但是既然已经做到了鸡蛋放在了不同的篮子里面,还要保证篮子最好是在不同的卡车上面,这样子才真正做到风险分散。大家可以关注信弘跟同行间的业绩相关性特别低,这样有利于配置时降低整体资产的波动。

Q&A

Q1:因子是人工挖掘的吗?有用到AI挖掘吗?

答:在因子层面,目前都是人工挖掘,但是有用到AI模型去挖掘数据信息。

Q2:非线性模型有过拟合的问题吗?

答:过拟合永远是做量化的人会碰到和要去做约束的事情,我认为过拟合最简单的处理方式是永远留样本外的东西去做测试,然后再利用实盘更长的时间去做印证,这样子是最有效的防止过拟合的方法。至于增加惩罚函数,然后增加一些其它的,比如提早结束的训练模型,这些方式都是一些技术性问题。在做这些技术手段的时候,你做着不知不觉就用到了未来信息。最保险的方式还是样本外测试。

Q3:对于时序模型和截面模型的应用情况如何?

答:我觉得现在做的比较深的研究机构应该都是会在这两个模型上下功夫,以前最初的方式截面更多,目前时序结合的比重就上来了,两者整体的应用效果来看,我们认为当你的预测目标不一样,当你的交易任务不一样的时候,这两类大类的模型会呈现出来不一样的效果

Q4:信号预测主要集中在多长的时间区间之内?

答:现在我相信管理规模在百亿以上的量化私募大家的信号预测不会过分集中在某频段。一般会从日内到隔日到3个工作日,5个工作日,然后甚至到月度以上,所有都会去覆盖

Q5:量化选股的持仓中股票市值中位数有多少?

答:因为量化选股相对来说它会随着市场风格的变化,持仓的分布会略有变化,如果长期去看,持仓中位数应该跟中证1000指数的持仓中位数会比较接近。

Q6:线性模型如何解决多重共线性的问题?

答: ①线性模型在里面加的约束相对来说会比非线性模型的参数更少,约束也会更少一点。有可能或者经常会出现,前一段时间表现好的模型,在后一段时间赋予更多的权重,于是产生了您提到的共线性问题。但是这部分的共线性是会在多少时间或者多少概率里面产生正向效应,这个需要去评估,并不是说贡献性出现肯定就非常不好,有可能是给你带来好处

跟底层模型有很大的关系,底层模型本身的相关性比较低,它在组合的时候产生共线性的问题就会更少,所以要解决共线性的问题,第一部分就是你为了素材input的那些东西,你要做提前分类。所以我在前面讲的时候会一直不仅讲策略要有多元化,策略背后的人也要多元化,然后第二个要解决在你input之后,你output的过程,你在里面加的一些约束,甚至是有一些是经验法则,你在经验里面去需要加入一些不同的参数去做一些平衡。主要是这么去完善。

全部讨论

01-03 09:01

1