量化交易里能否用到机器学习、深度学习?

发布于: 雪球转发:4回复:51喜欢:24

个人是做量化投资的,之前是做中低频的量化,近两年转到了做高频,也就是日内的T0。

天外有天,人外有人,以下的观点是从个人的研发路径得到的结论,有问题欢迎讨论。

首先,来聊一聊机器学习在中低频量化的应用。因为最开始是学的Barra那一套,线性模型。所以自然的想法,用机器学习去给股票打分,因子当然还是那一套,只不过省去了因子大类合成这些步骤,毕竟如果合成一下,不到10个因子,好像也不太用机器学习了。

最后的结果,还是挺让人失望的,尝试了很多机器学习模型,最后失败了,结论是所有的机器模型都跑不过传统的线性模型。

中间其实尝试过很多的方法,更换标签、回归问题变成分类问题、更多数据集、模型集成等等, 无一例外,跑赢不了最简单的线性模型。

事后来看,个人认为2个原因,在中低频信噪比太低了,另外就是数据还是太少。比如放入周度的数据,一年大概40~50个时间点,一年3000个股票算(早期的股票数量少,大约估计这个数字),10年也就120万个点。这个数字对于机器学习太少了,更不要说深度学习了。

后来转到日内的T0,机器学习还是展现了比较大的优势。毕竟,日内的因子上百个,谁也不会想着用线性模型去做。另外深度学习也比机器学习有更多的优势。这一块内容,我就不太方便细讲了。

个人认为这一段机器学习能够强于线性模型,一个是信噪比高一点,毕竟很多人工交易员能够在这个尺度上做的非常的优秀,确定性强一点。另外就是数据量的大幅度增加,一个股票的tick数据,全天4800个点,1天3000只股票,1天的数据量是1440万。如果是10天,这个数据量就上亿了。

这么多数据喂给机器学习还是能学点东西出来的,毕竟很多机会,人肉眼都能发现。机器学习再学不出来,就是人工智障了。

最后,聊一聊机器学习。我一直认为,机器学习能够把一件事情做好的前提是,人能够把这件事情也做的比较好。如果人都做不好这件事情,指望机器做好是不可能的。

比如,在中低频尺度上,没有哪一个主观的研究员、基金经理,做到高胜率、低回撤,Barra那一套更多是从风险控制上去考虑的。人都做的颤颤巍巍的,机器在有限的外部信息下,能做的非常少。

再比如,现在大规模用机器学习、深度学习的互联网行业,很多是用来做推荐、反欺诈等等。这个的前提是人能做的不错,当然我说的是针对单个样本。比如一个工程师,看了看这个用户历史的购物记录、浏览页面、消费习惯、资金流水、亲朋好友的购物记录等等,他个人是可以给这个用户一个比较好的推荐广告的。

之所以用机器学习、深度学习,是因为,工程师数量太少了,用户数量是非常庞大的。不可能每个用户,配置一个工程师。所以才会用这些算法,给用户做推荐,做到千人千面。假设我们的工程师、客服数量是无限的,那做出来的推荐,绝对比机器给的结果要好很多。

另外,机器学习用到的特征,也都是人工给标记和提炼的(有听到过,用机器学习深度学习挖因子,但这个我还没用过)。以个人做量化的经验来看,好的因子反而是更加重要的。有效因子增加带来的改变,大于模型的性能提高。

欢迎球友针对量化、机器学习、深度学习来一起探讨~

精彩讨论

全部讨论

quant-computer2023-01-11 16:53

17年毕业量化至18年,然后离职考虑转机器学习以后再回量化,阴差阳错转成深度学习(图像)至今,看以后能不能用上吧

angl17992022-11-29 15:27

量化如果躺赢了,那么其他的就甘当韭菜盒子吗。看现在正在运行的量化产品,显然并不是这样。

基股传声2022-11-29 09:50

嗯 深度学习这玩意 很吃数据

基股传声2022-11-29 09:50

感谢南哥过来资瓷~

基股传声2022-11-29 09:50

感谢老铁过来资瓷~

林丶_2022-11-29 09:45

不必追求太高频。玩日k级别的一样。

基股传声2022-11-29 09:39

链接我看了 嗯 量化高频远远比你想的复杂,因子基础数量就100个了