大模型对炒股赚钱有帮助吗?

发布于: 雪球转发:0回复:2喜欢:5

之前写过国产大模型 Kimi,上周又写了 AI 作曲的 Suno,所以就有朋友问了一个与 EarlETF 更紧密的问题:大模型对投资(炒股、买基金)有帮助吗

我只是个大模型的用户,不敢说有什么研究,本来是没什么资格来回答这个问题,不过因为去年和不少量化公募的投资经理聊过,所以就来分享一下我自己的想法。

首先要说明,这里说的大模型,是指 LLM(Large Language Model),大语言模型。这是人工智能技术中的一个细分门类,两者不可混用。

其次,“帮助”到底怎么界定?

我觉得要分为两种不同的“帮助”。

信息增量的重要性

第一种,是效率的提升。比如原来分析师阅读研报,可能要半小时才能阅读一份。利用大模型加持整理提要,可能 10 分钟就能阅读完一份,大大提升投研效率;又比如用人工语言来向 Wind 等数据终端发出提取数据指令,更迅速。但这种只是效率的提升,不带来信息的增量,属于外围的。

第二种,是信息增量,能够通过大模型获得原来无法获得的信息,并将这些信息作为投资决策的依据。“信息增量”,是投资超额收益的重要来源。美国对冲基金蹲在工厂门口数卡车数量,甚至进化到用卫星数物流等,都是为了获得信息增量,以前对财务数据进行预测,就是一种重要的信息增量。

当我们讨论大模型对投资帮助时,关注的应该是第二个,即“信息增量”层面的。

在界定完上述两个前提后,就能展开讨论了。

LLM 大模型为何自 ChatGPT 出现后震惊世界?关键在于人工智能拥有了强大的文本解读和创造能力。类似于看个文档写个提要,写个小红书笔记、写个短视频脚本这种,在以前是难以想象的。

信息,结构化与非结构化

我们在投资中,信息可以分为两种。

第一种是结构化的,比如日交易数据,开盘、收盘、最高、最低四个价格搭配成交额,就是一个结构化数据;财务报告三张表中的归母净利润、净资产等,也是结构化数据。

这些结构化的数据,是现代投资理论的基石,从 DDM 股息折现模型,到三因子模型,大量的学术研究,都基于此

利用人工智能赋能结构化数据研究,其实量化基金已经大规模使用有年头了。比如基本面因子,利用神经网络来因子合成;比如通过灌入高频的量价数据,来对短期股价预测,效果还是很不错的,目前公募的量化基金中,不用人工智能的恐怕才是少数。

第二种,是非结构化的,以各类文本等形式存在。比如社交网络上股民、基民发言背后的市场情绪,比如基金经理小作文,比如上市公司高管在财报中的经营分析展望,比如各种上市公司的新闻稿件和市场评论。

这类,或许大模型有用武之地。

大模型怎么用?

大模型+

一种是“+大模型”的思路。比如社交网络投资者情绪跟踪,这是过去好多年流行的一个研究领域。只不过早年人工智能自然语言处理(NLP)领域的模型都简陋,也就是粗浅的情绪乐观悲观之类判定。但有了大模型之后,原本的研究可以做的更精致一些。

但这个思路能有多少增量,还不好说。一位量化基金经理再和我聊起的时候,表达过“疑问”。在他看来,追踪股民基民社交网络上买什么股票的发言,然后跟着买,本质上是一种动量投资的思路。而在动量投资的领域,股票的量价信息不但是及时性而且还有高频数据加持,数据质量恐怕比社交网络更好。社交网络炒股即使能做出超额,但在控制动量因子后是不是还有超额,就存疑了。

当然在“+大模型”的思路下,还有一种是用大模型做控制变量优化已有因子。

比如《Integrating Stock Features and Global Information via Large Language Models for Enhanced Stock Return Prediction》(网页链接)就是如此,下面是kimi对这篇论文的提要,仅供参考:

这篇文档介绍了一种新颖的方法,利用大型语言模型(LLMs)来帮助预测股票回报,从而为投资者提供更好的金融决策支持。下面我将用简单的语言来解释这个过程以及它的收益效果。

金融决策的过程:

理解市场信息:股票市场中有大量的金融新闻和数据,对于普通投资者来说,从这些信息中提取有价值的洞见是非常困难的。大型语言模型,比如BERT和GPT,已经在处理自然语言方面取得了巨大成功。这些模型可以理解文本内容,并从中提取重要信息。

结合股票特征和全球信息:研究人员提出了一个框架,将大型语言模型分析金融新闻的能力与传统的股票特征(比如价格和交易量)结合起来。这个框架包含两个部分:

局部-全局模型(Local-Global Model):这个模型将股票回报分解为两个部分。一部分是股票特有的信息,另一部分是影响股票回报的全局信息,比如市场动态、宏观经济政策和行业趋势。

自相关强化学习(Self-Correlated Reinforcement Learning, SCRL):这个学习方法旨在将从金融新闻中提取的信息与股票特征在同一个语义空间内对齐。这样,模型就能更全面地理解影响股票表现的各种因素。

模型训练和优化:通过监督学习和强化学习的方法,模型被训练来预测股票回报。这个过程包括使用历史数据来训练模型,然后用新的数据不断优化模型的预测能力。

实现的收益效果:

通过这种方法,研究人员在中国A股市场进行了实验。实验结果表明,与仅依赖股票特征的模型相比,这种结合了大型语言模型的新方法在预测股票回报方面表现更优越。具体来说,这种方法在以下几个方面取得了显著的改进:

排名信息系数(Rank Information Coefficient, Rank IC):这是一个衡量模型预测能力的指标,新方法得到的Rank IC值更高,意味着预测更准确。

回报率:新方法在股票市场的回报率上也有所提高,尤其是在预测长期趋势时。

总的来说,这篇文档提出了一种结合了大型语言模型和传统金融分析方法的新框架,这个框架能够有效地帮助投资者做出更好的投资决策,并在实际应用中取得了积极的效果。

原生大模型投资

另一种,是“原生大模型”思路,不是对传统投资范式的大模型加强,而是直接用大模型开发出不同的投资思路。

比如之前有篇论文《FinMem: A Performance-Enhanced LLM Trading Agent with Layered Memory and Character Design》(网页链接)就是做这样的尝试,直接模拟主观投资者看新闻后的决策过程。

下面是我用 Kimi 对这篇论文整理的一个提要,仅供参考:

这篇文档介绍了一个名为FINMEM的新型自动化金融决策框架,它利用大型语言模型(LLM)来帮助做出更好的投资决策。下面我将用通俗易懂的语言来解释这个框架是如何工作的,以及它在实际应用中的表现。

金融决策的过程:

个性化配置(Profiling):FINMEM首先会根据特定的金融任务来定制化自己的特性。这就像是给金融决策者设置一个专业背景,比如了解某个特定行业或者关注某只股票的历史表现。

分层记忆(Memory):这个框架有一个独特的记忆模块,它可以处理不同类型的金融信息,并根据信息的时效性进行分类。比如,一些即时的市场新闻可能会对股票价格产生短期影响,而公司的年度报告则可能对长期投资决策更有帮助。FINMEM能够记住这些信息,并在需要时快速调用。

决策制定(Decision-making):基于从记忆模块中提取的信息,FINMEM会做出投资决策,比如买入、卖出或持有某只股票。这个过程就像是金融分析师在综合了所有重要信息后给出的建议。

实现的收益效果:

超越传统策略:在与一些常见的交易策略(如买入并持有策略)相比较时,FINMEM展现出了更出色的交易表现。这体现在它的累计回报率和夏普比率上,这两个指标分别衡量了投资回报和风险调整后的回报。

适应性强:FINMEM能够根据不同的市场条件调整自己的风险偏好。例如,在市场表现不佳时,它可能会变得更加保守,而在市场表现良好时,则可能更加积极寻求收益。

训练效率高:与其他需要长时间数据训练的模型相比,FINMEM可以使用相对较短时间段的数据来进行训练,并且仍然能够取得良好的交易效果。这对于新兴公司或者那些历史数据较少的股票尤其有用。

处理大量信息:FINMEM的设计使其能够有效地处理和整合大量的文本和数值数据,这在金融市场中是非常宝贵的,因为投资者需要从海量信息中提取有价值的信号。

总的来说,FINMEM通过模仿人类的认知结构和金融专家的决策过程,利用大型语言模型的强大能力,为金融决策提供了一个高效、灵活且富有成效的解决方案。在实际应用中,它已经显示出能够带来显著的投资回报,并且能够快速适应不断变化的市场环境。

其实我对原生大模型做投资,尤其是取代主动基金经理的某些工作,还是挺期待的。

就像寻找巴菲特所言的“有护城河”的企业,是主动基金经理的一个重要工作,这个工作是单单依靠毛利率、ROE 等定量指标不足以筛选的。要判断企业的“护城河”,需要对企业的业务模式、产品、竞争格局等有一个综合的判断,这个过程,其实说不定大模型是可以完成的。

如果有定制的金融大模型,包含了 A股那么多年几十万研究报告和各类深度书籍,外加巴菲特对于企业“护城河”的理解,说不定训练完后,还真能通过阅读一个企业的财报加新闻等资料,有一个 AI 的判断,如果能做到这点,那就有趣多了。

当然,这类应用,要等待学术界的开拓了。

不过,LLM 这个领域,本身发展太快,GPT 的一代代升级,固然带来了各种可能性,但模型黑箱的各种不可测,比如幻觉、比如偷懒等又给研究带来了各种不稳定性,所以 LLM 这东西,我估计短期类似顶尖的对冲基金会应用,但要真正进入投资实盘,尤其是公募基金的实盘,可能还是一个漫长的过程。

在近期这种环境下,对于金融投资者,利用 LLM 大模型赚钱的最佳实践,或许还是买英伟达的股票(玩笑)!

全部讨论

04-08 17:47

简单点,图片分类模型就比较适合用来识别股票价格形态

04-08 09:31

感觉现在大模型的强项是对文本的语义理解能力和文本创作能力,真正的推理能力还没有全方位达到普通人类的水平。用大模型来模拟主观多头的交易行为想像中的效果应该更像是文本归纳+Cosplay,不知道论文里面有没有对回测数据做因子拆分,真的能有α吗?