计算机行业专题研究:加大重视金融AI

发布于: 雪球转发:0回复:0喜欢:0

23063439

一、AI+金融的四个层次:传统机器学习、通用大模型+微调、 垂类大模型预训练、智能投研

四阶段:传统机器学习、大模型+finetune、大模型预训练、智能投研。智能投研是利 用计算机技术和人工智能算法,对金融市场进行分析和预测的一种新型研究方法。传统 的投研方法主要依靠人工分析和预测,具有时间成本高、人力物力投入大、信息不对称 等问题。随着技术进步,传统投研也逐步与机器学习、大模型微调、大模型预训练结合, 向智能投研方向迈进。

传统机器学习问答:2021 年以前,传统机器学习逐步运用于在金融科技领域,包括 自动化呼叫中心功能、安全领域、优化面向客户的聊天机器人的文书工作,以及改 进员工培训。

大模型+finetune:随着 Openai 的技术进展,各大模型厂商针对性开始布局基础 大模型,所有大模型的训练都分为两步:首先通过预训练形成基础模型,然后针对 特定领域做微调。原则上来说只要金融领域细分领域数据,通用大模型就可以针对 垂直领域做优化,赋能金融领域

大模型预训练:尽管大模型在通用行业中应用良好,但针对特定领域的大模型仍有 其存在意义和不可替代性。为应对金融专业名词解读、市场情绪理解等复杂问题, 同样具备少样本学习、文本生成、对话能力的金融领域专用 LLM 应运而生,以完成 情感分析、命名实体识别、新闻分类以及问答等金融 NLP 问题。2023 年 3 月 30 日, BloombergGPT 正式官宣,一方面构建具备 3630 亿个标签、迄今为止最大的特定 领域训练数据集,另一方面训练 BLOOM 风格、拥有 500 亿参数的金融领域的大型 语言模型(LLM)。

智能投研:未来随着 AI 技术的进步,具备细分领域高质量数据的公司,在大模型 应用上具备先发优势,将拉动投研业务进一步向着智能投研的方向发展。未来智能 投研将不断完善数据和算法模型、加强对人工智能算法的监管和规范,这将为金融 行业带来新的商业模式和发展机遇。同时,智能投研也将推动金融行业的数字化转 型和创新,为行业带来更加广阔的发展前景。

二、垂类领域效果:大模型+预训练>大模型+微调

行业预训练大模型:比微调通用性更优。除了基础大模型,许多大模型厂商都致力于推 出各类行业大模型。百度文心大模型与各行业企业联手,在通用大模型的基础上打造能 源、金融、航天、制造、传媒等具体行业大模型。华为将大模型体系分为了基础大模型 L0、行业大模型 L1、细分场景模型 L2 三层。科大讯飞也提出“1+N”战略,“1”是通 用大模型算法研发及高效训练底座平台,“N”是教育、医疗、人机交互、办公等行业大 模型。实际应用并不一定需要大模型具有非常全面的能力,而更需要对行业知识的理解 和对行业需求的适配,在具体行业上,行业大模型的泛化等能力往往要优于基础大模型 +微调。

大模型+预训练:预训练是指在大规模无标注数据上进行的模型训练,使得模型能够学 习到语言的普遍特征和语义知识。预训练模型可以通过遮蔽任务、下一句预测任务等方 式进行,例如 BERT、GPT 等模型。预训练的优势在于能够从大规模数据中学习语言的 上下文信息,提高模型的语义理解和生成能力。垂类领域预训练使用特定领域的数据集 进行模型训练,使得模型能够更好地理解和处理该领域的文本。垂类领域预训练模型可 以学习到特定领域的术语、上下文信息和任务模式,提高对该领域的语义理解和生成能 力。

大模型+微调:在用场景数据深度微调模型时,需要丰富的行业经验 Knowhow 进行评 价和指导。在通过场景数据对大模型进行微调后,前期得到的模型输出可能还并不够完 美,此时就需要有行业经验的专家对模型的输出进行评价,给出修改意见,再重新结合 场景数据进行深度微调。比如对工业场景进行改造,可能涉及到模型具体需要和工厂内 的哪些设备进行交互,还要考虑具体的作业流程。

(受篇幅限制,仅为部分浏览)

*免责声明:以上报告均为通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权,请联系删除;本号报告为推荐阅读,仅供参考学习,不构成投资建议。