计算机行业专题研究：加大重视金融AI 23063439一、AI+金融的四个层次：传统机器学习、通用大模型+微调、垂类大模型预训练、智能投研四阶段：传统机器...

23063439

一、AI+金融的四个层次：传统机器学习、通用大模型+微调、垂类大模型预训练、智能投研

四阶段：传统机器学习、大模型+finetune、大模型预训练、智能投研。智能投研是利用计算机技术和人工智能算法，对金融市场进行分析和预测的一种新型研究方法。传统的投研方法主要依靠人工分析和预测，具有时间成本高、人力物力投入大、信息不对称等问题。随着技术进步，传统投研也逐步与机器学习、大模型微调、大模型预训练结合，向智能投研方向迈进。

传统机器学习问答：2021 年以前，传统机器学习逐步运用于在金融科技领域，包括自动化呼叫中心功能、安全领域、优化面向客户的聊天机器人的文书工作，以及改进员工培训。

大模型+finetune：随着 Openai 的技术进展，各大模型厂商针对性开始布局基础大模型，所有大模型的训练都分为两步：首先通过预训练形成基础模型，然后针对特定领域做微调。原则上来说只要金融领域细分领域数据，通用大模型就可以针对垂直领域做优化，赋能金融领域

大模型预训练：尽管大模型在通用行业中应用良好，但针对特定领域的大模型仍有其存在意义和不可替代性。为应对金融专业名词解读、市场情绪理解等复杂问题，同样具备少样本学习、文本生成、对话能力的金融领域专用 LLM 应运而生，以完成情感分析、命名实体识别、新闻分类以及问答等金融 NLP 问题。2023 年 3 月 30 日， BloombergGPT 正式官宣，一方面构建具备 3630 亿个标签、迄今为止最大的特定领域训练数据集，另一方面训练 BLOOM 风格、拥有 500 亿参数的金融领域的大型语言模型（LLM）。

智能投研：未来随着 AI 技术的进步，具备细分领域高质量数据的公司，在大模型应用上具备先发优势，将拉动投研业务进一步向着智能投研的方向发展。未来智能投研将不断完善数据和算法模型、加强对人工智能算法的监管和规范，这将为金融行业带来新的商业模式和发展机遇。同时，智能投研也将推动金融行业的数字化转型和创新，为行业带来更加广阔的发展前景。

二、垂类领域效果：大模型+预训练＞大模型+微调

行业预训练大模型：比微调通用性更优。除了基础大模型，许多大模型厂商都致力于推出各类行业大模型。百度文心大模型与各行业企业联手，在通用大模型的基础上打造能源、金融、航天、制造、传媒等具体行业大模型。华为将大模型体系分为了基础大模型 L0、行业大模型 L1、细分场景模型 L2 三层。科大讯飞也提出“1+N”战略，“1”是通用大模型算法研发及高效训练底座平台，“N”是教育、医疗、人机交互、办公等行业大模型。实际应用并不一定需要大模型具有非常全面的能力，而更需要对行业知识的理解和对行业需求的适配，在具体行业上，行业大模型的泛化等能力往往要优于基础大模型 +微调。

大模型+预训练：预训练是指在大规模无标注数据上进行的模型训练，使得模型能够学习到语言的普遍特征和语义知识。预训练模型可以通过遮蔽任务、下一句预测任务等方式进行，例如 BERT、GPT 等模型。预训练的优势在于能够从大规模数据中学习语言的上下文信息，提高模型的语义理解和生成能力。垂类领域预训练使用特定领域的数据集进行模型训练，使得模型能够更好地理解和处理该领域的文本。垂类领域预训练模型可以学习到特定领域的术语、上下文信息和任务模式，提高对该领域的语义理解和生成能力。

大模型+微调：在用场景数据深度微调模型时，需要丰富的行业经验 Knowhow 进行评价和指导。在通过场景数据对大模型进行微调后，前期得到的模型输出可能还并不够完美，此时就需要有行业经验的专家对模型的输出进行评价，给出修改意见，再重新结合场景数据进行深度微调。比如对工业场景进行改造，可能涉及到模型具体需要和工厂内的哪些设备进行交互，还要考虑具体的作业流程。

（受篇幅限制，仅为部分浏览）

*免责声明：以上报告均为通过公开、合法渠道获得，报告版权归原撰写/发布机构所有，如涉侵权，请联系删除；本号报告为推荐阅读，仅供参考学习，不构成投资建议。

计算机行业专题研究：加大重视金融AI

作者：研搜搜--研报咨询