恒生专题分析2-AI与大模型

发布于: 修改于:雪球转发:0回复:50喜欢:12

$恒生电子(SH600570)$ $顶点软件(SH603383)$ $财富趋势(SH688318)$

金融大模型LightGPT于2023年6月推出:

基于海量金融数据训练而来,使用超2000亿中文tokens和80多项中文金融任务指令微调,覆盖金融多领域应用场景,对金融相关问题的理解比通用大模型更有优势。

考虑了LightGPT在合规性和部署模式上的特性。

充分学习中国的金融法律法规,从八大评价维度确保大模型生成内容的安全合规,符合中国金融市场的监管要求

支持云部署和7B/13B/70B的私有化部署,包括大模型接口调用和金融问答服务,以及提供定制化金融预训练和微调服务,满足金融机构个性化需求

经过几轮升级之后,在金融大模型能力评测中,LightGPT的逻辑推理、超长文本处理、多模态交互、代码、金融专业问答等多项能力都表现突出,已经具备为客服、运营、投顾、投研等金融业务场景提供能力支撑的水平

长时间以来,恒生电子就是资本市场AI应用领域的重要厂商之一,我们为客服、运营、投研、合规风控等场景提供AI产品。现在进入大模型,我们也将把自身在AI应用领域积累的数据和经验用于大模型训练中。基于这些专业的金融语料数据打造成的LightGPT,可以让原本需要很多人力成本处理的工作更加高效智能。例如,大模型应用于金融业务岗前培训场景时,可以自主创作不同的陪练场景,对新员工进行提问,从而提高员工的培训效率,缓解人工考评压力。

对于金融行业而言,安全合规至关重要。LightGPT从数据安全、内容安全等角度出发构建了完善的安全合规体系。针对数据安全和隐私保护,采取了一系列的措施来确保数据的脱敏、合规、授权和追溯,包括去除数据中所有敏感的个人以及机构敏感数据,对收集的所有数据进行匿名化和加密处理,制定严格的数据使用规范和访问控制,记录所有操作行为保证数据来源可追溯等。

通过建立可靠的网络安全系统、定期开展安全评估等方式,识别和消除数据安全隐患。针对生成内容的可控问题,构建了包括语料安全、模型安全、模型评估等在内完善的安全机制。在模型安全中,除满足国家基本合规要求外,LightGPT通过加入证监会等最新监管法规条款和金融基础金融书籍和论文等语料,让生成的内容在金融法律法规遵循、金融领域知识真实性上有大幅度提升。模型对于敏感问题、诱导问题也会进行处理。

大模型“中控”平台与智能应用产品

为了解决大模型和实际应用之间的连接问题,在LightGPT大模型基础上,打造了大模型“中控”平台光子,串联“通用工具链+金融插件工具+金融数据+金融业务场景”。光子提供的是一种介于应用场景和大模型中间的对接能力。我们发现很多应用场景都会不约而同地需要一些通用的工具能力,比如对接实时行情,文档处理、数据要素识别等。所以我们想把大家所需的能力都放到一个中间层上,统一支持上层的业务应用产品

大模型在证券基金行业可以有很多相关的创新应用场景。要达到这样的目标,一是基于大模型技术全面升级重构客户、员工交互模式;二是基于大模型技术实现场景、业务逻辑、产品的重构;三是基于大模型技术的基础设施和技术架构的升级。

根据投研场景对于数据分析和智能处理的实际需求,发布基于大模型技术全新升级的WarrenQ,推出两款AI工具产品WarrenQ-Chat和ChatMiner,通过智能对话的方式,帮助分析师和投资经理提高工作效率。”

WarrenQ-Chat是一款金融垂直领域的Chat产品,利用大模型叠加搜索和聚源金融数据库,通过对话指令,轻松获得金融行情、资讯和数据,每一句生成的对话均支持原文溯源,确保消息出处可追溯,还可以生成金融专业报表,轻松实现“语控万数”

ChatMiner则是一款金融文档挖掘器,基于大模型和向量数据库构建,可以根据用户对话指令对指定文档进行快速解读,提供精准检索与定位,提取关键信息,还可以将信息进行有效的整合归纳和精炼或拓展,智能化处理海量文本数据

//作为经常搜索、整合各种信息的老股民,对以上场景的痛点太有感触了。理论上股票的很多数据、信息都是已知的,但散户并不容易获取,数据分散,口径不同,信息孤岛,很难搜索到。对于PDF财报、公告等,里面很多表格,如想做历年整理和分析,非常耗时,但整理本身并不增值。以上两个产品,如真能做好,能整合数据,价值绝对很大。

产品架构很清晰:

白硕:LightGPT是以通用大模型为技术底座,在此基础上对接行业主要应用数据和专业内容,从而“站在巨人的肩膀上”,更好地去解决金融大模型的场景应用问题。

裸”的大模型在垂直行业没有太多的生存空间,也很难实现商业化,无法体现大模型的专业价值。只有与其他专业工具、插件和相应资源相结合,才能创造商业闭环。而未来金融信息系统的升级换代需求中,就有了大模型提供嵌入式增值服务的空间;

LightGPT主要有两个特色:一是数据,LightGPT会连接恒生聚源全部的金融数据,包括历史数据、实时数据等,和大模型共同完成金融任务。二是应用,基于恒生在大金融领域全面的产品体系,LightGPT有广泛的机会与各类金融场景创新进行有机结合

二、2023年10月恒生金融技术大会:

刘曙峰:当前金融行业对于大模型技术的关注度和参与度很高,但在大模型实际落地过程中主要存在模型选择难、算力供应不足、应用成熟度不足等问题

目前光子赋能下的智能产品可以分为重塑和嵌入两种模式。重塑是指基于大模型能力重构应用,重塑业务流程和服务模式;嵌入是指通过光子将数据、应用、知识库等资源组装成各类插件,将大模型能力无缝集成到原有程序和应用中,为业务系统注入AI力量。

在重塑模式产品方面,正式发布四款大模型应用

光子·文曲是面向投资顾问的一站式内容创作平台,通过丰富创作模版、智能文摘生成、AI问答助手、一键发布导出、图表自动生成等功能,帮助投顾快速完成报告素材搜集、内容生成以及审核发布。

光子·方圆聚焦金融机构投资合规领域,通过法规检索和文件标签化管理、智能投资合规问答、系统指标逻辑解答、一键生成合规设置等功能为合规和业务人员提供服务,提升合规管理质量和效率。

光子·善策聚焦投顾咨询场景,通过会话意图理解、智能服务匹配、智能话术生成、智能工单创建等功能,赋能投顾会话,为投资顾问精准定位客户标签,洞察客户意图,生成专业话术。

光子·慧营定位资管与托管产品运营助手,通过文档智能分片、要素智能提取、文字内容智能匹配、文件内容智能审核、文件内容溯源定位等功能,帮助运营人员提供参数提取、投监规则匹配、审计报告内容抽取等的智能辅助解决方案。

在嵌入模式产品方面,一些传统应用可不用修改代码,通过光子插件能力与业务系统交互,即可为传统应用现有业务流程注AI能力。目前光子可提供金融数据插件、知识库问答插件、Agent智能体插件、文档问答插件等各类金融特色插件,用户也可根据需求自定义业务插件。完成插件集成后,用户可在原有系统界面上唤起“光子”,与光子形成自然语言交互

如在投顾创作台中,用户可通过光子完成投顾内容改写分析、询问板块行情、查询研报观点等工作;在PB系统中,光子可辅助风控管理、资金调整复核、资产查询等操作;在CRM系统中,光子则可以帮助员工完成拜访日报智能化填写等工作。

接下来恒生电子将进一步完善光子智能生态,基于光子持续构建智能产品矩阵。持续发布和公测大模型应用新品,如面向金融业务岗前仿真培训的光子·问学,面向业务数据智能管理的光子·数见,面向会议语音内容生成行动AP的光子·会悟等;加快恒生原有业务系统的光子插件嵌入,让光子成为真正的业务智能助手

LightGPT在整体模型效果提升15%,安全合规性上提升13%,推理速度上提升50%,并面向金融机构实现LightGPT-7B的开源,推理和训练全面适配华为昇腾系列

为了系统地评估金融大模型的能力表现,恒生电子与中国信通院共同编写了金融大模型评测标准,包含“L0-L1-L2”三层能力评测,为促进金融大模型的可信发展提供重要保障。

通用能力L0层包括基础常识、语义理解、数学计算以及在金融领域尤为重要的多轮对话能力、表格处理能力和安全能力、JSON识别能力等。金融领域能力L1层包括金融法律法规遵循、金融百科问答和实体识别。金融场景能力L2层包含投顾、投研、运营、合规和其他五大场景80种金融专属任务评测

投顾场景, LightGPT通过增加1200多万tokens专业投顾语料,减少财经大V版权语料和日常语料及12类任务指令微调,应对金融术语口语众多、知识幻觉、监管严格等挑战,在安抚话术生成、客户意图识别、实体识别、Json识别等平均超出国内通用大模型13%在研报观点抽取、舆情事件识别和抽取、资讯摘要、表格处理、公司实体识别等方面平均超出国内通用大模型12%

数据质量决定模型能力

白硕:谁来连通这些数据,是有讲究的。从我们的实践来看,要有一个类似“光子”这样的东西来拉通各种数据、各种资源。比如在财富投顾场景中,投顾话术的生成需要给大模型提供各类数据,比如来自行情数据库的数据、来自基本面数据库的数据,还有来自证券公司系统里的客户自身的持仓数据等

要有一个“中控”平台,能像一个巫师一样,从四面八方把有用的资源召唤出来,使用在同一个业务场景中。如在投顾场景中,大模型可根据这些资源,进一步进行计算、分析、摘取、生成,最后形成综合了各个方面资源的投顾建议给到投资顾问。

这是大模型自身做不到的,需以一种无缝的方式拉通多方面的资源才能做到。而这些工作恰恰是我们最擅长的

白硕:开源分为代码开源和参数开源。一般都能做得到代码开源,真正拉开距离的不是代码,不是训练和推理的框架,而是数据。数据可能决定了模型的能力。用数据这件事情差异还是蛮大的,尽管训练和推理框架都是开源的,但只要数据本身有特色,仍然能够打造具有自己特色的大模型,这是一个我们的基本判断

如涉及到参数开源,参数开源意味着你的上家(底座大模型)用它的数据训练过一次模型,得到了一些参数,而你没有废弃这些参数而是继承,然后在这些参数基础上,用你的数据继续训练,把这些参数向效果更好的方向去迭代修改。在这种情况下,开源参数的质量会很大程度上决定后续的模型质量

2024年新进展:

目前恒生所有终端解决方案均已支持鸿蒙系统。

4月,恒生LightGPT金融领域文本生成类算法名列其中。恒生聚源的Gil-GPT大模型算法也同批次通过备案,该算法主要应用于金融资讯信息对话生成场景

4月互动:恒生大模型应用产品与多家客户开展共建,目前不对公司收入带来重要影响

规模、参数的近身肉搏之后,落地逐渐成为“百模大战”的共识。得益于数据密集型行业优势,辅以强劲的数字化基础及行业本身对新技术的天然追逐,金融在一众场景中脱颖而出。也是因为这些优势,金融行业得以更快过渡到“冷静期”,将重点调整至价值—应用的价值。“金融行业将是大模型技术落地的最佳领域。”度小满CEO朱光曾做出了这样一个判断。只不过,在应用的“星辰大海”面前,当下的金融大模型仍然面临着复杂的多维挑战。

最后,个人理解,恒生在AI或大模型方面的几点独特优势:

有自己相对完整、高质量的金融数据源;

有丰富的金融IT产品,熟悉业务应用场景,为AI落地提升机会或土壤;非裸模

作为金融科技公司,更有第三方公信力;(没法全吃,但应能吃到其中的一部分)

"它不是一种新武器,而是一个新世界的开始"

精彩讨论

美丽的邂逅06-06 20:31

恒生2018年就开AI产品发布会了。技术都是需要积累的。风来了,才开始搞,甚至开始规划的公司,都是搞概念或没有竞争力的公司。
$恒生电子(SH600570)$

美丽的邂逅06-27 08:48

$恒生电子(SH600570)$
这篇文章是在ChatGPT火爆出圈前不久发表的,以CHATGPT为分界线,相关AI的文章,或者说NLP AI方面,都有清晰的分水岭或界线。当时可能难以想象到,几个月之后的CHAPGPT就有那样的一种效果。文章谈到的应对手段,明显与大模型方向是不同的。但恒生在AI方面的研发与投入,的确是10年前就已经开始在搞与应用了。
恒生首席科学家白硕:精准NLP的机会与挑战 2022-09-21
从答案复杂度看NLP技术的演进
这一波以深度学习为核心技术的AI浪潮中,NLP(自然语言处理)可以说是成功的AI应用典范之一。放眼其他AI应用,或许只有人脸识别可以与之相提并论。在资本市场的金融科技实践中,我们也亲身经历了NLP用于客服、投研、投顾、法务和运营/运维一体化等各类应用尝试。
这几年的尝试说明,在一些简单场景使用深度学习的现有NLP技术是有效的,但只要把要求进一步提高,NLP就难以胜任。
在这个过程中,我们最深切的体会就是:领域知识和AI模型难以有效融合。究竟是AI模型只需要数据、不需要领域知识也能搞好,还是AI模型受自身局限所致,无法融合领域知识?“懂业务”能否成为NLP技术和产品的核心竞争力?是我们无法逃避的“灵魂之问”。
精准NLP如何破局实现精准NLP,应该从哪里入手,才能真正破局呢?笔者认为,应该从以下三个方面入手:
1.在文本侧实现精准解析。所谓精准解析,就是构建有层次的句法结构。我们看到,最近业界对基于依存语法的分析器的需求明显上升。依存语法面向英语的解析能力相对成熟,面向汉语还有很长的路要走。
2.在应用侧进行元数据集成。所谓元数据集成,就是构建不同应用场景所需的、可关联可组合的“技能”框架群。从IT观点看,资本市场是一个高门槛、小体量的市场,需要的“技能”总量或许没有互联网电商那样庞大,但对“技能”及其背后的数据、元数据的理解,对框架之间的关联关系、组合关系的理解,却需要一定的专业能力。
3.在语义侧实现资源图谱。所谓资源图谱,就是打通文本侧和应用侧的中间知识表示,也是屏蔽应用侧个性,合并应用侧共性的中间知识表示。
我们认为,这个中间知识表示的载体,非知识图谱莫属。其原因是——知识图谱的表达能力足以覆盖应用侧的各类元数据抽象,知识图谱的丰富协议栈至今没有其他知识表示体系可以超越。
笔者认为,在上述文本侧、应用侧、语义侧的技术准备就绪并连成一体的情况下,精准NLP的破局就势在必行。这是挑战,更是机会。
NL2X:恒生进军精准NLP之路
进一步追问,究竟在对NLP哪些方面提出了什么“高”要求,NLP就开始不那么胜任了呢?也许,在对追问的回答中就包含了通向NLP正确发展道路的钥匙。追问当然可以在很多维度上展开,但是我们发现,“答案复杂度”是一个有意义的维度。如只看表象,一个自然语言对话系统的输入是文本,输出也是文本,输出的文本要多复杂就可以多复杂,其实这是误导。如我们把一部FAQ切割成若干个“固定答案”,每个答案只需要一个分类标签,那么整个问答的过程就是一个根据输入问句寻找匹配的分类标签的分类问题。知道了这一点,全部深度学习的精华就可以套上去了。只要有足够多的数据,足够大的模型,这个“文本固定答案(分类标签)”的问题就可以做得足够好。可是,继续深挖场景,我们会进入“固定答案”难以满足应用需求的情况。人们常用“技能”来描述NLP的能力。掌握一个“技能”,并不是说可以回答一个答案固定的问题。比如在基金电商的场景,完成购买基金产品的一个“交易”,就是一个技能。这时,基金的名称、风格、收益状况、过往业绩和基金经理的人脉圈子,以及客户想要购买的份额数量等都是变化的。执行交易,意味着一个按照参数设定完成一个交易行为。但NLP要做的,是既要正确地定位“买基金”这样一个动作类型,还要正确获取完成这个动作所需要的各个参数。这就是一个“技能”。如果说,技能名是一个“固定标签”的话,一个完整的技能就是这个“固定标签”再加上一组该技能对应的参数。这组参数可以用若干个“槽-值对”来刻画。技能名+“槽-值对”,在业务上相当于一个表单,在AI中这就是一个“框架”。“输入一段文本,输出一个框架”,这是NLP的第二个能力阶梯。跃上第二个能力阶梯,是NLP在答案复杂性上的一个重要的飞跃。再进一步,很多场景下,单独一个“框架”也满足不了用户用自然语言提出的要求。比如调阅一个数据表,按照一定的条件筛选出符合条件的数据记录,对之进行字段裁剪并指定排序规则输出一个结果视图。这是典型的数据库单表查询。如用自然语言文本来表达这样的查询意图,输出的就不是“一个”框架,而是一段SQL程序。当然如果已经建立多表的关联,也可以在自然语言文本“召回”下,通过关联来进一步完成多表的查询。测试脚本、运维自动化的脚本,也可以通过自然语言文本的描述来生成。所有这些,都不再是简单“文本到框架”映射,而是更复杂的“文本到多层框架组合”的映射。于是我们来到第三个能力阶梯的面前,它的最大特点同时也是最大难点,就是“组合”二字。所以,在现阶段,谈到精准NLP其实最核心的关键技术就是精准地把文本映射为框架组合。如果这个部位有所突破,哪怕是在一个很具体的应用领域,也会带来应用面貌的巨大改变。

全部讨论

06-06 20:31

恒生2018年就开AI产品发布会了。技术都是需要积累的。风来了,才开始搞,甚至开始规划的公司,都是搞概念或没有竞争力的公司。
$恒生电子(SH600570)$

06-27 08:48

$恒生电子(SH600570)$
这篇文章是在ChatGPT火爆出圈前不久发表的,以CHATGPT为分界线,相关AI的文章,或者说NLP AI方面,都有清晰的分水岭或界线。当时可能难以想象到,几个月之后的CHAPGPT就有那样的一种效果。文章谈到的应对手段,明显与大模型方向是不同的。但恒生在AI方面的研发与投入,的确是10年前就已经开始在搞与应用了。
恒生首席科学家白硕:精准NLP的机会与挑战 2022-09-21
从答案复杂度看NLP技术的演进
这一波以深度学习为核心技术的AI浪潮中,NLP(自然语言处理)可以说是成功的AI应用典范之一。放眼其他AI应用,或许只有人脸识别可以与之相提并论。在资本市场的金融科技实践中,我们也亲身经历了NLP用于客服、投研、投顾、法务和运营/运维一体化等各类应用尝试。
这几年的尝试说明,在一些简单场景使用深度学习的现有NLP技术是有效的,但只要把要求进一步提高,NLP就难以胜任。
在这个过程中,我们最深切的体会就是:领域知识和AI模型难以有效融合。究竟是AI模型只需要数据、不需要领域知识也能搞好,还是AI模型受自身局限所致,无法融合领域知识?“懂业务”能否成为NLP技术和产品的核心竞争力?是我们无法逃避的“灵魂之问”。
精准NLP如何破局实现精准NLP,应该从哪里入手,才能真正破局呢?笔者认为,应该从以下三个方面入手:
1.在文本侧实现精准解析。所谓精准解析,就是构建有层次的句法结构。我们看到,最近业界对基于依存语法的分析器的需求明显上升。依存语法面向英语的解析能力相对成熟,面向汉语还有很长的路要走。
2.在应用侧进行元数据集成。所谓元数据集成,就是构建不同应用场景所需的、可关联可组合的“技能”框架群。从IT观点看,资本市场是一个高门槛、小体量的市场,需要的“技能”总量或许没有互联网电商那样庞大,但对“技能”及其背后的数据、元数据的理解,对框架之间的关联关系、组合关系的理解,却需要一定的专业能力。
3.在语义侧实现资源图谱。所谓资源图谱,就是打通文本侧和应用侧的中间知识表示,也是屏蔽应用侧个性,合并应用侧共性的中间知识表示。
我们认为,这个中间知识表示的载体,非知识图谱莫属。其原因是——知识图谱的表达能力足以覆盖应用侧的各类元数据抽象,知识图谱的丰富协议栈至今没有其他知识表示体系可以超越。
笔者认为,在上述文本侧、应用侧、语义侧的技术准备就绪并连成一体的情况下,精准NLP的破局就势在必行。这是挑战,更是机会。
NL2X:恒生进军精准NLP之路
进一步追问,究竟在对NLP哪些方面提出了什么“高”要求,NLP就开始不那么胜任了呢?也许,在对追问的回答中就包含了通向NLP正确发展道路的钥匙。追问当然可以在很多维度上展开,但是我们发现,“答案复杂度”是一个有意义的维度。如只看表象,一个自然语言对话系统的输入是文本,输出也是文本,输出的文本要多复杂就可以多复杂,其实这是误导。如我们把一部FAQ切割成若干个“固定答案”,每个答案只需要一个分类标签,那么整个问答的过程就是一个根据输入问句寻找匹配的分类标签的分类问题。知道了这一点,全部深度学习的精华就可以套上去了。只要有足够多的数据,足够大的模型,这个“文本固定答案(分类标签)”的问题就可以做得足够好。可是,继续深挖场景,我们会进入“固定答案”难以满足应用需求的情况。人们常用“技能”来描述NLP的能力。掌握一个“技能”,并不是说可以回答一个答案固定的问题。比如在基金电商的场景,完成购买基金产品的一个“交易”,就是一个技能。这时,基金的名称、风格、收益状况、过往业绩和基金经理的人脉圈子,以及客户想要购买的份额数量等都是变化的。执行交易,意味着一个按照参数设定完成一个交易行为。但NLP要做的,是既要正确地定位“买基金”这样一个动作类型,还要正确获取完成这个动作所需要的各个参数。这就是一个“技能”。如果说,技能名是一个“固定标签”的话,一个完整的技能就是这个“固定标签”再加上一组该技能对应的参数。这组参数可以用若干个“槽-值对”来刻画。技能名+“槽-值对”,在业务上相当于一个表单,在AI中这就是一个“框架”。“输入一段文本,输出一个框架”,这是NLP的第二个能力阶梯。跃上第二个能力阶梯,是NLP在答案复杂性上的一个重要的飞跃。再进一步,很多场景下,单独一个“框架”也满足不了用户用自然语言提出的要求。比如调阅一个数据表,按照一定的条件筛选出符合条件的数据记录,对之进行字段裁剪并指定排序规则输出一个结果视图。这是典型的数据库单表查询。如用自然语言文本来表达这样的查询意图,输出的就不是“一个”框架,而是一段SQL程序。当然如果已经建立多表的关联,也可以在自然语言文本“召回”下,通过关联来进一步完成多表的查询。测试脚本、运维自动化的脚本,也可以通过自然语言文本的描述来生成。所有这些,都不再是简单“文本到框架”映射,而是更复杂的“文本到多层框架组合”的映射。于是我们来到第三个能力阶梯的面前,它的最大特点同时也是最大难点,就是“组合”二字。所以,在现阶段,谈到精准NLP其实最核心的关键技术就是精准地把文本映射为框架组合。如果这个部位有所突破,哪怕是在一个很具体的应用领域,也会带来应用面貌的巨大改变。

05-11 20:09

$恒生电子(SH600570)$
去年一季度极其火爆的AI,到现在情绪已大幅冷落。人工智能931071目前的PB,已经低于2022年年底,AI爆发前期了。
但AI的确是非常确定性的一个大方向。情绪不高时,绩优低估股就值得买入了。A股拥有热门题材,非常的重要。
相对于算力或少数通用大模型,如文心,应用端才是大多数国内企业可以掘金的地方,且这个周期会很长。啥时在收入,利润上体现出来。可能不同行业落地速度不一样。我看好金融,这是与数据、文本分析关联度最高的行业了。且客户或用户是利益驱动,生生不息,只要产品能出来,赚钱是不用担心的。

04-30 12:19

新能源汽车是个方向,早些年很多人都能看到这一点,但可能大多数都会觉得速度不会那么快,新能源汽车占行业销量比例达到30%,感觉会很遥远。现在已经达到了。
AI 在每个领域的推广应用,目前也是早期。故事总是在重复,如果在早期底部买入头部公司,耐心在当方向上等待,结果大概率会很好,但就是等不了。
AI这一次,股市又出题了,这次我还能呢?希望这次我能。选了那么多题材、赛道,总是坚持不下去。AI的方向性应该没问题了,就看行动吧

07-02 08:54

$恒生电子(SH600570)$
白硕针对建设一个好的金融大模型,总结了四个关键因素。
一,高质量的数据。金融有很高的专业化要求,数据上要反映行业的专业化,这是和通用大模型拉开距离的关键。LightGPT的数据来源包括聚源过去二十年超过4000亿tokens的文本数据及结构化数据,超过400亿tokens的金融教材、金融百科、政府报告、法规条例等数据,以及一些精调的数据集。
二,优秀的基础大模型。以优秀的基础大模型为起点,面向专业领域时能够有更好的提升空间。恒生电子积极探索与国内外金融大模型的合作,使LightGPT有较高的起点。
三,专业的大模型能力。训练大模型的专业能力,包括算法、人才以及外部合作等。在算法方面,要去学习和采纳较为先进的算法,包括参数冻结、领域相关的指令精调以及强化学习相关的算法。在人才储备方面,恒生电子拥有国家级博士后科研工作站,在外部合作上,恒生与复旦大学、浙江大学、中国科学院、中国科学技术大学等高校都达成了合作。
四,充足的算力。一方面来自恒生与互联网厂商、云厂商在算力方面的合作,另一方面恒生也投入了一些自有算力来支持LightGPT的研发。
(搞AI投入不会少,对于年研发投入1亿多的同行,在兼顾信创和持续运营背景下,AI能有多少投入呢?大模型+数据+软件才是未来真正的趋势)

06-27 08:14

$恒生电子(SH600570)$
转发:
AIGC在金融领域的展望
AIGC在金融领域,有四个方面的思考:金融高频场景的降本增效、金融紧急场景的快速响应、金融预测场景的策略生成、跨领域金融的商业潜力。
金融高频场景的降本增效则多发生在资讯类、行情类、分析类、介绍类等视频场景。由于视频需求量极大、个性化程度高、视频模板难以个性化复制、视频制作人力成本高、周期长,外加商用图片、视频模板版权的价格越来越高,商用版权费用会是一笔不小的支出。
这样的情况下,通过AIGC能力直接生成个性化视频,可以大幅度降低高频内容制作与修改的时间成本,另外AIGC也可以直接生成金融类素材以降低购买成本。
金融紧急场景需要快速响应。
一是金融舆情突发,事件紧急情况下快速地完成宣发工作可以避免很多损失。但是完成宣发工作需要组织拉齐人力、对齐事件中心思想、合并稿件等,这一过程沟通成本高,制作成本高。利用AIGC能力可以快速生成所需内容,减少在岗、通讯成本。
二是客户页面设计需求应快速响应。传统的沟通方式是客户与客户经理沟通需求之后再反馈给设计师,设计师经过几天的设计完成初稿demo给客户评估。这个过程至少需要2~3天的时间,如果客户对demo不满意,就需要支付额外的时间成本再生产。
然而引进AIGC技术能力后,客户经理可以把客户的需求直接转化成的demo样式现场直接反馈,极大地提高了响应速度。
金融预测场景的策略生成。
金融风险智能预警、量化交易推荐等技术是经常应用的,但是以上技术多是给出风险点、购买股票与否等单步静态结果,但是如果根据单步静态结果形成中短期策略,则多需要人为参与、决策。
如可利用AIGC的能力,进一步推动这些静态结果到动态策略的生成,这样事件在不断发展的过程中,可以由AI动态修改、提出多条策略与演算结果,实现的效益可想而知。
除了AIGC在金融领域的应用价值以外,金融跨领域应用的商业价值不容小视,可以是“金融+养老”、“金融+教育”等。
AIGC可促使不同AI能力联动能力的产生,使得其应用领域可以不在金融领域单独思考,以金融衍生出来或与金融领域有关联的领域都可以产生联动,潜在的市场规模仍然很大。
区块链技术火热之初主要将其应用于加密货币、NFT之中,然而其在茅台申购与打假上取得了很好的效果,i茅台APP所用的基于区块链的可信抽签系统,该系统能够为用户分配区块链上的唯一专用抽奖码,并通过区块链智能合约自动生成抽奖结果由此可见,AIGC在金融与其他领域的结合领域仍有很大的商业价值发展空间。

06-18 20:10

$恒生电子(SH600570)$
李彦宏的这个观点是否准确?不好回答。但是,跟的确金融领域有自己特有数据优势。
信创是金融科技1~3年内落地概率更高的事,大模型可能是稍微延后一些,但会有交叉。

05-01 21:32

在金融领域有很多专业化的要求,一个专业性问题,你告诉客户一个错误的答案,由此引发的后果可能是比较严重的,因此金融行业对回答的内容和服务的质量要求非常高,数据的专业化和准确性非常重要。
这个不像是和一个聊天的大模型对话,大家可以相互调侃,它输出的结果大家可能不会特别在意。但金融大模型输出的结果是要提供给实际金融业务的,在这种场景下就不能出错,避免出现知识幻觉。
金融行业有着严格的监管合规要求。金融行业的监管对数据流动、身份(例如是否持牌经营)等有明确限制。恒生通过大模型中控平台“光子”,将公开数据和金融机构的私有数据,像运营、合规、交易等系统产生的数据和一些特色数据,有效地连接起来,形成一个有机的整体。

04-30 12:15

2022年9月的文章:华为常成:鲲鹏、昇腾体系化生态产业构建中国算力坚实底座
当时CHATGPT还没火爆,AI 在股市的热度没起来。
摘录:
2018年人工智能的行业渗透率仅4%,但截至2021年,人工智能的行业渗透率已达到7%,并在智慧城市、制造、交通、医疗等场景带来深刻变革。
“预测在2026年人工智能的行业渗透率将达到20%,为数字经济注入新动能。”谈及人工智能发展时常成表示,“同时,人工智能快速发展,正在走深向实,不断改变着我们的世界。
首先,AI正在深刻地变革我们的生活和生产方式,进入到越来越多的场景应用;
其次,在新兴应用的领域中,行业正在和AI相互促进发展,比如多模态的内容生成、机器人应用、甚至是自动驾驶;(多模态这些话,AI圈内的人其实早就在提了)
最后,在前沿领域中,科研与AI的探索不断发生碰撞,拓宽了技术边界,让不可能成为了可能。”

04-29 15:50

在刘曙峰看来,判断一个创新技术是否实现有效落地,可以从“是否实质性改善用户体验、是否数量级提高业务效率,是否追求盈利而非追求流量”三个角度来判断。相信随着“数据+算法+算力”大模型新范式三大基本要素的不断提升,大模型作为一种创新技术,也将完成对于财富资管领域业务形态和逻辑范式的革新。