探寻语言模型的无限可能:加入深度训练营,发掘AI技术新境界

发布于: 雪球转发:0回复:0喜欢:0

这个项目缘起于我们在全球宏观群的一个聊天。从今年2月份开始,出于提高全球宏观研究效率和纯粹的个人兴趣,我花了很多时间精力研究了大语言模型(LLM),当时很多朋友还习惯性称之为chatGPT。然后我陆续把过程中一些好玩的结果分享出来,并且允诺说找个机会分享给群里感兴趣的朋友,就像卧虎藏龙训练营一样。

PART.1

整个LLM产业的发展让人吃惊,最近这几个月,我几乎每天都在跟踪学习,也不断的运用于金融投资的实践。在这个过程中,我也接触到LLM在法律、媒体、证券分析行业的各种运用需求,我们也花了很大力气如何让LLM可以真正在实际工作流程中使用,而不仅仅是一个好玩的工具,比如,用LLM技术辅助律师进行阅卷和尽职调查,建立某种特定风格的文本生成等。这半年积累了非常多的知识、心得、经验,思考,当然,也有代码。这个过程中,我也到一些大学、律所、研讨会参与讨论。突出的感受是:

- 大家都想使用这个技术,但是都不知道真的该如何使用,用的多一些的人,很快就发现chatGPT是不能帮助他们完成工作的;

- 初步理解了大语言模型的原理,也试图进行深度开发,但是还是有非常多技术障碍,比如,矢量数据库的选型和存储问题,GPU计算资源的可获得性问题;

- 国内自媒体刻意的夸大或者贬低LLM的发展,比如Autogpt在github刚刚开源的时候,国内一些自媒体直接称之为通用人工智能的产生,这是极大的误解;而对于llama.cpp这样真正改变行业生态的创新,却很少介绍;

PART.2

5月份在上海复旦大学泛海商学院的一次交流活动中,让我感受到市场对于这个崭新技术的极度渴望与需求。很多人专门从全国各地赶到上海参加这个交流会。因为时间原因,其实能讲的内容很少。感谢成都复旦西部国际金融研究院,他们愿意和我一起来推动LLM在中国的实践落地。

当然最高兴的还是请到了陈剑教授和岳畅博士和我一起来讲授这个课程。他们二位在数据分析、人工智能领域都是一流的专家,而且对这个领域都充满了好奇心。我相信我们这个团队,可以给大家带来一种不同的新鲜感受,那就是我们可以真正理解透彻大语言模型,同时站在了行业落地运用的第一线。

PART.3

我们根据自己的学习体会,将课程设计成四个部分。

第一部分是讲清楚文字生成模型的原理,最好的办法就是自己从头训练一个模型。只有彻底掌握文本、图片生成的原理,我们才能知道大语言模型的能力边界和潜力,也才对后面开发过程中的技术路径选择有方向;

第二部分可以理解成为是LLM的运用,为了讲授方便,我们打算把OPENAI公司截止到目前的产品生态全部过一遍,包括最新的代码解释器和自定义环境,不夸张的说,上完这一个部分,已经是大语言模型的深度玩家了,比如你可以只用自然语言命令LLM帮助你预测水电站下一个月的发电量;

第三部分我们的考虑是引入LangChain的开发环境,和以llama2做为开源的LLM,从第二部分的运用玩家进入真正底层开发的玩家,自己搭建各种模型开发深度运用,这是更高层次的理解;

第四部分是一个探索性的内容,那就是结合现有的数据库,如何真正在一个行业里面,将LLM深入到我们日常的工作中,进行投资研究和产品开发。

好了!欢迎有心人一起来参与这个伟大的变革。具体的招生细节见文后的说明。