AI大模型和AI新机遇(2023年4月26日分享)

发布于: 修改于: 雪球转发:29回复:16喜欢:54

2023年4月26日在一个投研组织上的分享,是对于阶段性投资机会的一个看法。组织者整理了以下部分内容,稍微有一些出入,也不做更改,仅当是投资思路记录:

生成式AI和大模型

科技到了这个时代,它的发展是有必然性的。在2G时代、互联网时代,诞生了网易腾讯这样一批公司,后来3G移动互联网(2012-2013年)的时候,出现了美团、滴滴、微信等,后面因为4G有速度,抖音、快手这些新的机会就出来了。

AI在这个时间节点上,特别是CHATGPT的出现,代表了新的时代,这个时代开启了未来的大时代。为什么这么说?以前互联网领域所有的都是为了AI的诞生而准备的。2009年,IBM谷歌提出了云计算的概念。当时大家对云计算完全没有概念。现在云计算被所有人接受了,不管是个人、企业,还是政府,数据上了云之后才有大数据,才有人工智能,现在的模型都是以万亿数据单位的数据量,CHATGPT3.5有1700多亿个参数。有海量的、全球的数据为前提,才能训练出人工智能,才能产生奇点。现阶段,到了历史的一个奇点,我们见证了人工智能的诞生,就像比尔盖茨说的堪比互联网诞生,应该说这是新一代的产业革命。

大家有一个疑问,AI是不是炒完了?我觉得才刚开始,科技发展到人工智能是必然的,AI是革命性的东西,像CHATGPT提升了生产力,提高了脑力劳动者的生产力。

不管从蒸汽机时代还是电力时代,还是信息时代,每一次生产力的提升都会带来整个社会的变化,人工智能时代亦是如此。

50年以前就在讲人工智能,人工智能分为种:决策式AI和生成式AI。2021年以前,我们看到的是决策式AI,现在发展得更多的是生成式AI,CHATGPT是生成式的AI,昆仑万维也是生成式的AI。

商汤、云从(原来讲四小龙)是传统意义上的决策式AI,决策式AI在我们的生活场景已经用得很多了。比如,身份验证的刷脸,是非常典型的决策式AI,他把人脸的像素做成一个模型,一个人不管怎么变,骨骼的模型不会变、眼睛跟鼻子的距离这些参数不会变的。四小龙做决策式AI很久了,主要还是针对人脸层识别,没有突破性的场景和应用。

生成式AI,关键节点是谷歌在2017年提出的Transformer模型。Transformer模型2020年推出了CHATGPT3。为什么3.5突然爆发,去年11月份到春节很快突破一个亿用户?因为模型优化了,增加了反馈机制,这个节点就发生了很大变化。

从今年开始,各巨头参与进来后,变化日新月异。

决策式AI主要针对数据,把数据进行分析判断、打标签,比如,你看到一只猴子,就给这只猴子打标签,然后让AI来判断这个是猴子,不停的做训练,这是决策式AI。

生成式AI,是把所有的数据放进去,让他自己学习、创作。做模型的人或科学家自己也不知道AI为什么生成这个内容。生成式AI可以认为是参数到了一定级别,或者到了神经元级别时,可以像人一样考虑问题了。因为参数是千亿级别的,到了这个级别以后已经产生意识了,所以,生成式AI有点像我们大脑。

决策式AI已经造就了很大市场,典型的是今日头条、图像识别、身份证识别,包括自动驾驶,内容审核等应用场景,且广泛应用于互联网的应用里面,比如淘宝,我们可能聊天的时候说到茶叶,打开淘宝就给你推茶叶了,即语音识别你的内容,给你推送信息。

生成式AI才刚刚开始。决策式AI已经诞生了千亿市值的公司,如抖音、今日头条等。自动驾驶只能是决策式AI,因为生成式AI并不能够精准到99.99%,他只是比我们一般人的大脑更聪明,或者说效率更高,所以,自动驾驶还是用传统的决策式模型。

2022年是一个转折点,CHATGPT是人工智能的奇点,奇点就是到了一个点,整个事件从量变直接到质变。原来的模型参数不够不足以产生量变,就像我们的脑子从猴子进化到人前神经元不够,或者说原来脑容量就那么大,没有足够的脑容量,产生不了智慧,参数模型也是一样。

去年全球互联网都在裁员降本,很多互联网公司,包括腾讯阿里百度,都把做大模型人裁掉了,他们原来按照谷歌的模型走,一直走不通。CHATGPT出现后这些公司又开始大规模招人。为什么去年会出现变化的?2017这个模型只是一篇论文,2020年变成CHATGPT3.0,但还不够聪明。去年,CHATGPT3.5模型,加入了很多反馈的机制,能力发生了质变,大量的基于人在里面的反馈,再把人的回答又做成反馈,结果就做得越来越像人。到了今天,过了奇点快速进化了。

生成式AI未来的演进

年初我说2023年垂直领域的文案将可以进行调整,视频和3D的演出稿接近成熟,今年就成熟了。奇点以后,生成式AI生成视频、图片的速度越来越快。

生成式AI首先改变的是娱乐媒体。为什么最近出版行业股票涨得好?首先它是基于内容生成的,在娱乐内容的制作领域会帮助我们辅助生产,替代了很多外包型的服务。

机器有两个阶段,首先是机器辅助人,未来是AI替代人。AI的生成内容现在已经达到专业水准,前两天有个全球的摄影展,人工智能图片拿了第一名,现在生成的内容已经非常专业。

生成式在娱乐媒体有很多应用场景。上海电影就是因为上海美术制片厂有很多儿童IP,动画片最容易被改,包括儿童出版社也是受益,出版社很容易低成本的生成绘本,不需要像原来那样人工画绘本,给儿童读物降本。所以,生成式内容在娱乐媒体领域,会爆发式的快速发展。

在内容创作领域,不管是文本、音频、图像、视频生成,还有游戏等跨模态,都是最直接的受益者。从降本增效的角度,马上能够实现。所以,市场逻辑也会首先在这些板块里面体现。这些板块原来估值都比较低,又受益于降本增效,本身就有估值修复过程。

在多模态里面,输入文字可以生成图片,但生成图片太耗资源,图片比文字要远远耗资源,所以一般没有放出来。

CHATGPT3两年时间才有100万用户,到了CHATGPT3.5,两个月时间就到一个亿用户,所以科技奇点很重要。大家都觉得这个是一阵风,吹完了之后会掉下来?科技在某种程度上是周期股,但是科技股又可以享受科技的溢价,所以有时候会涨起来更猛一些。比如半导体是典型的周期性行业,但是,它有一定成长性,不断替代的逻辑,涨起来容易涨过头。科技股的好处就是,它原来是周期股,做着做成了成长股。

CHATGPT3.5主要基于人类反馈的强化训练模型,可以像人一样地自我进化,能够达到人类的价值观。国内有一套自己的体系,现在各家公司都在跑,今天看一个新闻说中国电信天翼也在做训练大模型,最近要推出来,有可能国家队做一套大模型。机器人也是有价值观的,很重要。

音频生成上,科大讯飞音频生成也是基于这样的模型来做的,为什么我们整个模型进展速度很快了,也是跟大模型有很大的关系。

现在图像生成在电商这块应用得非常快,原来用模特拍照成本太高了。

视频生成还没有那么快,有几个工具视频生成的效果还可以了。现在生成动画片已经可以实现,生成一部电影难度还是大。

在内容生产环节,全球娱乐市场有几万亿,未来会产生很多千亿,甚至万亿级别的公司,全球娱乐行业是几万亿美金的生意,这些生意用更高的效率替代,生成的内容效率更高,提供的内容更加便捷。

对于出版行业,以前主要的变现是渠道,比如,腾讯帮游戏做发行能拿百分之七八十的分成,抖音、今日头条不生产内容,就是个渠道。渠道会慢慢往内容方面发展。内容生产会变的效率更高,内容越来越丰富,产生价值会更大。原来人工生产内容,精准推送,未来,也许AI生产内容,直接按需分配给用户。原来你写个文章,每千字得1000块钱,现在只要输入你想要的,AI马上就可以写出来。原来需要买照片,买一张照片要付几十块版权费的,现在可以直接生成一张,没有版权。

爱奇艺就是大量的成本花在买剧上面,未来在这块也会大大降低成本。

各大模型情况

国内现在做大模型的公司很多了,估计很快还就会有一些新的公司出来。有些大家都很熟悉了。还有一些坚持做模型的,大家可能不了解。

举个例子:北京智源,北京智源相当于第三方的研究院,他们从2020开始做。中科院自动化所、华为,它的策略更多的是to b,做行业。华为中间停过一段时间,大模型一直坚持。但是,CHATGPT模型是c端的,是消费者业务,不是企业用户那一块的模型。

算力出租也是一个生意,互联网公司都会去做,国家队也会做。

去年这个赛道已经融了13亿美金,相当于过去5年的融资总和。一级市场去年就已经蓬勃发展。

腾讯阿里等互联网公司,以前重视不够,以前大家的路径不一样,没往CHATGPT这条模型走,现在大家上来也很快,因为CHATGPT3.0很多是开源的,关键是参数到了千亿以后,智慧涌现。

现在微软按照290亿估值投了100亿美金,一级市场现在投一个open ai大概是460亿美金,相当于3,000亿,很快就形成open ai生态了。

百度一直说自己要搞AI,搜索跟 AI确实相关。百度2012年开始搞自动驾驶,现在有文心一言的模型,包括测试图片,生成文字。但是,CHATGPT未来会替代搜索的。

华为 2019年开始搞从芯片到应用的完整生态,2014年就开发昇腾芯片,如今,华为910b的性能已经超过英伟达a100,所以大家不用太担心中国算力问题,国家在全国智能计算中心百分之七八十是华为建的,全国20多个城市都建了算力中心,以昇腾和英伟达为主。昇腾的AI芯片和 CPU IP结合做成算力的机群,然后在上面做一个训练框架。形成训练能力需要很长时间,要有训练框架,有很多软件支持,还要保证不能断,断了就要重新来。华为目前以TO B为主,还没有TO C,盘古大模型是一个底层大模型,上面包括视觉模型、科学计算模型等。

紫东太初。中科院自动化所在人工智能领域做的早,2021年从北京搬到武汉,现在叫武汉人工智能研究院。2021年9月在全球人工智能大会发布“紫东太初”大模型,这是个多模态模型,文字、图片和视频的三模态大模型,千亿级参数。最近要发布大模型,是一个通用大模型。

通用大模型好在哪里?在大模型出来之前都是垂直模型,比如,人脸识别,科大、海康、大华找罪犯,都是垂直模型。大模型的好处在于,通过大量的数据把他训练成为类似人一样的大脑,在垂直领域再灌数据进去,会很快变得很聪明。所以一个模型就涵盖了很多模型。大模型未来会把语音模型、声音模型,都颠覆掉。举个例子,比如医疗上CT读片,有了大模型以后再给他少量的数据,他很快能够学习看片子,就知道这个是不是肿瘤,就不需要原来那样海量的数据,现在只要少量的数据就学会专业技能。

让大模型学一些垂直领域的应用,甚至做得比原来垂直领域的模型做得好。

大模型的商业模式:开放API给你,因为数据可能是要保密的,可以给你独立部署,我训练好了,稍微调点参数部署在需求方,如这个模型会把医院里面所有的技巧都学会了,像人一样。

从陆奇的观点看AI新机遇

陆奇曾跟OPENAI的创始人一起做孵化器,他代表着专业级权威水平,来看看他的PPT观点。

陆奇说新范式迎来新拐点。最开始跟互联网图有点像,就是一个信息模型。大模型有三种:第一,感知模型,第二,思考模型,第三,实现(行动)模型。互联网时代,大部分都是感知或信息传送,只是信息交互,没有思考、没有交互。到了今天,我们发现人工智能具备了思考力。

什么叫模型?举个例子,一群人从全国各地跑来开讲座,我们每个人有自己的思考,最后我们干一件事,就是模型+行动。

思考就是模型。比如,我要画张图,它就从各种元素里面生成一张图,这是一种模型,再比如,我要做一个策略、评价一个事件,这些也是模型的产物。

行动是什么?行动就是机器人可以帮你做这个事。最近出现 AutoGPT,就是行动了,比如,你告诉他一件事,他可以把这个程序下载下来,各种资源整合,给你一个礼物,这就是行动,机器人就是一种行动。所以,整个信息就是从感知到思考,再到行动。

行动是自动驾驶,是服务机器人、工业机器人,机器帮你干活了。

我们到了一个非常重要的拐点——模型奇点服务的节点。互联网的范式是个信息系统(感知系统),百度阿里腾讯都是,他们主要是信息搬运的工作,不产生内容。搬运就是把资源整合在一起。比如,百度给你排名,今日头条把所有的信息推送过来。过去内容价值很低,现在发现内容也很重要。

现在是模型时代,未来也会沿这个路径走。

最后到通用智能。有人说,可能要硅基生命了,人类不见得能够持续,但硅基生命可以持续,它不受气候条件的影响,这是通用智能(硅基生命)。

这是整个机会的框架:下面是基础设施,基础设施有前端、后端,后端是服务器,前端是交互元宇宙、智能音箱等,这些器件都存在这个基础框架中。

上面偏应用,下面是底层的软件能力。我们有消费者用户的通信、社交、游戏、金融产品,还有开发程序员等创作者,有企业怎么降本增效/提高效率,最后有新能源科技、新生命科技、新材料科技、新空间科技,这些改变整个世界格局的东西,它们间有很强的关联性,底层平台、技术架构、有服务器,未来的脑机接口、元宇宙等。

应用的机会。应用的炒作有两个阶段:一,替代脑力劳动者,降本增效。最近涨得多的电商、传媒、游戏等公司,都有大量人力外包,以后可能不需要外包。科技型外包公司、低端脑力劳动者都容易被替代,市场还在反映这种预期。二,自动化。模型是思考完之后输出结果,行动能直接思考了,跟机器人结合,就变成自动化,如自动驾驶机器人,未来10年、20年,人类在家不用劳动,衣来伸手饭来张口,也许可以实现。所以机器人这个行业当下值得关注。机器人也要具体领域,但机器人未来产生万亿级的公司是完全可能的,投资机会很大。

具体应用层面的改变:

信息知识很可能被颠覆,目前百度搜索还是单向信息排名、罗列,它不是准确的答案,你需要自己整合答案结果,这种信息模式未来肯定要改变。陆奇说,未来会产生比谷歌体量大几倍公司,OPEN AI可能会实现。谷歌以前做传统信息+广告,这种模式会被颠,人工智能会给你比较好的答案,比如我要住酒店,只要把目标输入,会给你一个安排好的结果,不用自己搜索。

内容行业,不管是文本还是图像,都容易被颠覆。游戏的应用场景更多:

一是降低研发成本,脚本、做场景、文字等工作大量被替代,提高效率。

二是游戏里的场景交互性会变得很好,里面的人可以跟你交流了。在一个虚拟世界里,你也不知道他是真的还是假的,跟他在一起玩耍。

三是电商,模特、客服都能被替代,原来做电商要团队,未来一个人就能把所有素材生产,一个人能经营网店。

医疗,未来也有很多可以被人工智能替代的机会。

基于内容的行业,第一步产生影响,第二步改变行业,第三步机器人、元宇宙领域。

AI投资机会思考

比尔盖茨说,人工智能是互联网诞生以来的大的机遇,是生产力的巨大变化,是第四次工业革命。全球人工智能总市值百万亿,中国是10万亿级别。这个时代才开始拉开序幕,而不是结束。

人工智能产业以日为单位计算进展,以月为单位发布新东西,应用落地的速度非常快。应用才刚开始在各行各业渗透,很多上市公司会围绕人工智能做不同工作,会跟很多行业结合带来不同的机会。

从内容开始启动,如游戏、传媒、电商等降本增效,会快速进入到很多行业,教育、医疗都有机会。

大家都去做大模型不现实,大模型是个生态问题,跟谁绑定在一起、与谁合作,国家队、互联网公司,还是华为?不同选择下,怎么合作推进,快速渗透,站在大行业、大公司上,容易从小公司变成大公司,成长速度更快。

从长期来看,虚拟载体是元宇宙,现实载体是机器人。

全部讨论

2023-07-02 12:55

更看好硬件,可以直接快速体现业绩

2023-07-03 09:54

老师好厉害啊!

2023-07-03 09:40

今天汉得适合建仓嘛?老师

2023-07-03 08:46

虚拟载体是元宇宙,现实载体是机器人

2023-07-02 23:01

写的很好啊

2023-08-18 19:38

大詹老师,商汤咋样

2023-07-02 22:58

精华

2023-07-02 17:43

未来人类需要干嘛

2023-07-02 16:47

人类的意识上实现永生提上日程

2023-07-02 15:32

拓尔思