中国企业蜂拥ChatGPT,谁是第一个实现产品化落地的玩家?

发布于: 雪球转发:7回复:16喜欢:17

最近关于ChatGPT的讨论越来越热,甚至有人认为ChatGPT的出现不亚于互联网的发明。

在国外,微软宣布将ChatGPT与搜索引擎Bing整合,谷歌宣布推出Bard应对挑战。中国企业也不甘落后,纷纷宣布推出ChatGPT的时间表。这其中就有搜索引擎企业百度三六零、电商企业阿里巴巴,以及人工智能企业科大讯飞等。

百度宣布三月份推出类ChatGPT产品,三六零阿里巴巴并未公布时间表。科大讯飞则宣布5月6日在学习机产品上率先落地ChatGPT,这是唯一给出确切上市时间,并率先实现商业化的中国企业。

得益于ChatGPT概念的火爆,科大讯飞股价连续大涨超过40%。在许多分析师以及同行的采访中,科大讯飞也被认为是最有机会落地ChatGPT的企业。那么,科大讯飞到底凭什么?

在回答这一问题之前,我们先了解下打造ChatGPT的三要素:算法、算力和数据。如果用一辆汽车来比喻,算法就是汽车的发动机核心技术,是软件;算力是发动机硬件,它们共同决定了发动机的优劣,而数据则是燃料。

首先,科大讯飞的算法实力如何?

公开资料显示,预训练模型范式逐步开始在自然语言处理领域应用起步于2018年。当时OPen AI公司的GPT1模型发布,然后向全世界开源。也正是从那一年开始,包括谷歌微软、OpenAI、科大讯飞、智源、鹏城等单位陆续推出预训练模型。

此后,OPenAI推出GPT2.0,直到2020年推出了GPT3.0,不再向外界开源。而这期间,科大讯飞承接了认知智能领域首个国家重点实验室,面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,开源3年模型库月均调用量超1000万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达13346位列第一。

在2023年年会上,科大讯飞创始人刘庆峰展示了讯飞在认知智能领域的成绩单:2022年7月OpenBookQA夺冠,让科学知识推理超过人类水平,10月夺得知识推理阅读理解任务QASC榜首,12月再夺逻辑推理机器阅读理解挑战赛冠军。

这证明科大讯飞在认知智能算法研究上与Open AI、微软谷歌等全球知名科技公司同步,同时也取得了中文领域最好成绩。

科大讯飞在预训练模型上的先发优势也得到了同行的肯定。2月8日,三六零公司董秘在接受采访时表达了对科大讯飞的尊重,他说:“科大讯飞人家从很早开始就做AI训练模型,他做的很专业。”

而且他还表示,预训练大模型不是一蹴而就的事情,不是说拿开源的GPT2.0抄一抄,就能获得算法。想要吃透它,哪怕它是开源软件,吃透它可能都需要一年多的时间。

其次,科大讯飞的算力如何?

有了优秀的算法,就如同汽车配上了先进的发动机技术,是软实力的体现。而“算力”水平决定了硬件实力。根据Open AI于2018年的统计,自2012年以来,AI训练任务所运用的算力每3.43个月就会翻倍,算力需求每年长10倍,而近几年,随着百亿参数起步的AI大模型的流行,AI应用对算力需求又迈上了一个新台阶。

目前,OPen AI背靠微软这棵大树,拥有强大的算力支持。科大讯飞的“算力”如何呢?

2022年12月22日,科大讯飞在接受《红周刊》采访时曾对外表示,在算力平台方面,讯飞于2009年开始算力基础设施建设,目前已建成4城7中心深度学习计算平台,讯飞的算力不仅完全满足AI算法模型训练,及面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求。同时,讯飞坚持深度学习框架和平台的自主研发,构建了专业的深度学习技术研发团队并积累了大量研发经验,具备框架、算法的研发能力,并基于此持续在深度学习算法上取得丰硕创新成果,且框架和平台对于国产GPU和硬件的支持处于业界领先水平。

特别是在当前的恶劣国际环境下,科大讯飞已经在算力布局上做到了自主可控,实现了国产替代。据官方数据,目前讯飞研发训练服务器已经开始进入国产化, 切换之后效率有的是原来平台的 70-80%,有的效率是超原来平台100+%。另外在算法上,也启动了推理服务器的国产替代;像部分产品,学习机芯片已经全部切换成国产自主。

而在三六零董秘的专访中,他也表示:科大讯飞一直在做专业的AI训练,所需要的算力,我觉得还是绰绰有余的。”

与预训练模型一样,算力也并非一日之功。作为一家专业人工智能公司,十余年来随着自身训练需求和客服服务需求的高速增长,其算力的增长是同步的。这也为科大讯飞建立了深厚的竞争壁垒和先发优势。

再次,科大讯飞的“数据”积累如何?

Open AI在GPT3.0算法发布之前一直是开源的,产品也一直是免费的。这是为了获取海量的用户交流数据。数据,是发动机的燃料。通过海量的数据“投喂”,不断人工修正和标记数据结果,让ChatGPT变得更加聪明。

在国内,搜索引擎、社交平台都拥有海量的大数据,这为它们的AI训练提供了养料。科大讯飞在通用数据量上无法与它们相比,但是在专用数据上则具有绝对领先优势。

科大讯飞官方透露,在数据支撑方面,讯飞充分发挥数据和技术紧密耦合优势,在数据建设方案设计、人机协同数据高效标注和质检、数据标注团队拓展等方面具有深厚积累,并构建了可支持单机、局域网、互联网等不同模式的人机协同数据标注平台,满足不同类型数据标注的需要。

而且,科大讯飞在教育、医疗、办公市场拥有绝对领先的市场份额,这都为科大讯飞积累了海量的专业数据。比如,目前科大讯飞智慧教育产品已在全国32个省级行政单位50000多所学校中应用,服务超1.3亿师生;在AI学习机市场,去年营收增长53%,一直是份额最高的学习机产品;智医助理产品覆盖了全国380个区县,5.3亿次AI辅助诊疗。

很多用户在使用ChatGPT时发现,它也会出错。而且美国禁止ChatGPT在校园里被使用,也考虑到其在给出知识问答时的准确性。在教育、医疗这些专业领域,AI更不能给出错误答案,而这正是科大讯飞在专业数据领域的优势。

对此,三六零董秘也表示,科大讯飞在医疗、教育领域有很好的市场地位,有强大的算法和海量数据,比如,有专业教育领域数据支撑它做专业教育AI产品,有医疗有大量的处方单和病例来支撑他做专业的医疗AI。

他还认为,从专用AI向通用AI的跨越可能只是一层窗户纸,是完全可行的。

正是得益于在专业数据、算法领域的先发优势、技术积累和数据积累,科大讯飞才能够在行业里首个落地ChatGPT到讯飞学习机,这应该也是中国首个实现ChatGPT商业化的产品。

商业化是不得不考虑的选项。目前,OPenAI的ChatGPT在做付费问答,而这种商业模式仍然比较单一,很难填补ChatGPT在算力上的消耗。所以,ChatGPT除了收费使用外,还对外开放接口,通过付费调用的方式获得营收,同时也提高数据训练量,让产品变得更聪明。

笔者认为,当前国内许多企业都在计划推出类ChatGPT产品,除了技术创新之外,如何找到优秀的商业模式,做到投入产出平衡也至关重要。

综上所述,在中国,科大讯飞成为首个落地ChatGPT产品的人工智能企业,得益于其在认知智能上的先发优势,拥有中文领域领先的算法,强大的算力,以及在教育、医疗、办公等领域专业的数据积累。

同时,在2023年年会上,刘庆峰还表示,未来5年,讯飞将实现500亿根据地业务营收、200亿毛利,这也将为讯飞继续提升ChatGPT技术提供强有力的物质保障。

@今日话题 $科大讯飞(SZ002230)$ $汉王科技(SZ002362)$ $三六零(SH601360)$ 

全部讨论

2023-02-11 23:20

这是目前为止在雪球上对科大讯飞理解的最深透的文章。这样的文章作者必须关注!

2023-02-12 00:09

分析的很透彻。

2023-02-13 09:00

在算法、算力和数据三个方面,科大讯飞早在ChatGPT大热之前,就在默默积累着....比起很多蹭概念的,科大讯飞才真正是中国人工智能第一股

2023-02-12 11:57

ChatGPT可能导致一线城市房价暴跌网页链接

2023-02-12 10:33

2023-02-12 10:30

谁信谁买单

2023-02-12 01:42

吹的刚刚好

2023-02-11 22:47

科大讯飞搞的也是针对行业的细分领域方向,和汉王科技一样,不是大通用方向。就别吹了,去看看发明专利,还没汉王的强,和chatgpt就别比了,坍台。

2023-02-11 22:28

360董秘是给他老总原话的吗

2023-02-11 22:23

360董秘,是拿了双份工资吗