中国企业蜂拥ChatGPT，谁是第一个实现产品化落地的玩家？最近关于ChatGPT的讨论越来越热，甚至有人认为ChatGPT的出现不亚于互联网的发明。在国外，微软宣布将Chat...

最近关于ChatGPT的讨论越来越热，甚至有人认为ChatGPT的出现不亚于互联网的发明。

在国外，微软宣布将ChatGPT与搜索引擎Bing整合，谷歌宣布推出Bard应对挑战。中国企业也不甘落后，纷纷宣布推出ChatGPT的时间表。这其中就有搜索引擎企业百度和三六零、电商企业阿里巴巴，以及人工智能企业科大讯飞等。

百度宣布三月份推出类ChatGPT产品，三六零和阿里巴巴并未公布时间表。而科大讯飞则宣布5月6日在学习机产品上率先落地ChatGPT，这是唯一给出确切上市时间，并率先实现商业化的中国企业。

得益于ChatGPT概念的火爆，科大讯飞股价连续大涨超过40%。在许多分析师以及同行的采访中，科大讯飞也被认为是最有机会落地ChatGPT的企业。那么，科大讯飞到底凭什么？

在回答这一问题之前，我们先了解下打造ChatGPT的三要素：算法、算力和数据。如果用一辆汽车来比喻，算法就是汽车的发动机核心技术，是软件；算力是发动机硬件，它们共同决定了发动机的优劣，而数据则是燃料。

首先，科大讯飞的算法实力如何？

公开资料显示，预训练模型范式逐步开始在自然语言处理领域应用起步于2018年。当时OPen AI公司的GPT1模型发布，然后向全世界开源。也正是从那一年开始，包括谷歌、微软、OpenAI、科大讯飞、智源、鹏城等单位陆续推出预训练模型。

此后，OPenAI推出GPT2.0，直到2020年推出了GPT3.0，不再向外界开源。而这期间，科大讯飞承接了认知智能领域首个国家重点实验室，面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型，开源3年模型库月均调用量超1000万，成为业界最广泛流行的中文预训练模型之一，在Github平台的中文预训练模型的星标数达13346位列第一。

在2023年年会上，科大讯飞创始人刘庆峰展示了讯飞在认知智能领域的成绩单：2022年7月OpenBookQA夺冠，让科学知识推理超过人类水平，10月夺得知识推理阅读理解任务QASC榜首，12月再夺逻辑推理机器阅读理解挑战赛冠军。

这证明科大讯飞在认知智能算法研究上与Open AI、微软、谷歌等全球知名科技公司同步，同时也取得了中文领域最好成绩。

科大讯飞在预训练模型上的先发优势也得到了同行的肯定。2月8日，三六零公司董秘在接受采访时表达了对科大讯飞的尊重，他说：“科大讯飞人家从很早开始就做AI训练模型，他做的很专业。”

而且他还表示，预训练大模型不是一蹴而就的事情，不是说拿开源的GPT2.0抄一抄，就能获得算法。想要吃透它，哪怕它是开源软件，吃透它可能都需要一年多的时间。

其次，科大讯飞的算力如何？

有了优秀的算法，就如同汽车配上了先进的发动机技术，是软实力的体现。而“算力”水平决定了硬件实力。根据Open AI于2018年的统计，自2012年以来，AI训练任务所运用的算力每3.43个月就会翻倍，算力需求每年长10倍，而近几年，随着百亿参数起步的AI大模型的流行，AI应用对算力需求又迈上了一个新台阶。

目前，OPen AI背靠微软这棵大树，拥有强大的算力支持。科大讯飞的“算力”如何呢？

2022年12月22日，科大讯飞在接受《红周刊》采访时曾对外表示，在算力平台方面，讯飞于2009年开始算力基础设施建设，目前已建成4城7中心深度学习计算平台，讯飞的算力不仅完全满足AI算法模型训练，及面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求。同时，讯飞坚持深度学习框架和平台的自主研发，构建了专业的深度学习技术研发团队并积累了大量研发经验，具备框架、算法的研发能力，并基于此持续在深度学习算法上取得丰硕创新成果，且框架和平台对于国产GPU和硬件的支持处于业界领先水平。

特别是在当前的恶劣国际环境下，科大讯飞已经在算力布局上做到了自主可控，实现了国产替代。据官方数据，目前讯飞研发训练服务器已经开始进入国产化，切换之后效率有的是原来平台的 70-80%，有的效率是超原来平台100+%。另外在算法上，也启动了推理服务器的国产替代；像部分产品，学习机芯片已经全部切换成国产自主。

而在三六零董秘的专访中，他也表示：“科大讯飞一直在做专业的AI训练，所需要的算力，我觉得还是绰绰有余的。”

与预训练模型一样，算力也并非一日之功。作为一家专业人工智能公司，十余年来随着自身训练需求和客服服务需求的高速增长，其算力的增长是同步的。这也为科大讯飞建立了深厚的竞争壁垒和先发优势。

再次，科大讯飞的“数据”积累如何？

Open AI在GPT3.0算法发布之前一直是开源的，产品也一直是免费的。这是为了获取海量的用户交流数据。数据，是发动机的燃料。通过海量的数据“投喂”，不断人工修正和标记数据结果，让ChatGPT变得更加聪明。

在国内，搜索引擎、社交平台都拥有海量的大数据，这为它们的AI训练提供了养料。科大讯飞在通用数据量上无法与它们相比，但是在专用数据上则具有绝对领先优势。

据科大讯飞官方透露，在数据支撑方面，讯飞充分发挥数据和技术紧密耦合优势，在数据建设方案设计、人机协同数据高效标注和质检、数据标注团队拓展等方面具有深厚积累，并构建了可支持单机、局域网、互联网等不同模式的人机协同数据标注平台，满足不同类型数据标注的需要。

而且，科大讯飞在教育、医疗、办公市场拥有绝对领先的市场份额，这都为科大讯飞积累了海量的专业数据。比如，目前科大讯飞智慧教育产品已在全国32个省级行政单位50000多所学校中应用，服务超1.3亿师生；在AI学习机市场，去年营收增长53%，一直是份额最高的学习机产品；智医助理产品覆盖了全国380个区县，5.3亿次AI辅助诊疗。

很多用户在使用ChatGPT时发现，它也会出错。而且美国禁止ChatGPT在校园里被使用，也考虑到其在给出知识问答时的准确性。在教育、医疗这些专业领域，AI更不能给出错误答案，而这正是科大讯飞在专业数据领域的优势。

对此，三六零董秘也表示，科大讯飞在医疗、教育领域有很好的市场地位，有强大的算法和海量数据，比如，有专业教育领域数据支撑它做专业教育AI产品，有医疗有大量的处方单和病例来支撑他做专业的医疗AI。

他还认为，从专用AI向通用AI的跨越可能只是一层窗户纸，是完全可行的。

正是得益于在专业数据、算法领域的先发优势、技术积累和数据积累，科大讯飞才能够在行业里首个落地ChatGPT到讯飞学习机，这应该也是中国首个实现ChatGPT商业化的产品。

商业化是不得不考虑的选项。目前，OPenAI的ChatGPT在做付费问答，而这种商业模式仍然比较单一，很难填补ChatGPT在算力上的消耗。所以，ChatGPT除了收费使用外，还对外开放接口，通过付费调用的方式获得营收，同时也提高数据训练量，让产品变得更聪明。

笔者认为，当前国内许多企业都在计划推出类ChatGPT产品，除了技术创新之外，如何找到优秀的商业模式，做到投入产出平衡也至关重要。

综上所述，在中国，科大讯飞成为首个落地ChatGPT产品的人工智能企业，得益于其在认知智能上的先发优势，拥有中文领域领先的算法，强大的算力，以及在教育、医疗、办公等领域专业的数据积累。

同时，在2023年年会上，刘庆峰还表示，未来5年，讯飞将实现500亿根据地业务营收、200亿毛利，这也将为讯飞继续提升ChatGPT技术提供强有力的物质保障。

@今日话题 $科大讯飞(SZ002230)$ $汉王科技(SZ002362)$ $三六零(SH601360)$

中国企业蜂拥ChatGPT，谁是第一个实现产品化落地的玩家？

作者：磐石之心聊投资

精彩讨论

全部讨论