对话亚信科技欧阳晔:适配行业需求的大模型,才是好模型

发布于: 雪球转发:0回复:0喜欢:0

产业数智化时代,大模型正在引领着新一轮的技术革命与产业升级。自从2022年ChatGPT发布之后,大模型便进入到突飞猛进的发展阶段,前段时间发布的GPT-4o更是将大模型推动一个新的高度。

不过,我们在推崇大模型的同时,也要从多个角度来审视其发展与背后的态势。一方面,是大模型在垂直行业的落地应用。当下,可以看到,通用大模型和行业的应用之间是存在一些鸿沟的,缺乏统一纳管造成重复建设,缺少快速落地的方法和工具,是制约大模型广泛应用的主要障碍。

另一方面,从大模型的竞争态势上来看,国内人工智能产业此前的基础相对比较薄弱,在底层技术、核心算法、高端芯片、关键基础软件等方面有所欠缺,即便现在国内热火朝天,并取得了较大的进展,但对比海外厂商的技术,还有一定的差距。换句话说,大模型产业的高速推进,已经让这个行业早早进入到优胜劣汰的时刻,现在比拼的是场景落地的能力,以及在商业环节的打通。

日前,亚信科技对外发布“渊思”行业大模型产品,包含1个通用人工智能与认知增强平台TAC MaaS、3款行业大模型以及8个认知增强工具。亚信科技首席技术官兼高级副总裁、IEEE Fellow 欧阳晔博士对钛媒体APP等媒体指出,亚信科技不做通用大模型,而是聚焦行业,做专属大模型。

他认为,适配行业需求的大模型,才是好模型。判断一款行业大模型产品是否成功的关键之一,就在于其是不是解决了0和1的问题。

行业专属大模型,产品与市场匹配是第一原则

大模型的出现与发展,可以说开创了人工智能发展的新范式,并有着自己鲜明的特点。第一是有很强的扩展性,随着算力、数据和参数规模的扩张,能够持续提升算法的效果。第二是多任务适应性很强,相比较传统的小模型,大模型可以完成很多任务,也会不断地延伸到很多方向上。第三则是可塑性很强,预训练完以后的大模型仍然可以通过微调、外挂知识库、思维链提示词工程来不断提升它的能力,激发更大的潜力。

随着大模型技术和产品向纵深的发展,其关注焦点也转向如何能够真正找到落地的场景,在产业中找到它的价值,成为推动产业快速发展的新质生产力。但落地并不是一件易事,对企业有着更高的要求。比如,要有总体的系统规划能力,要有数据采集、处理能力,要有系统集成的能力。

因为所有的通用大模型到行业之后会根据行业的调整进行精调微调,这个微调必须要收集处理行业的数据,要有足够强的数据处理能力。而大模型可能会涉及到很多的不同的系统,要有足够强的系统的总集能力,把不同的系统之间连在一起。

同时,要架起通用模型和行业应用之间的纽带和桥梁,还要有很强的业务流程和业务的理解能力以及数据安全能力。大模型都会涉及到很多安全的问题,要有足够强的能力去满足对数据隐私保护、安全方面的一些合规的要求,这些能力都是大模型在行业里面应用的必需门槛。

在交流中,欧阳晔博士多次提到,亚信科技不做通用大模型,而是做行业专属大模型,聚焦“平台、模型、工具”三个层面。他透露,在大模型热潮的热潮中,亚信科技并没有急于推出自己的大模型。此次发布的产品经过了一年半的设计、打磨和应用实践,才最终问世。

“我们始终坚持大模型产品与市场匹配的第一性原则,我们觉得自己在这个领域已经真正实际落地了或者看到一些成果以后,我们才把它发布,在行业里面进行共享。”

据了解,这次发布的一个通用人工智能与认知增强平台TAC MaaS、三款行业大模型和八个应用工具已经形成70+落地商用案例,主要是以通信行业为主,今年下半年还将面向能源和交通行业增加两款行业专属模型。至于外界关心的数据安全问题,欧阳晔表示,这些所有的模型全部都是在企业专属云里面进行部署的,所以不会有任何的安全问题。

解决0和1的问题,判定行业大模型成功与否的标准

大模型的竞争是惨烈的,无论是运营商还是设备商,都在加速推进自家大模型的研发。面对行业的多维竞争,欧阳晔博士提到了一个词:中立。

“以前亚信科技是网络中立,面向不同的设备商我们做网络的管理。面向大模型的时代,我们选型过程也是中立的,能够容纳和兼容所有不同的大模型。因为运营商需要中立,或者任何一个大的行业垂直合作伙伴也需要有中立的态度。并不是说面向成百上千个场景就必须用这一个模型,还是以结果为先,要看哪一个模型针对某一个场景的落地的最终效果是最好的。”

不断的落地与预商用,是大模型在行业应用的必经之路,中间的挑战与困难可想而知。在前大模型时代,每一个人工智能的机器学习、统计学习、深度学习,以及数据挖掘那些模型,到客户侧落地的时候都有从喂养一直到把它培育成熟的过程。现在依旧如此,大模型到垂直行业去落地的时候,到某一个种子客户去做田野试验,可能会出现模型的准确率欠佳等问题。

欧阳晔博士表示,这次给大家看到的“1+3+8”只是亚信科技大模型产品体系的“分子”,更多的“分母”后续会陆续与大家见面。

他进一步指出,行业大模型出来以后只是把数学题做完了,但是真正落地是从解决数学问题到解决物理问题。至于如何判定行业大模型的成功与否,他也给出了两条依据。其一,要看是不是解决0和1的问题。面向任何一个垂直行业的任何一个商用场景,有无大模型,是否对操作方式有所改变。

其二,去做before和after的对比,来看步骤是不是减少了,自动化程度是不是提升了,工作效率是不是提升了。“接下来一定会出具相应的指导规范,或者国内国际的标准,来判别行业的大模型或者一些泛自动化和智能化的能力提升之间的标准。”

在最后,谈及通用大模型,欧阳晔博士还表示, “我们不会直接面对通用大模型竞争,而是会跟所有的通用大模型进行充分的合作,把我们的通用基座能力增强,共同面对行业市场。”(本文首发于钛媒体APP,作者|杜志强,编辑|钟毅)