推理速度提升4倍!高通AI Hub加速终端侧生成式AI变革

发布于: 雪球转发:0回复:0喜欢:0

当前,生成式AI变革已经到来——随着生成式AI应用成为不可或缺的要素并推动业务增长,该技术将带来变革性的影响。根据麦肯锡的研究,生成式AI技术可使60多个用例每年实现2.6万亿至4.4万亿美元的总体经济效益增长,经济规模大致相当于英国2021年的GDP。

终端侧AI能够为用户带来即时性、可靠性、隐私和个性化等优势,并变革用户与终端交互的方式。在今年的MWC巴塞罗那期间,众多厂商推出了与生成式AI相关的新产品、新应用。其中,高通带来了公司在AI领域的最新进展,不仅推出了全新高通AI Hub,还带来了多项前沿研究突破以及AI赋能的商用终端展示。

据悉,在去年MWC期间,高通就带来了全球首个运行在Android手机上的Stable Diffusion终端侧演示。去年底推出的第三代骁龙8是高通首个专为生成式AI而精心打造的移动平台,集终端侧智能、顶级性能和能效于一体。基于在性能和能效方面的显著提升,第三代骁龙8能够运行高达100亿参数的生成式AI模型,以20 tokens每秒的速度运行大语言模型。高通还在去年底发布了专为AI PC打造的骁龙X Elite平台,它能支持在终端侧运行超过130亿参数的生成式AI模型,AI处理速度是竞品的4.5倍。

高通AI Hub发布,推理速度提升4倍

全新发布的高通AI Hub包含预优化AI模型库,支持在搭载骁龙和高通平台的终端上进行无缝部署。该模型库为开发者提供超过75个主流的AI和生成式AI模型,比如Whisper、ControlNet、Stable Diffusion和Baichuan-7B,可在不同执行环境中打包,能够在不同形态终端中实现卓越的终端侧AI性能、降低内存占用并提升能效。所有模型均经过优化,以充分利用高通AI引擎内所有核心的硬件加速能力,从而使推理速度提升4倍。AI模型库能够自动处理从源框架到主流执行环境的模型转换,直接与高通AI引擎Direct SDK协同工作,并应用硬件感知优化。开发者可将这些模型无缝集成进应用程序,缩短产品上市时间,发挥终端侧AI部署的诸多优势。

这些优化模型现已在高通AI Hub、GitHub和Hugging Face上提供。高通AI Hub将持续增加新模型,同时还将支持更多平台和操作系统。开发者现可注册登录,在搭载高通平台的云托管终端上自行运行模型,并通过高通AI Hub提前获取新特性和AI模型。

前沿AI演示亮相,终端侧AI触手可及

高通在MWC的展位上还带来了多项聚焦生成式AI落地应用和未来趋势的展示,并携手领先终端厂商带来了现场演示,包括生成式AI大模型在终端侧的应用演示、AI定制化工具为智能手机带来的丰富体验,以及生成式AI如何赋能网络管理与优化的特性等展示。

其中,高通重点展示了首个在Android智能手机上运行的大语言和视觉助理大模型(LLaVA),这是一个超过70亿参数的大型多模态语言模型(LMM),可接受包括文本和图像在内的多种类型的数据输入,并能够与AI助手生成关于图像的多轮对话。该LMM能够在终端侧以实时响应的速度生成token,从而增强了隐私、可靠性、个性化和成本优势。具有语言理解和视觉理解能力的LMM能够赋能诸多用例,例如识别和讨论复杂的视觉图案、物体和场景。

高通还展示了公司首个在Android智能手机上运行的LoRA模型。通过运行支持LoRA的Stable Diffusion,用户可基于个人或艺术偏好创建高质量自定义图像。LoRA减少了AI模型的可训练参数数量,赋能更加高效、可扩展、定制化的终端侧生成式AI用例。除了能够实现针对不同的艺术风格赋能语言视觉大模型(LVM)微调外,LoRA还广泛适用于定制AI模型(如大语言模型),以打造量身定制的个人助手、改进语言翻译等。

在Windows PC上,高通展示了全球首个在终端侧运行的超过70亿参数的大型多模态语言模型(LMM),可接受文本和音频输入(如音乐、交通环境音频等),并基于音频内容生成多轮对话。

跨终端品类赋能生成式AI,智能计算无处不在

高通总裁兼CEO安蒙表示,AI解决方案正在支持高通提供下一代连接,赋能生成式AI时代。高通正在让智能计算无处不在,支持生态系统跨多品类终端开发并落地生成式AI用例、体验和领先产品,包括智能手机、下一代 PC、XR终端、汽车和机器人等。在MWC期间,高通还展示了跨终端品类赋能生成式AI的多项演示:

在智能手机领域,高通展示了一系列搭载第三代骁龙8移动平台的商用旗舰AI智能手机,包括荣耀Magic6 Pro、OPPO Find X7 Ultra和Xiaomi 14 Pro。每款终端都集成了令人兴奋的生成式AI新特性,比如图像扩充(小米)、智慧成片和一拖日程(荣耀)、AI消除(OPPO)。

在PC领域,全新骁龙X Elite及其45 TOPS NPU专为终端侧AI打造,将变革用户与PC的交互方式。高通使用了广受欢迎的免费图像编辑器GIMP集成Stable Diffusion插件进行演示:用户可输入想要的图像,生成式AI将在7秒内生成图像,速度比x86竞品快3倍。

在汽车领域,利用行业领先的AI硬件和软件解决方案,高通演示了骁龙数字底盘平台支持的传统AI和生成式AI功能,旨在为驾乘人员提供更加强大、高效、隐私、安全且个性化的体验。

在消费级物联网领域,高通展示了在骁龙平台上运行的Humane AI Pin,让用户能够在全新、对话式以及无屏的终端形态中随时随地使用AI。

在连接领域,全新推出的骁龙X80调制解调器及射频系统集成专用5G AI处理器和5G Advanced-ready架构,助力提升蜂窝性能,扩大覆盖范围,降低时延并提高能效。高通还推出首个AI优化的Wi-Fi 7系统——高通FastConnect™ 7900移动连接系统,利用AI为自适应、高性能、低时延和低功耗的本地无线连接树立新标杆。

在5G基础设施领域,高通展示了三项突破性的AI辅助网络管理增强特性,包括助力无线接入网(RAN)工程师简化网络和切片管理任务的生成式AI助手,降低网络能耗的AI辅助开放式RAN应用程序(rApp),以及AI辅助5G网络切片生命周期管理套件。