Meta/xAI 大模型登场角力,微美全息全力加速多模态AI与场景应用融合

发布于: iPhone转发:0回复:0喜欢:0

日前,美国科技巨头Meta(META.US)发布了其最新的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。Llama 3包含了80亿(8B)和700亿(70B)两种参数,现已能够通过主流的云服务平台进行访问。

最强开源大模型Llama 3 将上线

性能方面,Meta表示Llama 3相较于老版本具有明显提升,模型在回答提示方面具有更丰富的多样性,拒绝回答问题的错误次数有所减少并且推理能力也更强。

此外,Meta表示两种参数的Llama 3都在某些基准测试中击败了类似的大模型,如谷歌(GOOG.US)的Gemma和Gemini、Mistral 7B和Anthropic的Claude 3。

Meta认为Llama 3是市场上最好的开源大模型。伴随着Llama 3的发布,Meta还宣告了搭载了该大模型的AI助手Meta AI。Meta AI最初曾在去年Connect大会期间公布,现已进一步扩大了使用范围。

xAI 首款多模态大模型登场

在AI这场没有硝烟的“航海竞赛”中,大模型已然成为眼前的灯塔。巧合的是,自从马斯克的 xAI 在大模型领域不断取得进步,在 Grok-1 开源后不到一个月,xAI 的首个多模态模型问世了。

据悉,近日,xAI 推出了 Grok-1.5V,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI称,Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型,从多学科推理到理解文档、科学图表、图表、截图和照片。

如果 Grok-1.5 能在类似于 Grok-1 的开源许可证下发布,这将成为当下 LLM 竞争格局的一个重要节点。在接下来的几个月里,xAI 预计将在图像、音频和视频等各种模态上显著提高模型能力。

现如今,纵观全球AI市场布局,海外市场,以 GPT4.0 和 Sora 为标志,展现出大模型在多模态化和文生视频向能力的突破;国内市场同样有惊艳表现,以处理长文本见长的 AI 应用 Kimi 迅速蹿红,各大厂逐鹿,并收获了强烈的市场反馈。

微美全息正沿着多模态大模型前进

资料显示,作为活跃在大模型前沿舞台的大厂之一,微美全息(WIMI.US)凭借技术和生态优势,利用大模型对于所有产品进行重构,特别是AI大模型已深入应用区,寻求匹配的场景加速应用落地,推动用户体验和业务效率的双重提升,全面开拓多模态“AI大模型+”的商业化路径,共建多模态AI+软硬件生态运用。

目前,微美全息基于公司多年技术积累所打造的一系列AI生态垂类大模型,通过人工智能+产业深度融合,特别是在直播、数字人、数字办公等多个领域,打通AI大模型从进化到落地的链路。在大模型的全面赋能下,微美全息基于自研的AI大模型为底座的生态基本成型,并在科技大厂掀起的这场 " AI运用" 的风暴中,取得了不错的开局,奠定了一定的领先优势。

与此同时,大模型催生应用全面落地的新机遇,多模态大模型已经逐步取得了一系列引人注目的成就。对此,微美全息将通过人工智能通用核心技术的运用,打造出“多模态场景”为核心的AI大模型场景矩阵,以多模态大模型、大语言模型、文生图模型等能力组合切入为用户提供更智能、更全面的多模态大模型AI+服务,不断推进以人工智能带动下的数字产业化和产业数字化建设。

结尾

当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平。2024 年,可以说大模型应用正处于新物种大爆发的风起云涌时代,AI大模型与产业碰撞、融合之际,持续为AGI注入新活力。在未来的人工智能时代,多模态AI大模型是战略制高点,并构建数据、模型、应用的商业闭环,软件与硬件并驾齐驱,将可能成为推动人工智能发展的关键力量。

$微美全息(WIMI)$ $Meta(META)$ $特斯拉(TSLA)$