东方证券电子行业电子:视频大模型快速突破,有望打开视频分析行业天花板(动态跟踪)

发布于: 雪球转发:0回复:0喜欢:0

时间:2023-12-19

来源:东方证券

$信息技术ETF(SZ159939)$ #信息技术#

视频大模型近期进展多。近日,谷歌发布AI大模型Gemini,包括适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano 三个版本。Gemini Ultra展现出强大的自然语言水平和多模态理解能力,在MMLU(大规模多任务语言理解)测评上首次超过人类专家,在32个多模态基准中取得30个SOTA(当前最优效果);Gemini Pro和Nano版本已发布,加速AI赋能谷歌产品。李飞飞的斯坦福团队同谷歌合作,推出了用于生成逼真视频的扩散模型W.A.L.T。英伟达高级科学家Jim Fan评论:2022年是影像之年,202是声波之年,而2024是视频之年!
首个原生多模态模型Gemini展示出强大视频理解能力。人工智能的发展从单一视觉或语言任务向多模态自监督学习迈进,而原生多模态大模型具有原生多模态和跨模态理解能力,与既往基于大语言模型的多模态模型存在显著不同。Gemini模型在多模态基准测试上表现突出,展示了处理复杂图像、推理序列和生成交替文本和图像回应等新能力,这些新能力有望为视频分析等领域开启全新应用途径。
原生多模态技术有望打开视频分析行业天花板。视频分析行业目前在数据处理规模、速度和深度等方面存在亟待解决的问题,原生多模态大模型有望解决行业痛点,打开行业天花板。原生多模态大模型可充分利用安防厂商积累的大量多模态视频数据,具有多模态输入的原生处理能力、跨模态推理和理解能力、高级分析推理能力,能提高大规模数据处理的准确性和鲁棒性,易于模型蒸馏和小型化部署,有望推动视频分析系统功能的跨步迭代升级。
领先厂商已入局,多模态模型将是视频监控行业新机遇与挑战。海康威视大华股份等视频分析行业领先厂商纷纷投入到多模态大模型研究和行业应用落地进程中去。多模态大模型对算力部署、算法改进、硬件升级提出了新的挑战和新的机遇,有望推动视频分析系统功能迭代升级和多维感知技术商业化步伐加快。
风险提示:原生多模态大模型进展不及预期;下游需求不及预期;行业景气度不及预期。

$海康威视(SZ002415)$

风险提示:本资料仅作参考,不构成本公司任何业务的宣传推介材料、投资建议或保证,不作为任何法律文件。基金管理人承诺以诚实信用、勤勉尽职的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。投资人购买基金时应详细阅读基金的基金合同和招募说明书等法律文件,了解基金的具体情况。基金管理人管理的其他基金的业绩和其投资人员取得的过往业绩并不预示其未来表现,也不构成本基金业绩表现的保证。基金投资需谨慎。

@老罗话指数投资 @今日话题 @蛋卷基金 @Lagom投资 @白话投资 @似曾相识81 @物不足智不明 @月下寒漪 @玩转ETF @ETF财经老爸 @指数基金 @正心投资 @徒步投资笔记 @502的牛 @青春的泥沼 @身没动心已远 @有谦 @风无雅@唐一军