搜了一下知乎,确实有多模态的视频通用模型。再次谢谢楼主的信息提供。
好吧,谢谢你的分享,希望能够及时看到你的认识。
有数据,有技术,有资金,你说的什么模型搞不起来?特别是数据才是人工智能的核心
说说你的逻辑?