善上若水dsry 的讨论

发布于: 修改于: 雪球回复:0喜欢:0
最早提出、首个搭载,不一定最终一定成功,更不一定最早成功。这中间各种因素太多了。目前能看到的,最明确的制约因素是算力储备不够。这也是方汉在接受《晚点》采访时明确提出的最大的焦虑和不安全感。至于人才,是第二大制约因素,但这可以慢慢克服,昆仑发布了雄心勃勃的人才计划。第三个制约因素是数据,特别是高质量的语料,一方面继续提升大模型能力的语料不足,另一方面特定应用场景的语料昆仑更加稀缺,比如无人驾驶方面,医疗健康方面。这些基本都是空缺,无疑严重限制了昆仑往这些领域拓展。昆仑只能往更底层的技术方向探索,于是发布了通用视觉模型Vitron。将来一旦成熟可以迅速与上述提到的应用场景公司合作,从而延伸到那些领域。
这个模型一定要重视。Vitron模型支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑等任务的像素级通用视觉多模态大模型。
怎么理解像素级?天工回答:
像素级在计算机视觉中指的是对图像中每一个像素点进行处理和操作。这种处理通常用于基础的图像处理任务中,如图像增强、图像降噪、细节增强、超分辨率恢复等。像素级的处理通常是对单个像素点或者某个像素点周围区域进行处理。例如,对于图像降噪的任务,常见的算法会采用高斯滤波器等滤波算法对图像中每个像素点进行平滑处理[1]。最早提出、首个搭载,不一定最终