发布于: iPhone转发:0回复:0喜欢:0
回复@章锴: 不是哦,我也是从别的渠道看来的,不是原创,不过我认为加大算力参数规模数据,再过个两代可能会涌现惊喜。
而OpenAI的Sora效果这么好,为什么呢?我猜可能和算力关系最大。OpenAI公布了一个算力对视频效果提升的影响:1倍算力时,勉强能认出是一条雪地里的狗,只不过更像是梦境里的,经常变形;4倍算力时,就不像在梦境了;32倍算力,就栩栩如生了。OpenAI自从GPT-3开始就坚信Tranformer模型大力出奇迹的规律,在Sora的研发中应该堆满了全部算力。而谷歌的投入未必有这么大。
OpenAI把Sora起名“世界模拟器”的原因是,它只通过看图就学会了生成世界和很多物理规律。比如,所有训练都是对二维图像的理解,但它已经可以很好地把握透视的立体效果了,它也可以很好地把控时间对物体变化的影响,时空规律里最重要的基本原则它已经掌握得差不多了。
这就和传统的游戏引擎不一样了。那些引擎是针对性地植入了很多今天已经发现的物理定律,比如说偏微分方程、100条,然后再在考虑运算量的基础上精确控制每个像素的变化,这才形成了水波或者毛发的效果。而Sora没有事先植入任何一条物理定律,它只是通过观看其他图片和视频就学会了这些。
在理解世界这一点上,世界上还有另外一家公司也做出了类似水准的产品,那就是特斯拉的视觉自动驾驶。
因为想要自动驾驶水平高,就要历遍各种可能的情况,尤其是那些老司机一辈子都难遇到几次的特殊情况,比如路面积雪的夜里,接近路口时是黄灯,对向车开着大灯晃你,这时突然有人横穿马路,这种情况下,驾驶员做怎么样的动作才安全。这需要在相同场景下反复训练。
也许自动驾驶汽车在真实路面会偶尔遇到,但不可能遇到50次,而训练如何应对这种特殊情况,要求反复5万次才可以。那就说明自动驾驶永远也不可能真正实现了吗?
不是。特斯拉靠的是自动生成路上驾驶的视频。同样一个路口,它可以训练各种方向转弯,日落余晖光下,日出阳光下,夜幕降临下,有滑板青年闯入的效果……这些自动生成的视频已经是最近两年特斯拉提升自动驾驶水平90%的驾驶经验来源了。特斯拉早就不依赖于真实路面的训练经验来提升自动驾驶了。//@章锴:回复@Menethil_:请问您是微博上的 不是郑小康 吗,我看那里也有个一模一样的分析,如果是的话我两边都关注一下,多跟您学习,谢谢~ 网页链接
引用:
2024-02-28 18:36
$苹果(AAPL)$ 放弃造车令人钦佩,苹果要在这里赚快钱很简单,要在大组织里放弃这个项目不简单,牵扯多少人的利益。是一家好公司。