回复@章锴: 不是哦，我也是从别的渠道看来的，不是原创，不过我认为加大算力参数规模数据，再过个两代可能会涌现惊喜。而Op...

回复@章锴: 不是哦，我也是从别的渠道看来的，不是原创，不过我认为加大算力参数规模数据，再过个两代可能会涌现惊喜。
而OpenAI的Sora效果这么好，为什么呢？我猜可能和算力关系最大。OpenAI公布了一个算力对视频效果提升的影响：1倍算力时，勉强能认出是一条雪地里的狗，只不过更像是梦境里的，经常变形；4倍算力时，就不像在梦境了；32倍算力，就栩栩如生了。OpenAI自从GPT-3开始就坚信Tranformer模型大力出奇迹的规律，在Sora的研发中应该堆满了全部算力。而谷歌的投入未必有这么大。
OpenAI把Sora起名“世界模拟器”的原因是，它只通过看图就学会了生成世界和很多物理规律。比如，所有训练都是对二维图像的理解，但它已经可以很好地把握透视的立体效果了，它也可以很好地把控时间对物体变化的影响，时空规律里最重要的基本原则它已经掌握得差不多了。
这就和传统的游戏引擎不一样了。那些引擎是针对性地植入了很多今天已经发现的物理定律，比如说偏微分方程、100条，然后再在考虑运算量的基础上精确控制每个像素的变化，这才形成了水波或者毛发的效果。而Sora没有事先植入任何一条物理定律，它只是通过观看其他图片和视频就学会了这些。
在理解世界这一点上，世界上还有另外一家公司也做出了类似水准的产品，那就是特斯拉的视觉自动驾驶。
因为想要自动驾驶水平高，就要历遍各种可能的情况，尤其是那些老司机一辈子都难遇到几次的特殊情况，比如路面积雪的夜里，接近路口时是黄灯，对向车开着大灯晃你，这时突然有人横穿马路，这种情况下，驾驶员做怎么样的动作才安全。这需要在相同场景下反复训练。
也许自动驾驶汽车在真实路面会偶尔遇到，但不可能遇到50次，而训练如何应对这种特殊情况，要求反复5万次才可以。那就说明自动驾驶永远也不可能真正实现了吗？
不是。特斯拉靠的是自动生成路上驾驶的视频。同样一个路口，它可以训练各种方向转弯，日落余晖光下，日出阳光下，夜幕降临下，有滑板青年闯入的效果……这些自动生成的视频已经是最近两年特斯拉提升自动驾驶水平90%的驾驶经验来源了。特斯拉早就不依赖于真实路面的训练经验来提升自动驾驶了。//@章锴:回复@Menethil_:请问您是微博上的不是郑小康吗，我看那里也有个一模一样的分析，如果是的话我两边都关注一下，多跟您学习，谢谢~ 网页链接

作者：Menethil_

引用：