05-14 17:36
sora的结果是挑出来的,就这样还有单侧腿连续跑步的bug,很多人只是看个热闹而已
你可以说 OpenAI 不务正业,没有全力以赴去搞模型的推理能力,反而分散兵力去搞了一些产品化的探索。(这确实让人对他们的 AGI 愿景感到迷惑)
Sora 、GPT-4o Voice Mode 的技术都是一说出来,业内的专家纷纷表示,原来就是 DiT、ViT、VAE 或端到端的文本、视觉和音频模型啊,但就是没有人提前做出类似的产品,甚至在别人推出很久之后,还很难在效果上追得上。
在外网上已经看到 Meta 等公司的人对 GPT-4o 不服了,认为其在技术方面并不出众,甚至认为 OpenAI 已经进入到 cheap 的产品阶段。
但这又有什么不好呢?又何况伟大也不可以被计划。[doge]
最后说一句,GPT-4o Voice Mode 的情绪真的拉满,有那么几个 demo 让人动容。