正如 AI 电影《山海奇境》制作人、星贤文化陈坤告诉光锥智能,“OpenAI 在向我们展示它在视频方面的能力,但真正的目的在于获取人们的反馈数据,去探索、预测人们想要生成的视频是什么样的。就像大模型训练一样,一旦工具开放,就相当于全世界的人在为其打工,通过不断标记、录入,让其世界模型变得越来越聪明。”
“模拟”之所以能够如此炸裂,根本的原因在于,用大模型创造出不存在的事物人们已经习以为常,但是能够准确地理解物理世界运转逻辑,例如力是如何相互作用的,摩擦是如何产生的,篮球是如何打出抛物线的等等,这些都是以前任何模型都无法完成的事情,也是 Sora 超越视频生成层面的根本意义所在。
不过,从 demo 到实际成品,可能是惊喜也可能是惊吓。Meta 首席科学家杨立昆就直接对 Sora 提出了质疑,他表示: “仅凭能够根据提示生成逼真的视频,并不能说明系统真正理解了物理世界。生成过程与基于世界模型的因果预测不同,生成式模型只需要从可能性空间中找到一个合理的样本即可,而无需理解和模拟真实世界的因果关系。”
齐镗泉也表示,虽然 OpenAI 验证了基于世界模型的文生视频大模型是可行的,但也存在物理交互的准确性难点,尽管 Sora 能够模拟一些基本的物理交互,但它在处理更复杂的物理现象时可能会遇到困难;长期依赖关系的处理存在挑战,即如何保持时间上的一致性和逻辑性;空间细节的精确性,处理空间细节方面如果不够精确,可能影响到视频内容的准确性和可信度。
颠覆视频,但远不止视频
Sora 成为世界模拟器或许是很久以后的事情,但是就生成视频而言,已经对现在的世界产生了影响。
第一类就是解决之前技术上面无法突破的问题,推动一些行业迈向新的阶段。
最典型的就是影视制作行业,Sora 这回最具革命性的能力就是最长生成视频长度达到了1分钟。作为参考,大热门 Pika 所能生成的长度在3秒、Runway 的 Gen-2 生成长度在18秒,这意味着有了 Sora 以后,AI 视频将能成为真正的生产力,实现降本增效。
陈坤告诉光锥智能,在 Sora 诞生前,其利用 AI 视频工具制作科幻电影的成本已经下降至了一半,Sora 落地后,更加值得期待。
Sora 发布后,令他印象最深刻的是一个海豚骑车的 demo。在那个视频中,上半身是海豚,下半身是人的两条腿,腿上还穿了鞋子,在一种极具诡异性的画风中,海豚完成了作为人骑自行车的动作。