OpenAI 今日在 X 发布了最新的文字转视频模型 Sora,只需要简单的描述性文字,就可以生成长达 60 秒的视频,其中包含高度详细的场景、正在运动的镜头,以及充满活力的多个角色。@Appinn

OpenAI Sora - 文字转视频模型:输入描述性文字,获得,生成长达一分钟的视频

从生成文字、图片、声音,到生成视频,这是一条必然的路,虽然之前也有一些模型可以实现文字转视频,但 OpenAI Sora 生成的视频,可以直接拿来就用。

比如,你是一位美食视频创作者,想要拍摄翻山越岭去寻找食材的镜头,真的可以不用去现场了

先坐火车去目的地:

提示词:穿过东京郊区的火车车窗上的倒影。

再开越野车进山:

只需要使用以下提示词(Prompt):

镜头跟在一辆带黑色车顶行李架的白色复古越野车后面,越野车在陡峭的山坡上沿着松树环绕的陡峭土路上飞驰,轮胎上的尘土飞扬,阳光照在越野车上,越野车在土路上飞驰,给整个场景投下了温暖的光辉。
土路缓缓弯向远方,看不到其他车辆。道路两旁的树木都是红杉,还有零星的绿色植物。

从后方看,汽车轻松地沿着弯道行驶,仿佛在崎岖的地形上行驶。土路本身被陡峭的丘陵和山脉环绕,头顶是晴朗的蓝天和飘渺的白云。

对于像青小蛙这样的业余视频制作者来说,可以实现很多想象中的转场镜头了,不需要复杂的剪辑技术

而对于 OpenAI 的一系列模型,青小蛙总有一种感觉:OpenAI 可能会淘汰掉一批普通的创作者,留下来善于利用 AI,结合自身想象力的创造者,带来一波升级。

Sora 的缺陷

OpenAI 自己也描述了现在的缺陷:

它可能难以准确模拟复杂场景的物理原理。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。该模型还可能会混淆左右,例如一个人在跑步机上跑步,但是跑向反方向。

Sora 的安全

对于想用 Sora 生成敏感小视频的同学大可放心,它会自动检查很多敏感内容,例如要求极端暴力、性内容、仇恨图像、名人肖像等。

提示词:相机正对意大利布拉诺色彩缤纷的建筑。一只可爱的斑点狗透过一楼建筑的窗户向外张望。许多人沿着建筑物前的运河街道步行和骑自行车。

获取

  • https://openai.com/sora

需要注意的是,目前公众还无法使用 Sora,只有部分人可以使用(安全评估人员、少数视觉艺术家、设计师和电影制片人访问)需要等待技术下放。

从 ChatGPT 诞生至今,也不过短短 14 个月,我们不止在见证历史,还在经历历史。

原文:https://xbcpy.com/