Sora正式发布,一键生成长达20秒1080p高清视频

12/10/2024, 9:08:58 AM | 热度:102 | 阅读本文需 4 分钟

点赞

谁能想到今年年初爆火的 Sora 如今终于发布了,期间Runway Gen 2、Pika、可灵、海螺等等国内外 AI 生成视频工具不断出新迭代,从实现几秒钟内的流畅连贯性问题,到现在 Sora 能够制作出 20 秒的连续视频,保持视频中的主角和背景人物展现出了惊人的一致性,镜头之间的切换流畅自如,人物形象始终保持着极高的稳定性,无疑又是一次历史性时刻。

image.png

亮点

image.png

据OpenAI介绍,Sora允许用户生成最高 1080p、最长 20 秒、宽屏、竖屏或方形的视频。他们开发了新的操作界面,以便更轻松地使用文本、图像和视频提示 Sora。

在创作视频的过程中,用户还可以使用Remix(混搭)、Re-cut(重剪)、Storyboard(故事板)、Loop(循环)、Blend(混合)和Style presets(风格预设)等功能。

Remix

用户可以使用 Remix 替换、删除以及重新构想视频中的元素,有点类似于视频的局部重绘

Re-cut

找到并分离出最佳帧,向前或向后延伸它们以完成(新)场景,通过挑选合适的视频帧,我们可以重新拓展视频场景

Storyboard

在时间线上组织和编辑视频的独特序列,精确控制视频的分镜头发展,从而讲述新故事

Loop

使用Loop剪辑并创建无缝循环的视频

Blend

将两个视频合并为一个无缝剪辑

Style presets

使用预设创建和分享激发您想象力的风格

视频生成模式

  1. 文本到视频(Text-to-Video)模式:这是Sora的核心功能之一,它允许用户仅通过输入文本描述就能生成完整的视频内容。依托于先进的自然语言处理技术和生成模型,Sora能够准确把握文字的精髓,将其转化为生动的视觉画面。无论是制作简短的短视频还是构建情节丰富的叙事视频,这一模式都能帮助创作者轻松实现他们的创意构想。

  2. 文本+图像到视频(Text+Image-to-Video)模式:在这一模式下,用户不仅可以提供文本描述,还能上传图像来辅助视频的生成过程。通过结合文本和图像,Sora能够更精确地理解并展现创作者的创意意图,制作出更符合视觉预期的视频内容。这一功能特别适合需要在视频中融入特定图像元素的场景,如广告制作、产品展示等,为创作者提供了更多的创意空间。

  3. 文本+视频到视频(Text+Video-to-Video)模式:Sora还提供了视频编辑和转换的功能,用户可以上传已有的视频素材,并结合文本描述进行修改或扩展。这一模式让用户能够在现有视频的基础上,添加新的情节、细节,甚至创作出全新的版本或完全不同的内容。例如,用户可以对现有的广告视频进行重新编辑,加入新的对话、场景或动画效果,从而提升视频的吸引力和表现力。



Sora Turbo

Sora 的技术突破在于其预览方式更快、更便宜,且能够生成高质量的视频。Sora Turbo 是原始Sora模型的高端加速版本,包含了从文本生成视频、动画图像以及大量视频到视频的功能,如重新混合成新的风格、向前扩展和及时包装等。

image.png

定价

image.png

在订阅方案上,OpenAI目前只向订阅用户开放Sora的使用权。

ChatGPT Plus用户( 20 美元/月)每月可以生成最多 50 个优先视频,分辨率可达720p,时长为 5 秒。

几天前新推出的ChatGPT Pro订阅服务( 200 美元/月)则具备更多优势,包括无限制生成次数、最多 500 个优先视频、1080p的更高分辨率,以及长达 20 秒的视频时长。Pro用户还可以同时进行 5 个视频的生成,并下载无水印视频。

值得注意的是,OpenAI给不同订阅服务设定了不同的点数:Plus为 1000 点/月,Pro为 10000 点/月,而每月优先视频的生成数量是由点数决定的,时长更长、质量更高的视频可能会消耗更多点数。

总结

不管从技术还是从视频质量上来看 sora 必将是 AI 视频领域的又一王炸,不过产品的定价还是非常昂贵的,普通人应该是比较少会用上,除了对 AI 视频有实际需求的工作者。


3

继续阅读本文相关话题

本文收录于专题

Midjourney教程

共收录篇

查看本专题

文章目录

亮点

视频生成模式

Sora Turbo

定价

总结

AI教程交流群

扫描二维码加入群聊

与同行学习交流&资源共通