找回密码
 立即注册
搜索
热搜: 淘宝 补单 抖音
查看: 40741|回复: 0

【老梁AI电商】Sora即将发布?OPenAI-Sora视频生成远超Runway与Pika?

[复制链接]

11

主题

43

回帖

87

积分

注册会员

积分
87
发表于 2024-9-9 08:18:06 | 显示全部楼层 |阅读模式




OPenAI-Sora视频生成远超Runway与Pika?
更多内容
LAO LIANG AI

GPT-5还未发布,OpenAI就在春节开工前推出了一个引爆全球AIGC的流量炸弹SoraAI生成视频模型。据了解此模型仍在测试中,仅少数的外部人士和openAI员工获得使用访问权,还未广泛的发布用户使用名额。许多人表示Sora视频模型将远超Runway与Pika!老梁今日就来带大家聊聊,Sora到底有何如此强大的视频生成功能与视觉效果能远超前两位“AI视频模型前辈”?



Sora“吊打”Runway和Pika?
LAO LIANG AI



在Sora未发布之前,Runway和Pika都被认为是AI视频生成赛道的佼佼者。Sora发布之后,很多人认为,它凭一己之力已经轻松“吊打”且“干翻”这两款Runway和Pika。与此同时,在Sora发布后,Runway与Pika的两家创始人与CEO分别在不同平台上发布到:“比赛开始了和我们已经在筹备直接冲,将直接对标Sora。”



甚至国外网友还将Sora官宣的同款视频直接来与Runway和Pika等AI视频模型生成的类似视频相比较,Sora一次可支持60秒的文生视频,两外Runway和Pika等AI视频模型的文生视频功能,无法做到一次生成60秒的长视频。

Sora最震撼的技术
LAO LIANG AI



Sora最震撼的技术突破之一在于其输出的视频时长。Runway能够生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。Stable Video也提供4秒的视频,Pika则提供3秒的视频。在这一方面,Sora以1分钟的时长向“AI视频模型前辈”对手们提出了挑战。



Sora作为AI视频模型,可根据文本指令创建现实且富有想象力的场景,能够生成具有多个角色、特定类型的运动,以及主体和背景的准确细节的复杂场景的高清视频,一次生成视频时长可达一分钟,这是目前已发布的AI视频模型中前所未有的一个时长突破。

Sora功能与视觉
LAO LIANG AI



接下来我们重点看看SoraAI生成视频模型的突出功能与视觉特色。Sora对语言的理解也达到了一个新的层级,使其能够准确地理解提示词,并生成表达充满活力的情感的视频。它建立在过去对DALL·E和GPT模型的综合研究之上,提出了一种新的模型可能。它不仅可以理解用户在提示中提出的要求,还能理解它们在物理世界中的存在方式。


一、SoraAI生成视频模型的突出功能:除了文生视频功能之外还有以下功能。

1.通过图像和视频进行提示
Sora 可以通过其他输入进行的提示,如预先保存的图像或视频。此功能使 Sora 能够执行各种图像和视频编辑任务 - 创建完美的循环视频、动画静态图像、及时向前或向后扩展视频等。



2.扩展生成的视频
Sora 还能够在时间上向前或向后扩展视频。可以使用此方法向前和向后扩展视频以产生无缝的无限循环的运动视频。如下面的这个视频,它们都是从生成的视频片段开始向后延伸的。



3.视频到视频编辑
扩散模型启用了多种根据文本提示编辑图像和视频的方法。SDEdit,(32)到索拉。这项技术使 Sora 能够零镜头地改变输入视频的风格和环境。



4.连接视频
还可以使用 Sora 在两个输入视频之间逐渐进行插值,从而在具有完全不同主题和场景构成的视频之间创建无缝过渡。如中心的视频插值在左侧和右侧的相应视频之间。



5.图像生成能力
Sora 还能够生成图像。可在时间范围为一帧的空间网格中排列高斯噪声块来实现这一点。该模型可以生成各种尺寸的图像,分辨率高达 2048x2048。



6.不同场景的模拟功能
Sora 能够模拟现实世界中人、动物和环境,如3D模型世界、模拟虚拟的游戏数字世界等



二、SoraAI生成视频模型的视觉特色:

1.可变的持续时间、分辨率、宽高比
过去的图像和视频生成方法通常会将视频调整大小、裁剪或修剪为标准尺寸,例如,分辨率为 256x256 的 4 秒视频。我们发现,对原始大小的数据进行训练有几个好处。



2.采样灵活性
Sora 可以采样宽屏 1920x1080p 视频、垂直 1080x1920 视频以及介于两者之间的所有视频。这使得 Sora 可以直接以其原生宽高比为不同设备创建内容。它还使我们能够在以全分辨率生成之前快速以较低尺寸制作原型内容 - 所有这些都使用相同的模型。



3.真实的镜头生成效果在生产多机位镜头视频时,视频可以保留人、动物和物体,即使有被遮挡或离开框架的运动物体。同样,它可以在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观,视频镜头视觉效果更加真实与连贯性。


从OpenAI官方公布的Sora视频制作测试结果来看,其视频制作的真实感的视觉效果,能超越Runway和Pika两大视频模型功能也是说不定!老梁的线下AI电商企业实操课也即将上线,小伙伴时刻关注啊,不然抢不到座位号,也可直接后台私信老梁预定名额哦!
END
往期推荐:

【老梁AI电商】国内外两大AI更新进入内测,会给你带来多大惊喜?

【老梁AI电商】GPT-4.5被取消?更新mentions功能可直奔GPT5代?

这款AI工业级电商神器到底有多火?10秒助你实现批量制图!

一分钟训练Chatgpt写详情页,单品月销可达上百万?

30s内,一键轻松打造砖石质感的商品营销视频!

AI赋能|电商大佬们如何重塑产品营销的全流程?



扫码关注·带你解锁更多AI新技能!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋| 电商在线-淘江湖淘宝卖家论坛 ( 湘ICP备2021012076号|湘ICP备2021012076号 )

GMT+8, 2024-12-22 17:30 Powered by Discuz! X3.5

快速回复 返回顶部 返回列表