​Sora出手后,它的同行们都咋样了?

Sora出手后,它的同行们都咋样了?

距离 OpenAI 亮出 Sora 这张王牌,已经快一个月了。

东西么,是一直没大规模开放使用,但热度,却从来不缺。

反正光是靠着在 TikTok 上更新 Sora 的视频, OpenAI 的官方账号就已经涨了数十万粉。

像什么搞房屋设计。

外星人在纽约化身 gai 溜子。

博物馆一镜到底。

还有一男一女在铁磁流体餐厅里赛博约会。

看看这丝滑程度,相比之下,原本那些被吹上天的   "AI 视频老网红们   "  ,多少有点汗流浃背了。

有网友锐评:xx 刚出来的时候很感动,现在怎么不敢动了?

其实吧, Sora 的那些友商们,并没大伙儿想得这么怂包,他们的更新频率好像还更快了。

世超甚至觉得,经过 Sora 这么一番轰炸, AI 视频生成的战场,才真正热了起来。

先是 Stability AI 带头发起冲锋,把 Stable Video 拿出来公测,接着包括 Pika 、谷歌还有阿里在内的好几家公司,也都坐不住了。

咱也先讲讲剑走偏锋的两位,阿里   EMO   和   Pika  

他们没选择和 Sora 硬刚,而主打对口型,基本等于明牌暗示大家:  "   你们以后用 Sora 生成的视频,可以用我来配音对口型噢   ~~  。

就拿 EMO 为例,上传一张照片和一段音频,就能让照片里的人开口唱歌、说话。像什么小李子唱 Rap ,还有蒙娜丽莎开口说话都不在话下。

看看这个 Sora 皮衣女士,一开口就是乐坛老炮儿了。

另外,跟 EMO 发布差不多时间,国内的 Pika 也小小更新了一波。

新上了个  Lip Sync   功能,说白了就是给视频配音对口型。

现在分币不花就能用,但估计太多人把服务器给干崩了,世超每次都卡在了最后一步。。。

但同样都是对口型, EMO 的效果明显要比 Pika 强不少。Pika 的口型虽然是对上了,但根据创作者   @  数字生命卡兹克的测试,说话的时候嘴还是没法子避免乱动的毛病。

寻找配音、对口型这种 AI 视频生成领域的小切口,确实是一种思路。

同样,为了和 Sora 打出差异化,以色列有家公司,就在内测一个叫做 LTX Studio 的 AI 电影制作平台。

而他的思路则是:大而全

根据官方的说法,它能生成超过   25   秒的视频,但最重要的,它把视频生成、编辑、旁白配音一条龙全给包了。

就比如生成个画面你不是很满意,那你可以切个机位或者换个光线,或者把画面里的东西给换掉。

特别是,官方声称能保证角色的一致性

以往的文生视频,保不齐上一帧还是吴彦祖,下一帧可能就变成宋小宝了。

如果 LTX Studio 真能把角色一致性给解决,那世超是真 respect 。

而谷歌就更夸张了,号称是搞了个世界模型 Genie ,这玩意儿能根据一张照片或者几句简短的描述就生成一个 2D 游戏出来。。。

虽然画质有点惨不忍睹,但光凭一张图片就能整个虚拟世界出来。

果然对谷歌还是激将法更管用。

不过,上面提到的这几个应用世超几乎都没法上手,唯一方便亲自体验的,只有 Stability AI 他们家藏了四个多月的 Stable Video (  下称 SV )。

而也和上面几个避   Sora   锋芒、主打各种差异化的老哥不同,Stable Video   是完完全全正面受敌。。

先给大伙儿回忆回忆,当时的 demo 是这样的。

模型能力评估,还超过了 Runway 和 Pika 。

所以这次在 Sora 的节骨眼上发布公测,大伙儿还挺期待 SV 能狠狠将 Sora 一军。

但当世超上手试了试之后发现,是我不懂事了。。。

在 SV 官网,有图像生成和文字生成两个选择,我直接把跟 Sora 那个火出圈的视频提示词喂给了 AI 。

它先是根据提示词,生成了四张图像让我选。

接着,再手动把镜头运动的方式也设置下,等个十分钟,就能生成一条  4   秒的视频。

但不知道模型抽哪门子的风,背景全是乱的。

世超换了种镜头运动方式又试了一次,脸部、背景变形愣是一样没落下。。。

难道是因为提示词太难了?

不信邪的我又换了几组简单的,倒是也有像样的。

但十个里起码七个都翻车了,甚至还有在图像生成就开始发癫的,我说城门楼子,他生成胯骨肘子。。。

这么说吧,SV   给我的感觉就是能跟   Runway   和   Pika   打个平手,但 Sora ,还是算了吧。

不过测试看多了之后,世超发现 Sora 其实也并没有大家伙儿传得那么不可超越。

有外媒记者在拿到内测资格浅试一波之后,专门发了篇文章吐槽,  Sora   生成的视频让猴子长出了鹦鹉的尾巴,

还有国外 up 主,拿 Sora 生成了有六根手指头的人。。。

一句话总结就是,Sora 对物理世界的很多东西还理解不了,而且生成速度慢得离谱。

而且经 Sora 这么一搅合,整个 AI 视频圈子是更加活跃了,保不齐下次谁家更新又来了波大的。

世超也觉得,搞不齐会和大语言模型圈儿一个样, OpenAI 抛玉引玉, AI 视频生成领域的成果大爆发就在眼前。

对了,世超最后还想问一嘴, Sora 到底什么时候才能上手啊?

相关推荐

​TikTok弹窗,号召美国1.7亿用户反对封禁

​TikTok弹窗,号召美国1.7亿用户反对封禁

119

TikTok弹窗,号召美国1.7亿用户反对封禁 本文来自微信公众号:霞光社(ID:Globalinsights),作者:郭照川,编辑:韦伯,原文标题:《用魔法打败魔法,TikTok 弹窗号召美国 1.7 亿用户反...

​拜登称内塔尼亚胡没有底线,那美国?

​拜登称内塔尼亚胡没有底线,那美国?

103

拜登称内塔尼亚胡没有底线,那美国? 直新闻 是深圳卫视全媒体新闻品牌 由《直播港澳台》团队出品 参与评论请在新浪微博 @直新闻 据加沙地带卫生部门 9 日发布的数据,以军过去...

​黄仁勋给库克上压力

​黄仁勋给库克上压力

77

黄仁勋给库克上压力 出品 | 虎嗅科技组 作者 | 王欣 编辑 | 王一鹏 头图 | 视觉中国 时代变了。三年前,如日中天的苹果市值是英伟达的七倍。而今天, 英伟达市值与这位曾经的世界霸...

​蔚来卖出1700亿却亏866亿,投行还会相信李斌吗?

​蔚来卖出1700亿却亏866亿,投行还会相信李斌吗?

181

蔚来卖出1700亿却亏866亿,投行还会相信李斌吗? 留给李斌的时间不多了 作者 | 赵 普 编辑丨高远山 来源 | 野马财经 这是野马财经的第 3710 篇原创 本文约 2600 字,阅读时长约 7 分钟 蔚...

​岳麓山最高海拔多少米 岳麓山海拔有多少千米

​岳麓山最高海拔多少米 岳麓山海拔有多少千米

194

岳麓山最高海拔多少米 岳麓山海拔有多少千米 岳麓山海拔约为300.8米。岳麓山位于湖南省长沙市岳麓区,它是南岳72峰的尾峰,岳麓山是岳麓山风景名胜区核心景区之一,面积约5.28平方...

​邮局周日能邮寄东西 邮局周六可以寄东西吗

​邮局周日能邮寄东西 邮局周六可以寄东西吗

117

邮局周日能邮寄东西 邮局周六可以寄东西吗 可以的,邮局在星期天是会上班的。营业时间一般在早上8:30到下午18:00之间,在周末也可以邮寄物品或者钱款。不过,个别地区的营业网...

​用根达菜如何包饺子 根达菜包饺子怎么做

​用根达菜如何包饺子 根达菜包饺子怎么做

70

用根达菜如何包饺子 根达菜包饺子怎么做 可以清炒,可以做成鸡蛋根达菜、凉拌根达菜、耗油根达菜、腐乳汁胡豆炒牛根达菜等。根达菜做菜的时候一般把叶子摘掉,只将根茎留下来...

​一个鸡翅多少克重量 一个鸡翅多少克热量

​一个鸡翅多少克重量 一个鸡翅多少克热量

106

一个鸡翅多少克重量 一个鸡翅多少克热量 一般来说,一个生鸡翅重约89克,鸡翅中的瘦肉量约为30克,翅膀上的皮肤约为26克,一只生鸡翅占整个鸡肉产量的12%,由鸡翅尖,鸡翅中和鸡...

​一板鸡蛋30个有多少斤 鸡蛋30个有多少斤重

​一板鸡蛋30个有多少斤 鸡蛋30个有多少斤重

97

一板鸡蛋30个有多少斤 鸡蛋30个有多少斤重 一个鸡蛋大约为50g,也就是0.1斤,那么30个鸡蛋大约就是3斤重。不过这只是一般的情况下,因为现在市场上大部分卖的鸡蛋差别不大,但也要...

​亚铁氰化钾食盐有毒吗 卫生部

​亚铁氰化钾食盐有毒吗 卫生部

67

亚铁氰化钾食盐有毒吗 卫生部 亚铁氰化钾食盐没有毒。亚铁氰化钾是呈黄色结晶性的粉末,具有抗结性能,可用于防止细粉、结晶性食品板结。食盐长久堆放易发生板结,在食盐里添...

​坐30小时硬座的技巧 坐20小时硬座的技巧

​坐30小时硬座的技巧 坐20小时硬座的技巧

197

坐30小时硬座的技巧 坐20小时硬座的技巧 坐30小时硬座的时间很长,在这个时间中,可以和同座位的人聊天,打扑克牌,打发时间,或者拿手机看下电影,打一下游戏,看一下小说,如...

​周生如故西洲是西安吗 西州是西安吗

​周生如故西洲是西安吗 西州是西安吗

58

周生如故西洲是西安吗 西州是西安吗 西洲不是西安。古代的西洲主要指神州大地中的中原地区西边的部分,没有具体的地点。现代的西洲是三亚西部三亚湾与南海交界处的一个海上岛...