AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

2024-04-16 133 其它文章

文章来源:AI鲸选社

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


众多周知,字节跳动在All in AI。毕竟2023年净利润3000亿(字节否认了),要为自己准备下一阶段的发展动力。

此前鲸选盘点过字节推出的很多AI 产品,大多是AI对话类。在文生图和文生视频领域,字节目前似乎在倾力打造Dreamina,这款AI产品对标国外的Midjourney和Sora,难度不小。

最近Dreamina在放内测资格,到底哥为你带来一手测评。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

 文生图片能力,还有努力的空间

文生图片很多时候不仅考验生成视频的精细度,也考验对文字的理解能力,我们就做一个“耳朵是蝴蝶翅膀的大象”。

从生成结果看,完全没有体现出来文字想要表达的创意。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们看到有上传参考图的功能,所以上传了这张比较有名的创意图。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们选择了主要参考点是主体,Dreamina识别出了这张图的主体是大象。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们在选择写实风格,有了参照图后,生成的图片终于理解了文字的意思, 不过这图片,怎么感觉像抠图后加上背景生成的呢?

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

文生视频能力,不是Sora路线

我们先看看Dreamina社区中,一些文生视频的案例。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


是不是还挺酷炫,要知道Sora生成水杯破裂的视频,是不能够了解破裂过程应该如何呈现,而Dreamina这个视频,则是理解了物理规律,还加上了想象力的翅膀。

到底哥以为文生视频能力会很酷炫,直到我看到了它的参考图。


AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我瞬间意识到,Dreamina应该和Pika等AI视频的路线相似,就是图片关键帧动起来,所以并不是对文字的真正理解,以及视频画面的原生,而是几秒钟的关键帧运动。

所以我们接着拿蝴蝶大象做生成测试,没有意外,视频也没有体现文字的意思,还是一只大象动了几秒钟。


AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


一位同样从事Sora产品跨国开发的负责人,告诉AI鲸选社,这是Dreamina跨域和泛化问题还没处理好。

虽然Dreamina还存在一些问题,但其从头研发,并且比Sora更早开放测试,证明其还是有决心和潜力做更好,期待其迭代版本。

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥3,671.25亿
2 欧易OKX欧易OKX ¥1,317.06亿
3 火币全球站火币全球站 ¥130.80亿
4 抹茶抹茶 ¥179.61亿
5 芝麻开门芝麻开门 ¥256.21亿
6 库币库币 ¥99.17亿
7 Coinbase ProCoinbase Pro ¥72.39亿
8 bitFlyerbitFlyer ¥2.57亿
9 BitMEXBitMEX ¥0
10 BitstampBitstamp ¥6.09亿