您现在的位置是：主页>互联网 >内容

互联网

TikTok的MagicVideo V2可以使用文本创建视频的 AI

2024-01-15 09:18:03互联网传统的飞鸟

如今，已经具备了创建逼真图像的能力，这并不奇怪。AI视频生成Midjourney、DALL-E 3 和 Stable Diffusion 等著名示例在该领域展示了令

如今，已经具备了创建逼真图像的能力，这并不奇怪。

AI视频生成

Midjourney、DALL-E 3 和 Stable Diffusion 等著名示例在该领域展示了令人印象深刻的能力。然而，当涉及到视频生成时，情况发生了变化。

尽管像 Pika 或 Morph 这样的模型取得了相当不错的结果，但与TikTok 母公司最近宣布的模型 MagicVideo-V2所承诺的目标仍然相去甚远。

在项目网站上，您可以找到使用该人工智能生成的多个视频，其结果确实令人印象深刻。它们不仅因其显示的细节水平而脱颖而出，而且还因其图像的卓越一致性而脱颖而出。

MagicVideo-V2 如何工作?

MagicVideo-V2由四个基本模块组成：文本到图像(T2I)、图像到视频(I2V)、视频到视频(V2V)和帧插值模型。

据创建者称，T2I 模块能够根据输入的提示生成 1,024 x 1,024 像素的图像。然后，I2V 模块对该图像进行动画处理，生成分辨率为 600 x 600 像素的 32 帧。

第三步，V2V 模块将分辨率提高到1,048 x 1,048 像素，最后，插值模块将序列扩展到 94 帧。

与其他工具的比较

自然地，创作者们分享了使用相同的提示与使用人工智能的各种视频生成模型获得的结果。

根据提供的图像，字节跳动开发的模型取得了明显优于竞争对手的结果，但公平地说，Stable Diffusion Video 和 Pika 在某些情况下仍然具有竞争力。

差异在于，竞争型号可供使用，而 MagicVideo-V2似乎无法进行评估，至少目前是这样。