生成式人工智能很快就取得了长足的进步。在过去的几天里,我和我的亲戚甚至我的纹身师进行了几次交谈,讨论人工智能是如何慢慢渗入各个行业的,而只有正确理解人工智能的工作原理,才能向前迈进。现在,谷歌刚刚推出了一款新的生成式人工智能工具 Lumiere,它可以帮助你通过基于文本的命令创建更逼真的图像和视频。
谷歌的 Lumiere 再次证明,人工智能就是未来,我们无法改变它。
Lumiere 的一大亮点是,它能够创建看起来逼真且没有锯齿的动态图像。之所以能做到这一点,是因为该软件能在同一时间创建所有视频帧,而不是先使用关键帧,然后再对其进行训练,以了解动作应该如何进行。这听起来可能并不令人印象深刻,但有了最新的生成式人工智能工具的帮助,我们就能走得更远,创造出令人惊叹的作品。
Lumiere 还使用扩散概率模型来帮助生成图像。这与时空 U-Net 相结合。对于那些不了解的人来说,U-Net 是一种架构,可带来时间上的放大和缩小,以及添加到图像中的注意力区块。最棒的是,这种新的生成式人工智能工具可以与许多其他模型一起使用,这将有助于创建比我们以前看到的任何东西都更加逼真的图像和视频。
Lumiere 可用于创建以下内容:
- 电影胶片:将图像的单一部分制作成动画
- 内画:将视频中的一个物体替换成另一个物体
- 风格化生成:任何创作的艺术风格都可以改变为其他风格
- 图像到视频:帮助制作任何所需的图像动画
- 视频到视频:允许用户以不同的艺术风格创建视频
在撰写本文时,视频长度仅为 5 秒,而且还不具备创建视频转换和多角度摄像的功能。值得注意的是,如果你想试用 Lumiere,仅靠一个标准的 GPU 是不行的。你的电脑必须有强大的图形处理能力,否则该工具根本无法运行。
从各种角度来看,Lumiere 的推出听起来确实很有趣。就在昨天,我还在和我的纹身师谈论他是如何利用人工智能为他的客户创作出几幅纹身的,因为他的客户正在寻找一种以前从未创作过的东西。我只能想象这些工具在不久的将来会有多么强大,我希望这些工具不会被坏人利用,他们只会制造混乱。
来源:Lumiere