谷歌推出 Lumiere 生成式人工智能：可以用文本创建逼真的图像和视频-电脑志

生成式人工智能很快就取得了长足的进步。在过去的几天里，我和我的亲戚甚至我的纹身师进行了几次交谈，讨论人工智能是如何慢慢渗入各个行业的，而只有正确理解人工智能的工作原理，才能向前迈进。现在，谷歌刚刚推出了一款新的生成式人工智能工具 Lumiere，它可以帮助你通过基于文本的命令创建更逼真的图像和视频。

谷歌的 Lumiere 再次证明，人工智能就是未来，我们无法改变它。

Lumiere 的一大亮点是，它能够创建看起来逼真且没有锯齿的动态图像。之所以能做到这一点，是因为该软件能在同一时间创建所有视频帧，而不是先使用关键帧，然后再对其进行训练，以了解动作应该如何进行。这听起来可能并不令人印象深刻，但有了最新的生成式人工智能工具的帮助，我们就能走得更远，创造出令人惊叹的作品。

Lumiere 还使用扩散概率模型来帮助生成图像。这与时空 U-Net 相结合。对于那些不了解的人来说，U-Net 是一种架构，可带来时间上的放大和缩小，以及添加到图像中的注意力区块。最棒的是，这种新的生成式人工智能工具可以与许多其他模型一起使用，这将有助于创建比我们以前看到的任何东西都更加逼真的图像和视频。

马斯克表示：到 2024 年底特斯拉的人工智能将相当于 85,000 件 H100 芯片

Lumiere 可用于创建以下内容：