要知道什么
- 谷歌已向所有美国用户提供其最新的人工智能图像生成模型 Imagen 3。
- Imagen 3 可以创建高度逼真的图像并理解复杂的文本提示。
- 该模型可通过 Google 的 ImageFX 工具和 Vertex AI 平台访问。
谷歌在 5 月份的 Google I/O 大会上首次宣布,已宣布使用其最新的用于创建图像的人工智能模型 Imagen 3。这一先进工具现已向美国所有用户开放,标志着人工智能图像生成领域迈出了重要一步。
据称,Imagen 3 可以通过理解和解释复杂的文本提示来生成高度逼真的图像,并允许用户创建详细且特定的图像。该模型能够生成各种视觉内容,从简单的对象到复杂的场景。谷歌在其声明中解释了这项技术DeepMind 研究论文。
谷歌发布 Imagen 3
我们引入 Imagen 3,这是一种潜在扩散模型,可以根据文本提示生成高质量图像。我们描述我们的质量和责任评估。 Imagen 3 优于其他最先进的 (SOTA)…pic.twitter.com/sjn5QRKtPW
—AK(@_akhaliq)2024 年 8 月 14 日
谷歌声称,与早期模型相比,该版本生成的图像视觉缺陷更少。人工智能还可以在图像中生成文本,例如个性化消息或演示幻灯片。
Google 通过两个主要渠道提供 Imagen 3。创意专业人士可以将其作为私人预览来访问图像特效,一款专为图像创建和编辑而设计的工具。用户还可以通过以下方式访问 Imagen 3顶点人工智能,Google 面向开发者的机器学习平台。
该公司强调 Imagen 3 提高了对自然语言的理解。这一增强功能使模型能够捕获并合并冗长文本描述中的精细细节,从而生成更准确、更细致的图像。
谷歌发布 Imagen 3 是其不断推进人工智能技术的努力的一部分。该公司不断开发和完善其人工智能模型,旨在为图像创建和操作提供更强大和用户友好的工具。
随着人工智能图像生成技术的发展,它引起了各个领域的兴奋和担忧。可以理解的是,该公司正在利用这一有限的美国版本来确定在更广泛的发布之前的改进空间。