表意文字通过基于描述的引用来支持 AI 图像生成器

小椰子啊 • 2周前 APP

在推出其功能最强大的文本到图像模型一个多月后，Ideogram 推送了一项更新，为 AI 引入了几项新功能，包括基于描述的引用和否定提示。

这些功能可在 Ideogram 的 Web 平台上使用，旨在让用户更好地控制他们生成图像的方式，并提高输出的整体质量和连贯性。它加强了服务，标志着在图像生成领域接近竞争对手产品性能的又一显着步骤，包括 Midjourney 和 DALL-E。

这些功能可以立即进行测试，但并非所有功能都可供使用该平台免费版本的用户使用。

表意文字有哪些新功能？

当 Ideogram 在 2 月份推出其模型的 1.0 版时，用户得到了一个神奇的提示功能，可以扩展和详细说明用户给出的输入。现在，在构建这项工作时，该公司引入了一项新的描述功能，该功能可以从参考图像生成描述或标题。

从本质上讲，用户现在可以拍摄表意文字生成的公共图像或上传自己的图像，以获得基于文本的图像描述。然后，可以将此内容用作生成非常相似的图像的提示。如果需要，用户还可以对生成的描述进行更改，以根据自己的需要修改输出。

但还有更多。

除了参考图像的描述外，表意文字还添加了否定提示以及在平台上的快速、默认或质量模式之间进行选择的选项。顾名思义，前者将允许用户给出否定提示，并告诉模型他们不想在输出中看到什么。它旨在让用户删除某些对象或定制几代人的风格。

同时，后者将允许用户控制输出的生成速度。Ideogram说，快速模式将在大约五秒内产生图像，具有非常基本的质量，而质量模型将专注于照片级真实感和细节，但大约需要20秒。默认模式将介于两者之间，在两个方面保持平衡，大约需要 12 秒。

虽然有多少用户实际使用这些模式还有待观察，但 Ideogram 表示，用户可以使用这些选项快速生成基本图像，然后对其进行迭代以获得高质量的结果。

最后，Ideogram 还表示，它正在通过最新更新增强文本渲染，将错误率进一步降低 15%。这不是一个很大的变化，但该公司表示，在制作角色和文字时，它的表现优于 DALL-3 Vivid。

表意文字没有分享将升级后的模型与Midjourney进行比较的统计数据，Midjourney在AI图像生成类别中处于领先地位。然而，它确实声称该模型在输出中提供了增强的图像连贯性和照片级真实感，并且比人类评分者更喜欢最后一个版本。

“人类评分者更喜欢升级后的模型生成的图像，在提示对齐、图像连贯性和文本渲染质量方面比以前的版本高出 30-50%，”该公司自去年推出公开测试版以来已经吸引了超过 700 万创作者，在一篇博客文章中写道。

目前，负面提示和新的速度模式仅限于为 Ideogram 的 Basic 和 Plus 计划付费的用户。目前尚不清楚参考图像字幕的可用性，尽管我们怀疑它可能是免费的，因为它与该公司提供的 Remix 功能大致匹配，让用户生成与现有参考图像类似的图像。文本和图像连贯性增强功能也可供所有用户使用。

椰有料原创，作者：小椰子啊，转载请注明出处：http://www.studioyz.com/5964.html