Midjourney V6 在这里带有图像文本和完全检修的提示

Midjourney V6 在这里带有图像文本和完全检修的提示

称其为节日礼物:Midjourney 第 6 版是 David Holz 创立的同名研究集体的流行图像生成 AI 模型的最新和最伟大的迭代,昨晚作为 alpha 版本发布——一些高级用户已经对它带来的改进感到欣喜若狂。VentureBeat 使用 Midjourney 和其他 AI 艺术工具来生成文章图像。

在这些新功能中,有大幅改进和更逼真、高度详细的图像,以及让模型在图像中生成清晰文本的能力,这是 Midjourney 自 2022 年发布以来一直没有实现的,即使其他竞争对手的 AI 图像生成器,如 OpenAI 的 DALL-E 3 和表意文字已经推出了这种类型的功能。

“这个模型可以生成比我们以前发布的任何图像都更逼真的图像,”霍尔茨在Midjourney Discord服务器上发布的一条消息中写道,该服务器拥有超过17万会员。Holz说,V6实际上是“在我们的AI超星系团上从头开始训练的第三个模型”,花了九个月的时间开发。

如何启用 MJ V6?

默认情况下,更新不会对用户生效——至少,它对我没有生效。您需要在 Midjourney Discord 服务器中键入斜杠命令“/settings”,或者在给 Midjourney 机器人的直接消息 (DM) 中键入,然后使用顶部的下拉菜单选择 V6。或者,您可以采用老式方式,并在提示后手动输入“–v 6”。

MJ V6 有什么新功能?

具体来说,Holz提到了几个新功能,包括:

  • “更准确的提示跟随以及更长的提示
  • 提高一致性和模型知识
  • 改进了图像提示和混音
  • 次要的文本绘制能力(您必须以“引号”和 --style raw 或更低的 --stylize 值编写文本可能会有所帮助)

/imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6

  • 改进的升频器,具有“微妙”和“创造性”模式(将分辨率提高 2 倍)”

鼓励采用新的提示方法

Midjourney项目的创始人和负责人还澄清说,已经开发了一种全新的提示方法。

Midjourney 的提示——用户如何通过在 Discord 服务器或网站的 alpha 版本中输入特定的文本描述和关键词来生成图像——长期以来一直有些深奥和技术性,用户在社交媒体上分享了对他们行之有效的技术示例,例如包括相机名称(例如徕卡 M11)、胶片(35 毫米)、 和分辨率 (8k),以从 AI 模型中获得高质量、逼真或电影效果。

然而,Holz 在他的 Discord 帖子中明确表示,这些类型的提示技巧将不再导致用户想要的结果类型。“你需要重新学习如何提示,”他写道。

  • “V6 的提示与 V5 有很大不同。您将需要“重新学习”如何提示。
  • V6 对您的提示更加敏感。避免“垃圾”,例如“获奖、逼真、4k、8k”
  • 明确说明你想要什么。它可能不那么有活力,但如果你是明确的,它现在更能理解你。
  • 如果你想要一些更摄影/不那么固执己见/更直白的东西,你可能应该默认使用 --style raw
  • 较低的 --stylize 值(默认值为 100)可能具有更好的提示理解,而较高的值(最多 1000)可能具有更好的美感
  • 请在提示聊天中互相聊天,以弄清楚如何使用 v6。

初步结果

在写这篇文章之前,我今天早上自己简短地测试了 MJ V6,很抱歉地说,到目前为止,至少对我来说,更新有点令人失望。虽然我确实观察到了更多的细节和更逼真的世代,但结果并没有太大的差异,以至于我只能通过并排查看 V5.2 或 V6 代来判断。

然而,能够生成的照明效果和反射细节给我留下了深刻的印象。

包括恐怖导演和数字艺术家克里斯·佩尔纳(Chris Perna)在内的其他狂热用户已经开始在Instagram和其他社交媒体网站上测试并发布MJ V6生成的令人难以置信的生动,丰富的细节结果。文本生成的早期示例看起来非常有前途。

正如 Holz 在宣布 V6 的 Discord 消息中指出的那样,新模型“是一次 alpha 测试。事情会经常变化,恕不另行通知......随着我们将 V6 升级到完整版本,它将发生重大变化......V6 不是最后一步,但我们希望你们都能感受到一些深刻的东西的进展,它与我们集体想象力的力量深深地交织在一起。

此外,V6 目前缺少 V5.2 上的一些功能,包括左右平移和缩小,但 Holz 表示这些功能将在 V6 的后续更新中出现。

更新显示,Midjourney 继续推进其模型——被许多人认为是目前最杰出、最高质量、最具创意的 AI 艺术生成器,即使它面临来自竞争对手的挑战,使用他们自己的内部模型或流行的开源 Stable Diffusion 模型,该模型依赖于一种流行的底层 AI 技术,称为“扩散,“,其中算法被训练为从视觉”噪声“中重新创建图像。

与此同时,Midjourney和其他基于扩散的人工智能艺术生成器正面临艺术家侵犯版权的集体诉讼,这些艺术家指控他们在未经肯定同意或赔偿的情况下对公开发布的作品进行培训,尽管早期迹象表明人工智能艺术生成器有很强的“合理使用”辩护。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5191.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Solix 为世代 AI 时代推出新的企业数据平台

下一篇

Stable Video Diffusion 现在可通过 Stability AI API 获得

微信公众号

微信公众号