研究人员推出了“3D-GPT”,这是一种可以通过简单的文本命令生成3D世界的人工智能

研究人员推出了“3D-GPT”,这是一种可以通过简单的文本命令生成3D世界的人工智能

来自澳大利亚国立大学、牛津大学和北京人工智能研究院的研究人员开发了一种名为“3D-GPT”的新人工智能系统,该系统可以简单地从用户提供的基于文本的描述中生成3D模型。

在arXiv上发表的一篇论文中描述了该系统,与传统的3D建模工作流程相比,该系统提供了一种更高效,更直观的方法来创建3D资产。

根据该论文,3D-GPT能够“将程序性3D建模任务分解为可访问的片段,并为每个任务指定适当的代理”。它利用多个 AI 代理,每个代理专注于理解文本提示和执行建模功能的不同部分。

“3D-GPT将LLM(大型语言模型)定位为熟练的问题解决者,将程序3D建模任务分解为可访问的部分,并为每个任务指定合适的代理,”研究人员表示。

关键代理包括解析文本指令的“任务调度代理”,添加初始描述中缺少的细节的“概念化代理”,以及设置参数并生成代码以驱动Blender等3D软件的“建模代理”。

通过分解建模过程并分配专门的 AI 代理,3D-GPT 能够解释文本提示,使用额外的细节增强描述,并最终生成符合用户设想的 3D 资产。

“它增强了简洁的初始场景描述,将它们演变成详细的形式,同时根据后续指令动态调整文本,”该论文解释说。

该系统在诸如“一个雾蒙蒙的春日早晨,露珠亲吻的花朵点缀在郁郁葱葱的草地上,周围环绕着萌芽的树木”之类的提示进行了测试。3D-GPT 能够生成具有逼真图形的完整 3D 场景,准确反映文本中描述的元素。

虽然图形的质量还不是逼真的,但早期的结果表明,这种基于代理的方法有望简化3D内容创建。模块化架构还可以允许独立改进每个代理组件。

“我们的实证调查证实,3D-GPT不仅可以解释和执行指令,提供可靠的结果,还可以与人类设计师有效合作,”研究人员写道。

通过生成代码来控制现有 3D 软件而不是从头开始构建模型,3D-GPT 提供了一个灵活的基础,可以随着建模技术的不断发展而进行构建。

研究人员得出结论,他们的系统“突出了LLM在3D建模中的潜力,为场景生成和动画的未来发展提供了基本框架。

这项研究可能会彻底改变3D建模行业,使该过程更加高效和可访问。随着我们进一步进入元宇宙时代,以 3D 内容创作为催化剂,3D-GPT 等工具对于从游戏和虚拟现实到电影和多媒体体验等一系列行业的创作者和决策者来说可能是无价的。

3D-GPT 框架仍处于早期阶段,存在一些局限性,但它的发展标志着人工智能驱动的 3D 建模向前迈出了重要一步,并为未来的进步开辟了令人兴奋的可能性。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/4424.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

认识 LLEMMA,这是一款以数学为中心的开源 AI,性能优于竞争对手

下一篇

甲骨文希望通过收购 Cerner 彻底改变医疗保健

微信公众号

微信公众号