认知从隐身中脱颖而出,推出 AI 软件工程师 Devin

认知从隐身中脱颖而出,推出 AI 软件工程师 Devin

今天,由彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和包括前Twitter高管Elad Gil和Doordash联合创始人Tony Xu在内的科技行业领导者支持的人工智能初创公司Cognition宣布了一位名为“Devin”的完全自主的人工智能软件工程师。

虽然有多个编码助手,包括著名的 Github Copilot,但据说 Devin 能够端到端地处理整个开发项目,从编写代码和修复与之相关的错误到最终执行,从人群中脱颖而出。这家初创公司已经证明,这是第一个此类产品,甚至能够处理 Upwork 上的项目。

Devin 的宣布标志着 AI 辅助开发领域的重大转变,为工程师提供了成熟的 AI 工作者来完成他们的项目,而不是一个只能编写准系统代码或建议片段的副驾驶。

然而,截至目前,Devin仍然是非公开的,该公司只对少数客户开放,包括彭博社记者Ashlee Vance,他在这里写下了他使用它的经历。

德文到底能做什么?

Cognition 的创始人兼首席执行官、屡获殊荣的体育程序员 Scott Wu 今天在 Cognition 网站上的一篇博客文章中解释说,Devin 可以在沙盒计算环境中访问常见的开发人员工具,包括自己的 shell、代码编辑器和浏览器,以规划和执行需要数千个决策的复杂工程任务。

人类用户只需在Devin的聊天机器人风格的界面中输入自然语言提示,然后AI软件工程师就会从那里获取它,制定详细的分步计划来解决问题。然后,它使用其开发人员工具开始项目,就像人类使用它们一样,编写自己的代码,修复问题,实时测试和报告其进度,使用户能够密切关注其工作的所有内容。

如果人类观察者看起来不对劲,用户还可以跳到聊天界面,给 AI 一个命令来修复它。Cognition说,这使工程团队能够将他们的一些项目委托给人工智能,并专注于需要人类智能的更具创造性的任务。

通过这种方式,Devin提供了一种新的范式,可以一瞥所有软件开发(以及一般的计算机工作)在不久的将来可能完成的方式:由人类主管/用户监督的人工智能工作者完成。

能够处理各种开发任务

根据 Wu 分享的演示,Devin 能够以当前的形式处理一系列任务。这包括常见的工程项目,如端到端部署和改进应用程序/网站,以及查找和修复代码库中的错误,以及更复杂的事情,如使用GitHub上研究存储库的链接为大型语言模型设置微调,或学习如何使用不熟悉的技术。

在一个案例中,它从一篇博客文章中学会了如何运行代码来生成带有隐藏消息的图像。同时,在另一个项目中,它处理了一个Upwork项目,通过编写和调试计算机视觉模型的代码来运行它。

在 SWE-bench 测试中,该测试向 AI 助手挑战来自真实世界开源项目的 GitHub 问题,AI 软件工程师能够在没有任何人类帮助的情况下端到端地正确解决 13.86% 的案例。相比之下,Claude 2 只能解决 4.80% 的问题,而 SWE-Llama-13b 和 GPT-4 可以分别处理 3.97% 和 1.74% 的问题。所有这些模型甚至都需要帮助,他们被告知必须修复哪个文件。

核心技术仍未被描述

软件开发中的人工智能并不是什么新鲜事。这个领域已经有很长一段时间了,从流行的 GitHub Copilot 和 StarCoder 到 Replit,它在 Hugging Face 上有一些小型 AI 编码模型,以及 Codeium,它最近以 5 亿美元的估值获得了 6500 万美元的 B 轮融资。

然而,这些产品中的大多数主要集中在使用人工智能来协助编码。他们可以从文本提示生成准系统代码,使用相关的 IDE 上下文对其进行总结或检索代码片段,从而加快团队的工作流程。有了Devin,Cognition AI似乎更进一步,让一个成熟的AI工作者来处理整个项目。

虽然该工具仍有待测试,但它能够处理多个步骤,同时保持正轨,以完成软件工程项目,这是最大的独特卖点。Cognition没有透露它究竟是如何实现这一壮举的,以及它是使用自己的专有模型还是来自第三方的模型,但它确实指出,这项工作是其“长期推理和规划进步”的结果。

目前,该公司正在增加产能,并仅向部分用户提供对Devin的早期访问。它表示,希望增加工程工作的有兴趣的人可以通过电子邮件联系以获得访问权限。预计在晚些时候将开放更广泛的访问。

Cognition还在其网站上指出,编码“只是一个开始”,这似乎表明它可能会利用其推理进步为其他学科推出类似的人工智能代理/工人。到目前为止,该公司已获得2100万美元的资金。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5732.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

在 VentureBeat 的 AI Impact Tour 上,Microsoft 探讨了 AI 世代的风险和回报

下一篇

欧盟议会正式通过《人工智能法案》——具有里程碑意义的法规可能于5月成为法律

微信公众号

微信公众号