新的开源 AI 编码工具超越了它的灵感:Google DeepMind 的 AlphaCode

新的开源 AI 编码工具超越了它的灵感:Google DeepMind 的 AlphaCode

一个新的开源人工智能代码生成工具AlphaCodium的灵感来自谷歌DeepMind的AlphaCode(以及上个月由Gemini提供支持的AlphaCode 2),但现在已经超越了它,让X/Twitter本周都感到震惊。

“我们离让人工智能比人类更好地生成代码又近了一步!”张贴圣地亚哥·瓦尔达拉马(Santiago Valdarrama)。“结果表明,AlphaCodium是我们所见过的生成代码的最佳方法。它击败了 DeepMind 的 AlphaCode 和他们的新 AlphaCode2,而无需微调模型!

OpenAI 的 Andrej Karpathy 曾是特斯拉的 AI 总监,他强调了该工具的“流程工程”方法来改进代码生成——“从朴素的提示:答案范式转变为'流程'范式,其中答案是迭代构建的。

为了提高 LLM 在特定于代码问题上的性能,AlphaCode 的“流工程”超越了思维链提示工程,带回了 GAN 架构(由 Ian Goodfellow 于 2014 年开发)的元素,包括生成代码的模型以及通过测试、反射和规范匹配提供代码完整性的对抗模型。

该流程从输入开始,然后包括一系列预处理步骤,在这些步骤中,AlphaCodium 会反思问题并最终达到第一个代码解决方案。然后,它会生成其他测试,以帮助优化解决方案,并得出最终有效的测试。

初创公司 CodiumAI 开发了 AlphaCodium

总部位于特拉维夫的初创公司CodiumAI——根据其网站,其使命是“使开发人员能够更快地构建、零错误”——开发了AlphaCodium,并在CodeContests数据集上进行了测试,其中包含大约10,000个竞争性编程问题。它在 CodeContests 基准测试中的表现表明,其性能将 GPT-4 的准确率从 19% 提高到 44%。根据 CodiumAI 的说法,“这一结果不仅仅是数字上的改进;这是 LLM 在代码生成方面能力的一次飞跃,为该领域树立了新的标杆。

CodiumAI 成立于 2022 年,并于 2023 年 3 月筹集了 1060 万美元,它分享了一个 AlphaCodium GitHub 存储库和随附的论文“使用 AlphaCodium 生成代码:从提示工程到流程工程”。

联合创始人兼首席执行官伊塔马尔·弗里德曼(Itamar Friedman)在接受VentureBeat采访时表示,他对AlphaCodium迄今为止产生的关注感到惊讶,但他补充说,他知道这是一项突破,可以帮助整个开发者社区——强调AlphaCodium不仅仅是一个模型,而是一个系统和算法,可以在代码生成模型和“批评”模型之间实现“通信流”。

“这就是我们带到这里的大事——重要的是要把它看作是一种流动,这就是为什么我们称之为'流动工程',”他说。他解释说,这种流程不仅允许人工智能生成样板代码,还可以生成有效且准确的代码。

OpenAI 和 Google DeepMind 是最大的编程竞赛

弗里德曼指出,他认为OpenAI(开发了Codex)和Google DeepMind(开发了AlphaCode和AlphaCode 2)是CodiumAI在编码竞赛中最大的竞争对手,但其最大的竞争对手是代码完整性技术本身。

“我们深受 DeepMind 的启发,”他说,并补充说他还与 OpenAI 首席执行官 Sam Altman 谈到了代码完整性的重要性。

“我与 Sam 非常一致,认为代码完整性不仅对下一代代码构建非常重要,而且对 AI 对齐也很重要,”他说。他解释说,AlphaCodium实际上是在提供“下一代”代码完整性——“它不仅得到了我的规范,还得到了我的文化文件、我的信仰和其他指导方针。

他说,谷歌DeepMind在他们的AlphaGo解决方案中加入了流程工程的各个方面,但在AlphaCode中没有——“我不知道为什么。他认为,也许是因为这个想法不是主流叙事的一部分,即只需要一个更好的大型语言模型。

“人工智能不生成工作代码的原因不是因为你需要更好的LLM,”他说。“这是因为你需要一个流程。”

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5456.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

泰勒·斯威夫特(Taylor Swift)的露骨AI深度伪造让粉丝和立法者大吃一惊

下一篇

生成式 AI 的企业赌博:尽管存在安全困境,但 IT 领导者仍对技术下大赌注

微信公众号

微信公众号