OpenAI 通过其 API 使 GPT-4 Turbo with Vision 普遍可用

OpenAI 通过其 API 使 GPT-4 Turbo with Vision 普遍可用

正如企业开发人员和精明的公司领导者所知道的那样,应用程序编程接口 (API) 是位于技术平台之上的现代软件开发的纽带,允许第三方应用程序连接并与之集成,而 OpenAI 刚刚对其强大的 GPT-4 Turbo 大型语言模型 (LLM) 的 API 进行了重大改进。

该公司今天在其 X 帐户上宣布,其 GPT-4 Turbo with Vision 模型现已通过其 API “普遍可用”。GPT-4 的视觉功能于 2023 年 9 月与音频上传一起宣布,GPT-4 Turbo 于 11 月在 OpenAI 的开发者大会上宣布,后者承诺提高速度、更大的输入上下文窗口(多达 128,000 个代币——相当于大约 300 页的书籍或文档)和更高的可负担性。

GPT-4 Turbo with Vision 现已在 API 中正式发布。视觉请求现在还可以使用 JSON 模式和函数调用。

此外,现在可以通过文本格式 JSON 和函数调用来请求使用模型的视觉识别和分析功能,该函数会生成一个 JSON 代码片段,开发人员可以使用该片段在其连接的应用程序中自动执行操作——“发送电子邮件、在线发布内容、进行购买等”,尽管 OpenAI 在其 API 页面上指出: “我们强烈建议在代表用户采取影响世界的行动之前,先建立用户确认流程。”

根据 OpenAI 发言人的说法,这些变化有助于简化开发人员的工作流程并提高应用程序的效率,因为“以前,开发人员必须对文本和图像使用单独的模型,但现在,只需一次 API 调用,模型就可以分析图像并应用推理。

OpenAI 已经重点介绍了客户使用 GPT-4 Turbo with Vision 的几个例子,包括热门初创公司 Cognition,其自主 AI 编码代理 Devin 依靠该模型代表用户自动生成完整代码......

...Healthify,一个健康和健身应用程序,它使用 GPT-4 Turbo with Vision 提供营养分析和膳食照片推荐。

最后,总部位于英国的初创公司 TLDraw 使用 GPT-4 Turbo with Vision 为其虚拟白板提供动力,并将用户的绘图转换为功能性网站。

尽管 GPT-4 Turbo 在基准测试中已经落后于其他较新的型号,例如 Anthropic 的 Claude 3 Opus 和 Cohere 的 Command R+,更不用说谷歌的 Gemini Advanced,但今天将 GPT-4 Turbo with Vision 带给更多潜在企业客户和开发人员的举动应该有助于继续使 OpenAI 的模型成为一个有吸引力的选择,而世界正在等待其下一个 LLM 的发布。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5889.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

道富银行的生成式人工智能让投资者可以与他们的数据聊天

下一篇

Symbolica的结构化方法可以改变人工智能

微信公众号

微信公众号