OpenAI 通过其 API 使 GPT-4 Turbo with Vision 普遍可用

正如企业开发人员和精明的公司领导者所知道的那样，应用程序编程接口（API）是位于技术平台之上的现代软件开发的纽带，允许第三方应用程序连接并与之集成，而 OpenAI 刚刚对其强大的 GPT-4 Turbo 大型语言模型（LLM）的 API 进行了重大改进。

该公司今天在其 X 帐户上宣布，其 GPT-4 Turbo with Vision 模型现已通过其 API “普遍可用”。GPT-4 的视觉功能于 2023 年 9 月与音频上传一起宣布，GPT-4 Turbo 于 11 月在 OpenAI 的开发者大会上宣布，后者承诺提高速度、更大的输入上下文窗口（多达 128,000 个代币——相当于大约 300 页的书籍或文档）和更高的可负担性。

GPT-4 Turbo with Vision 现已在 API 中正式发布。视觉请求现在还可以使用 JSON 模式和函数调用。

此外，现在可以通过文本格式 JSON 和函数调用来请求使用模型的视觉识别和分析功能，该函数会生成一个 JSON 代码片段，开发人员可以使用该片段在其连接的应用程序中自动执行操作——“发送电子邮件、在线发布内容、进行购买等”，尽管 OpenAI 在其 API 页面上指出： “我们强烈建议在代表用户采取影响世界的行动之前，先建立用户确认流程。”

根据 OpenAI 发言人的说法，这些变化有助于简化开发人员的工作流程并提高应用程序的效率，因为“以前，开发人员必须对文本和图像使用单独的模型，但现在，只需一次 API 调用，模型就可以分析图像并应用推理。

OpenAI 已经重点介绍了客户使用 GPT-4 Turbo with Vision 的几个例子，包括热门初创公司 Cognition，其自主 AI 编码代理 Devin 依靠该模型代表用户自动生成完整代码......

...Healthify，一个健康和健身应用程序，它使用 GPT-4 Turbo with Vision 提供营养分析和膳食照片推荐。

最后，总部位于英国的初创公司 TLDraw 使用 GPT-4 Turbo with Vision 为其虚拟白板提供动力，并将用户的绘图转换为功能性网站。

尽管 GPT-4 Turbo 在基准测试中已经落后于其他较新的型号，例如 Anthropic 的 Claude 3 Opus 和 Cohere 的 Command R+，更不用说谷歌的 Gemini Advanced，但今天将 GPT-4 Turbo with Vision 带给更多潜在企业客户和开发人员的举动应该有助于继续使 OpenAI 的模型成为一个有吸引力的选择，而世界正在等待其下一个 LLM 的发布。

椰有料原创，作者：小椰子啊，转载请注明出处：http://www.studioyz.com/5889.html

OpenAI 通过其 API 使 GPT-4 Turbo with Vision 普遍可用

猜你喜欢

文章评论

猜你喜欢

文章评论

道富银行的生成式人工智能让投资者可以与他们的数据聊天

Symbolica的结构化方法可以改变人工智能