Anthropic 推出 Claude 3，在基准测试中超越 GPT-4 和 Gemini Ultra

小椰子啊 • 2024-03-12 人工智能

领先的人工智能初创公司Anthropic今天推出了其Claude 3系列AI模型，旨在满足企业客户的多样化需求，兼顾智能、速度和成本效益。该系列包括三种型号：Opus、Sonnet 和即将推出的 Haiku。

该系列的明星是 Opus，Anthropic 声称它比市场上任何其他公开可用的 AI 系统都更强大，甚至优于竞争对手 OpenAI 和谷歌的领先模型。

“Opus 能够完成最广泛的任务，并且执行得非常好，”Anthropic 联合创始人兼首席执行官 Dario Amodei 在接受 VentureBeat 采访时表示。

Amodei 解释说，Opus 在广泛的基准测试中优于 GPT-4、GPT-3.5 和 Gemini Ultra 等顶级 AI 模型。这包括在学术基准上名列前茅，例如数学推理的 GSM-8k 和专家级知识的 MMLU。

“它似乎比所有人表现得更好，并在某些任务上获得了我们以前从未见过的分数，”Amodei说。

虽然 Anthropic 和谷歌等公司尚未披露其领先模型的全部参数，但两家公司报告的基准测试结果表明，Opus 在核心功能上匹配或超过了 GPT-4 和 Gemini 等主要替代品。

至少在纸面上，这为商用对话式人工智能建立了一个新的高水位线。

Opus 专为需要高级推理的复杂任务而设计，以其卓越的性能在 Anthropic 的产品阵容中脱颖而出。

提供中档、快速选项

Sonnet 是中端型号，为企业提供了更具成本效益的日常数据分析和知识工作解决方案，无需旗舰型号的高价标签即可保持高性能。

同时，Haiku 被设计为快速和经济，适用于面向消费者的聊天机器人等应用，在这些应用中，响应能力和成本是关键因素。

Amodei 告诉 VentureBeat，他预计 Haiku 将在“几周而不是几个月”内公开发布。

今天推出的每个型号都支持图像输入，这是一项需求量很大的功能，特别是对于图像中的文本识别等应用。

“我们没有过多地关注输出模式，因为企业方面的需求较少，”Anthropic总裁兼联合创始人Daniela Amodei告诉VentureBeat，强调了该公司对企业最抢手的功能的战略重点。

此外，Claude 3 模型还展示了与其他最先进模型相媲美的复杂计算机视觉能力。这种新模式开辟了企业需要从图像、文档、图表和图表中提取信息的用例。

“许多 [客户] 数据要么是高度非结构化的，要么是某种可视化格式，”Daniela 解释道。“仅仅是手动复制这些信息，甚至能够让它与生成式人工智能工具进行交互的过程就非常麻烦。”

法律服务、财务分析、物流和质量保证等领域可以从理解现实世界视觉和文本的人工智能系统中受益。

Anthropic的声明是在围绕谷歌新聊天机器人Gemini的争议之后发布的，这凸显了科技公司在发布避免延续社会偏见的模型方面面临的困难。

上周，人们发现，促使双子座生成历史图像会导致描述似乎过度纠正了种族描绘。例如，要求提供维京人或纳粹士兵的照片会产生种族多样化群体的图像，这些图像不太可能反映历史现实。

谷歌的回应是禁用Gemini的图像生成功能并道歉，称它在试图增加多样性方面“没有达到目标”。然而，专家表示，这种情况说明了人工智能中围绕偏见的不断平衡行为。

达里奥·阿莫迪（Dario Amodei）在接受VentureBeat采访时强调了操纵AI模型的困难，称其为“不精确的科学”。他说，该公司有专门的团队来评估和减轻其模型的各种风险。

“我们的假设是，处于人工智能发展的前沿是引导人工智能发展轨迹为社会带来积极成果的最有效方式，”达里奥说。

然而，丹妮拉·阿莫迪（Daniela Amodei）承认，用目前的方法可能无法实现完全无偏见的人工智能。

“我认为，创建一个完全中立的生成式人工智能工具几乎是不可能的，无论是在技术上，还是因为不是每个人都同意什么是中立，”她说。

Anthropic 策略的一部分是一种称为 Constitutional AI 的方法，其中模型根据“宪法”中定义的原则进行调整。但达里奥·阿莫迪（Dario Amodei）承认，即使是这种技术也并不完美。

“我们的目标是让模型公平，在意识形态和政治上保持中立，[但]你知道，我们还没有完全做到，”他说。“我不认为，你知道，任何人都能完美地做到这一点。

尽管如此，达里奥认为，与双子座面临的指责形成鲜明对比的是，Anthropic对广泛认同的价值观的构成有助于防止模型偏向任何党派议程。

“我们的目标不是宣扬任何特定的政治或意识形态观点，”他说。“我们希望我们的模型适合所有人。”

椰有料原创，作者：小椰子啊，转载请注明出处：http://www.studioyz.com/5663.html