Deci 宣布推出新的 AI 开发平台和小型模型 Deci Nano

Deci 宣布推出新的 AI 开发平台和小型模型 Deci Nano

在 OpenAI 相对平静的时期,竞争对手 Anthropic 发布了新的 Claude 3 系列大型语言模型 (LLM),抢走了头条新闻。但是,还有另一家基金会模型提供商值得关注,它本周发布了一些重要的生成式人工智能新闻:Deci。

VentureBeat 上一次报道这家以色列初创公司是在 2023 年秋季,当时它发布了 DeciDiffusion 和 DeciLM 6B 开源模型,它们是经过微调的变体 Stability Diffusion 1.5 和 Meta 的 LLaMA 2 7B——两者都是开源的——旨在比原始源模型更快,需要更少的计算资源。从那时起,Deci 发布了 DeciCoder、代码完成 LLM 和 DeciDiffusion 2.0。

现在,该公司正在发布一个新的、更小、计算要求更低的 LLM,即闭源的 Deci-Nano,以及面向企业和编码人员的完整 Gen AI 开发平台,这是另一个付费产品。目前,Deci-Nano 作为 Deci Gen AI 开发平台的一部分独家提供。

远离开源?

该公司似乎正在朝着更完全商业化或混合开源/闭源模式组合的方向发展,类似于我们看到Mistral与Microsoft有争议的合作伙伴关系。

Deci 和 Mistral 进入闭源 AI 模型是否表明对开源 AI 的热情正在减弱?毕竟,每家私营公司都需要以某种方式赚钱......

Deci 营销副总裁 Rachel Salkin 通过电子邮件告诉 VentureBeat:

“我们仍然致力于支持开源社区。同时,我们也认识到构建更优化(无论是在准确性上还是在速度上)的闭源模型的价值,这使我们能够进一步突破界限,为客户提供更多价值。

萨尔金还指出:

“最近几个月,Deci 发布了几个开源模型,包括 DeciLM-6B、DeciLM-7B、DeciLM-7B Instruct、DeciCoder 1B、DeciCoder 6B、DeciDiffsion V1&V2..。这些模型仍然可以通过Hugging Face下载,每月有数万次下载,“尽管它们的演示空间已经暂停。

性能,以(低)价格...

如果 Deci 确实像它看起来那样朝着更商业化的方向发展,那么该公司似乎正在让用户和客户轻松进入其存在的这个阶段。

Deci-Nano 以超快的推理速度提供语言理解和推理,在 NVIDIA A100 GPU 上仅需 4.56 秒即可生成 256 个令牌。

该公司在其博客上发布了宣布Deci-Nano的图表,显示其性能优于Mistral 7B-Instruct和Google的Gemma 7B-it型号。

此外,Deci-Nano 的定价非常激进,为每 100 万(输入)代币 0.1 美元,而 OpenAI 的 GPT-3.5 Turbo 为 0.50 美元,新款 Claude 3 Haiku 为 0.25 美元。

“Deci-Nano体现了我们以生产为导向的方法,不仅包括对质量的奉献,还包括对效率和成本效益的奉献,”Deci联合创始人兼首席执行官Yonatan Geifman在他的LinkedIn页面上的一篇文章中说。“我们正在构建架构和软件解决方案,以从现有 GPU 中榨取最大的计算能力。”

但它仍然是闭源的。Deci 尚未公开分享它有多少参数。Salkin告诉VentureBeat:

“我们没有透露模型尺寸。但是,鉴于其功能,将其与 Mistral-7b-instruct-v0.2 和 Google 的 Gemma-7b-instruct 等模型进行比较是有意义的。Deci-Nano 是一个 8K 上下文窗口,由 Deci 团队使用我们的 AutoNAC 技术(基于神经架构搜索)从头开始开发。

根据 Deci 关于该技术的白皮书,AutoNAC 是 Deci 开发的一项技术,旨在通过分析现有的 AI 模型并构建一系列“其整体功能非常接近”原始模型的小模型来减小模型大小。

从财务和法律分析到文案写作和聊天机器人,Deci-Nano 的可负担性和卓越功能旨在为寻求创新的企业解锁新的可能性,而无需承担过高的成本负担。

Deci 为客户提供了多种部署选项,无论是在无服务器实例上以方便和可扩展,还是在专用实例上实现微调和增强隐私。该公司表示,这种灵活性确保企业可以随着需求的发展而扩展其人工智能解决方案,在不影响性能或安全性的情况下在部署选项之间无缝过渡。

一个新平台诞生了

尽管Deci本周的大部分公告都集中在Deci-Nano上,但更大的新闻(没有双关语的意思)可能是该公司提供完整的生成式AI平台的举动,它在新闻稿中将其描述为“旨在满足企业效率和隐私需求的综合解决方案”。

该平台的用户究竟得到了什么?Deci 表示:“一系列新的专有、可微调的大型语言模型 (LLM)、推理引擎和 AI 推理集群管理解决方案。

通过该平台提供的第一个专有模型当然是Deci-Nano。但显然,Deci 计划根据这些营销材料的措辞提供其他材料,Salkin 肯定了这一事实,他给我们写了一封信:

Deci-Nano是一系列新模型(有些是开放的,有些是封闭的)中的第一个优化的闭源模型,这些模型将在未来几个月内发布。

推理引擎允许用户根据自己的规范部署 Deci-Nano,可以连接到 Deci 的 API 和服务器,在客户的虚拟私有云上运行 Deci-Nano,也可以将其部署在客户的服务器上。

对于希望在虚拟私有云 (VPC) 中自行管理 Deci-Nano 的客户,Deci 将只为他们提供自己的容器化模型。该公司还代表客户在客户的 Kubernetes 集群中运行托管干扰。

最后,Deci 的 Genartive AI 平台为希望将技术部署在数据中心而不是云端的客户提供完整的本地部署解决方案。Deci 将为这些客户提供一个虚拟容器,其中包含 Deci-Nano 模型和 Deci 的 Infery 软件开发套件,因此客户可以将模型构建到客户、员工或其他最终用户的应用程序和体验中。

Deci Generative AI Platform 及其各种安装产品的定价尚未公开列出,但我们会在获得该信息后进行更新。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5709.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Snowflake 和 Landing AI 强强联手,利用计算机视觉应对非结构化数据挑战

下一篇

解码数据困境:人工智能时代有效删除数据的策略

微信公众号

微信公众号