Stable Video Diffusion 现在可通过 Stability AI API 获得

Stable Video Diffusion 现在可通过 Stability AI API 获得

以 Stable Diffusion 文本到图像生成器而闻名的公司 Stability AI 宣布,其新的基础图像到视频模型 Stable Video Diffusion (SVD) 现已在其开发人员平台上提供,并通过其应用程序编程接口 (API) 提供,允许第三方开发人员将其整合到他们自己的应用程序、网站、软件和服务中。

“这个新增功能提供了对为各个行业设计的最先进的视频模型的编程访问......我们这个版本的目标是为开发人员提供一种有效的方式,将先进的视频生成无缝集成到他们的产品中,“该公司在一篇博客文章中写道。

虽然该版本可以帮助希望生成 AI 视频的企业,但它也可能引起一些担忧,因为 Stability AI 已经在 LAION-5B 上训练其模型,LAION-1B 是一个开源 AI 数据集,已被发现包含至少 008,<> 个儿童性虐待材料实例,因此本周下线。

尽管如此,对于希望在其应用程序中构建生成视频的个人和企业来说,Stability的新SVD API插件确实在质量方面提供了领先的选择之一,提供“2秒的视频,包括25个生成的帧和24帧的FILM插值,平均时间为41秒,”根据Stability AI在其LinkedIn页面上的一篇文章。这对于大型视频活动来说可能还不够,但它肯定可以派上用场,用于制作带有特定信息(包括模因)的 GIF。

该产品采用了 Runway 和 Pika Labs 的竞争性视频生成模型,后者最近从 Lightspeed Venture Partners 筹集了 55 万美元,并推出了一个新的网络平台来生成和编辑视频。

然而,这些产品都没有通过 API 提供他们的视频生成 AI 模型——你需要直接访问他们各自的网站和应用程序才能使用它们,这意味着,至少目前,外部开发人员无法真正在它们之上构建应用程序或合并它们。

值得注意的是,Stability 还计划为其视频生成器推出面向用户的网络体验,尽管目前还没有关于何时可用的消息。该公司正在呼吁用户加入候补名单,成为第一批试用该界面的人。

首先,让我们了解稳定视频扩散是否有效

近一个月前在研究预览中宣布,Stable Video Diffusion 允许用户通过提示静止图像(包括 JPG 和 PNG)来生成 MP4 视频。

根据该公司分享的样本,该模型在制作所需的剪辑方面做得不错,但仍处于起步阶段,仅生成长达两秒钟的短视频。这甚至比以研究为中心的视频模型制作的四秒剪辑还要少。

但是,当然,可以将多个视频剪辑链接在一起以形成更大的视频。

就其本身而言,Stability 声称它可以在广告、营销、电视、电影和游戏等领域提供帮助。

更有趣的是,与上个月发布的用于探测和反馈的模型不同,最近发布的模型可以生成多种布局和分辨率的视频,包括 1024×576、768×768 和 576×1024。它还包括运动强度控制和基于种子的控制等附加功能,允许开发人员在可重复或随机生成之间进行选择。

尽管存在争议,但稳定性仍在继续

虽然 Stable Video Diffusion 的推出确实为企业提供了一种在其产品中构建视频生成功能的简单方法,但它也凸显了 Stability AI 已准备好竞相占领市场,即使许多人质疑其训练数据的来源。

就在最近,斯坦福大学互联网天文台的一份报告发现,免费的LAION-5B数据集已被用于训练流行的AI文本到图像生成器,包括Stable Diffusion,包含至少1,008个儿童性虐待材料实例。出版商 LAION 现在已经删除了该数据集。

甚至在今年早些时候,该公司在一项集体诉讼中被点名,该诉讼指控该公司向LAION支付费用,以“未经许可购买数十亿张受版权保护的图像的副本,以创建Stable Diffusion”。

目前,Stability 的开发者平台 API 提供对所有公司模型的访问,从 Stable Diffusion XL 文本到图像生成器到新的 SVD 模型。该公司还提供会员资格,以帮助客户在本地托管模型。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5189.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Midjourney V6 在这里带有图像文本和完全检修的提示

下一篇

Ignition 的新资金推动了人工智能销售和营销平台的扩张

微信公众号

微信公众号