谷歌的图像生成模型系列正在接受一些重大更新。该公司宣布 Imagen 2 将获得文本直播功能,将文本提示转换为动画图像。此外,AI 模型中的图像编辑(内画、外画和数字水印)现已正式发布。
在 Google Cloud Next 大会上宣布,Imagen 2 的文本直播生成的动画 GIF 最初以每秒 24 帧、360×640 像素分辨率和 4 秒的持续时间提供。然而,谷歌表示,有用于“持续增强”的飞机。
“如果你看,你可以看到的不是物体的图片,比如汽车的静态图片,而是像动画移动的车辆一样的短图像。许多组织,特别是在媒体和广告等领域,都在关注它,因为它提高了与用户的互动,“谷歌云首席执行官托马斯·库里安在新闻发布会上分享道。
谷歌声称Imagen 2将能够使用一系列摄像机角度和动作创建图像,“同时支持整个序列的一致性”。它还具有安全过滤器和数字水印,解决了组织围绕生成式人工智能的两个主要问题。
至于现在公开的图像编辑功能,Imagen 2 可以在照片中添加或删除元素,类似于 Adobe Photoshop 的生成填充或内容感知。此外,扩展图像的边框以提供更广阔的视图也是可能的。
这些更新是谷歌围绕其完全托管的云 AI 平台 Vertex AI 发布的公告的一部分。
Imagen 2 于 2023 年推出。它是谷歌 DeepMind 的产品,作为 AI 进行销售,可以从自然语言提示生成逼真、高分辨率和美观的图像。它与 OpenAI 的 DALL-E、Midjourney 和 Adobe Firefly 处于同一联盟,专门用于帮助企业创建符合其品牌指南和治理需求的图像。
椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5907.html
文章评论