英伟达通过大都会和相关更新加速vision AI

英伟达通过大都会和相关更新加速vision AI

Vision AI将通过Nvidia的新Metropolis框架功能实现飞跃。此应用程序开发框架侧重于微服务,以及一套云原生工作流,使用户能够构建更高效的视觉 AI 模型。

在本周的 Nvidia GTC 2023 上宣布,Metropolis 加入了该公司 TAO Toolkit 5.0 的新版本,该工具包可以创建高度定制的 AI 模型,以及扩展用于视觉 AI 应用程序和服务的 Nvidia DeepStream 数据管道构建器。

英伟达表示,目前有1多家寻求创建视觉AI应用程序的公司正在利用Metropolis开发人员工具来解决运营挑战,传感器处理和具有视觉AI的物联网。

增强工业 AI 生态系统的工作流程

Nvidia 向 GTC 社区展示了 Metropolis 工作流程的重大扩展,旨在将更强大的 AI 功能和研究置于更多开发人员的范围内。这些扩展包括 Nvidia TAO Toolkit、Metropolis 微服务和 DeepStream SDK,以及 Nvidia Isaac Sim 合成数据生成工具和机器人模拟应用程序。

英伟达代表表示,TAO 5.0旨在使尖端的视觉AI功能民主化,为个人和企业提供先进的图像处理和分析工具。

“所有主要的基础设施都将成为机器人,因为英伟达大都会帮助自动化世界上最有价值的物理流程和基础设施,”英伟达产品营销总监Adam Scraba在GTC预简报中表示。

通过对最先进的视觉 AI 模型的无代码访问,Metropolis 用户可以利用 TAO 5.0 和 Issac Sim 的功能,将基于 AI 的工作流程集成到他们的训练方法中。

百事公司采用数字孪生

这些工作流程可以训练,然后使用 TAO 5.0 ONNX 导出服务部署到使用 CPU、GPU、MCU 或 DLA 的任何设备上。此外,Nvidia 的参考应用程序可帮助用户创建微调的工作流程,为计算机视觉集成生成 AI 增强的 API 调用。

方便食品和饮料行业巨头百事公司已经在利用英伟达大都会的能力来简化其运营。该公司已成功为其配送中心开发了人工智能驱动的数字孪生模型,采用 Nvidia Omniverse 平台可视化其设施内的不同设置,并确定它们对运营效率的影响,然后再在实际场景中实施。

同样,著名的数字化和工业自动化企业西门子也向 Nvidia Metropolis 灌输了在其基于边缘的应用程序中实现更高水平的感知。通过利用分布在其工厂中的数百万个传感器,西门子通过Metropolis生态系统连接了物联网设备和机器人车队,最终将AI集成到其工业计算机视觉工作流程中。

通过低代码增强计算机视觉

Nvidia TAO 工具包是一个低代码 AI 框架,可为几乎任何开发人员、任何服务、任何设备上的视觉 AI 模型开发提供增强功能。TAO 5.0 具有新功能,包括视觉转换器预训练 AI 模型。这提供了在具有标准 ONNX 导出、使用自动机器学习 (AutoML) 进行自动超参数优化以及 AI 辅助数据注释的任何平台上部署模型的功能。

“TAO不生成任何代码,但支持”自带模型“,开发人员可以在其中导入其自定义模型架构并执行训练,微调和优化,”Scraba说。

TAO 5.0 现在支持计算机视觉模型的视觉转换器,并已为开发人员开源。通过 REST API,开发人员可以将 TAO 集成到任何 AI 服务中。此外,该服务的AutoML功能还可以自动调整AI模型的超参数,并已集成到Google Vertex AI,AzureML,Azure Kubernetes和Amazon EKS等服务中。

赋能物联网和边缘用例

嵌入式微控制器公司意法半导体(STMicroelectronics)已将TAO集成到其STM32Cube AI开发人员工作流程中,使该公司能够在广泛的物联网和边缘用例中运行复杂的AI,STM32微控制器在其计算和内存预算范围内提供支持。

“我们很高兴将TAO整合到我们的STM32开发工作流程中,”意法半导体STM32 Cube.AI 工具负责人Matthieu Durnerin说。为已经开发了超过11亿个STM32 MCU的开发人员带来最新的AI培训工具将对物联网和边缘计算产生重大影响。

Nvidia DeepStream SDK是开发人员在各行各业中创建视觉AI应用程序的关键工具。Nvidia DeepStream SDK的最新更新是一个新的图形执行运行时(GXF),它允许开发人员扩展到开源GStreamer多媒体框架之外。DeepStream 的 GXF 允许用户构建需要严格执行控制的应用程序,从而实现高级调度和关键线程管理。

感知是一种视觉的东西

为物理空间添加感知通常需要将视觉AI应用于覆盖多个区域的众多相机。例如,计算机视觉的挑战包括监控包装商品在仓库中的流动或分析大型零售空间中的单个客户流。Metropolis 微服务旨在使这些复杂的视觉 AI 任务更容易集成到用户的应用程序中。

Metropolis 微服务包括一套云原生工具,用于通过计算机视觉构建多摄像头跟踪应用,利用传感器矩阵生成集中式通用感知。

领先的IT服务公司Infosys正在使用Nvidia Metropolis来构建视觉AI应用程序。Nvidia TAO 低代码训练框架和预训练模型帮助印孚瑟斯减少了其 AI 训练工作。

“Metropolis使我们能够更快地部署解决方案,并跨商店和产品线快速扩展,同时还获得了比以前更高的准确性,”Infosys执行副总裁兼AI和自动化负责人Balakrishnan DR说。

他说,Metropolis Microservices以及DeepStream SDK优化了公司的视觉处理管道吞吐量,并降低了整体解决方案成本。Infosys还可以使用Nvidia Omniverse复制器SDK生成大量合成数据,以使用新的库存单位和包装轻松训练AI模型。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/2165.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Adobe押注使用从文本创建图像的生成AI工具--“Firefly”

下一篇

英伟达为汽车制造商推出 Omniverse 工作流程,以实现运营数字化

微信公众号

微信公众号