×
嵌入式 > 嵌入式开发 > 详情

NVIDIA AI Enterprise套件让各行各业释放AI潜能

发布时间:2021-03-24 发布时间:
|

NVIDIA于今日发布NVIDIA® AI Enterprise软件套件。该软件套件包括经NVIDIA全面优化、认证和支持的企业级AI工具和框架,专用于同样在今日发布的VMware vSphere 7 Update 2。

NVIDIA与VMware通过业内首创的合作开发了AI就绪型企业级平台,双方使用NVIDIAAI Enterprise在VMware vSphere上实现了AI工作负载的虚拟化。该平台为企业提供开发各种AI解决方案所需的软件,例如医疗健康领域的高级诊断、制造业的智能工厂、金融服务领域的欺诈检测等。

如今,通过NVIDIAAI Enterprise软件套件,来自数十万家使用vSphere实现计算虚拟化的企业IT专业人员,可以使用其大型数据中心和混合云环境的管理工具为AI提供支持。NVIDIA软件套件可在vSphere上提供可扩展、多节点AI应用性能,与裸金属服务器无异。

NVIDIA副总裁兼企业及边缘计算总经理Justin Boitano表示:“此前,全世界都在裸金属服务器上运行AI。NVIDIAAI Enterprise使客户能够将AI模型的开发时间从80周缩短到8周。现在,客户能够在VMware vSphere上部署和管理高级AI应用,并且像在裸机上一样获得可扩展的、首屈一指的NVIDIA加速计算性能。”

VMware云平台事业部营销副总裁Lee Caswell表示:“每家企业都在探索如何通过实现基础设施的现代化来满足AI应用需求。借助NVIDIAAI Enterprise和vSphere 7 Update 2,VMware客户现在能够在其虚拟化数据中心中快速应用AI,并为他们的现代化应用程序轻松部署经认证的AI就绪型基础设施。”

推动先进企业级AI的发展

最先使用NVIDIAAI Enterprisefor vSphere的企业包括联合健康集团旗下的Optum Technology。

Optum Technology高级首席工程师Justin Potuznik表示:“AI在Optum为联合医疗健康提供的数据驱动服务中扮演着日益重要的角色。通过在我们的VMware vSphere环境中运行NVIDIAAI Enterprise软件和基础设施,将对我们的现代化应用工作负载提供支持,并让我们高效地部署企业级AI。”

灵活的混合云AI基础设施

NVIDIAAI Enterprise为在混合云中运行的各种加速CUDA®应用、AI框架、预训练模型和软件开发工具包提供兼容性。工作负载经过优化后,能够在多个节点上扩展,从而为具有完整GPU虚拟化的大型深度学习训练模型提供支持。

为了支持NVIDIA AI Enterprise中的应用,VMware vSphere 7 Update 2基于NVIDIA A100 Tensor Core GPU,并现已通过NVIDIA认证系统™的认证。获得NVIDIA认证系统认证的服务器包括戴尔科技、新华三、慧与、浪潮、联想和超微等高容量服务器。该认证使获得NVIDIAAI Enterprise许可证的vSphere客户可以直接获得NVIDIA的客户支持。

NVIDIA还将vSphere认证为唯一一款使用NVIDIA多实例GPU技术为实时迁移提供虚拟机监视器支持的计算虚拟化软件。多实例GPU技术可以在硬件层面将每个A100 GPU分割成多达7个实例,从而最大限度地提高各种规模工作负载的效率。

此外,部分NVIDIA ConnectX网卡现已通过VMware vSAN over RDMA认证。这项技术可卸载CPU通信任务,从而提升应用性能并提高基础设施的投资回报。

NVIDIAAI Enterprise以永久许可证的方式提供,每个CPU插槽的价格为3,595美元。每个NVIDIAAI Enterprise企业级业务标准支持级别的许可证每年费用为899美元。计划升级到VMware vSphere 7 Update 2的客户可以申请NVIDIAAI Enterprise的早期试用。

如欲了解关于在VMware混合云中使用AI的更多信息,请阅读NVIDIA博客和VMware vSphere 7 Update 2博客。GTC 2021免费注册现已开放,NVIDIA和VMware将在此次大会上介绍如何将AI带给每一家企业。

珠联璧合:NVIDIA与VMware联合发布AI就绪型企业级平台


此外,经NVIDIA优化、认证并支持用于VMware vSphere的NVIDIA AI Enterprise套件,为混合云带来AI和数据科学应用的扩展性能和兼容性。

由于企业纷纷通过对数据中心进行现代化升级来为AI应用和数据科学提供支持,NVIDIA和VMware大幅简化了现代混合云中各种不同AI工作负载的开发和部署。

两家公司联合使用NVIDIA AI Enterprise软件套件对刚刚发布的vSphere更新——VMware vSphere 7 Update 2进行了AI应用优化(见下图1)。对于数十万家使用vSphere实现计算虚拟化的企业而言,这一组合为他们的大量加速CUDA应用、AI框架、模型和SDK实现了扩展性、多节点性能和兼容性。

通过此次业内首创的合作,AI研究人员、数据科学家和开发者获得了成功交付AI项目所需的软件,而IT专业人员能够使用他们最熟悉的大规模数据中心管理工具为AI提供不折不扣的支持。

图1:用于VMware vSphere的NVIDIA AI Enterprise在NVIDIA认证系统上运行,使IT部门能够轻松地大规模部署虚拟化AI。

完整齐全的企业级AI套件

NVIDIA AI Enterprise是一套完整齐全的企业级AI工具和框架,它能够帮助制造、物流、金融服务、零售和医疗健康等众多关键行业优化业务流程、提升效率。凭借NVIDIA AI Enterprise,科学家和AI研究人员可以轻松访问NVIDIA领先的AI工具,推动高级诊断、智能工厂、欺诈检测等项目的AI发展。

该解决方案解决了部署单个AI应用的复杂性问题,以及由于必须手动配置和管理各种不兼容的应用和基础设施软件而可能导致的潜在故障。

凭借在vSphere上运行的NVIDIA AI Enterprise,客户可以避免难以管理和不安全的AI专用系统孤岛。同时,还可以降低部署shadow AI(即数据科学家和机器学习工程师在IT生态系统之外采购资源)的风险。

在获得NVIDIA许可证后,AI Enterprise for vSphere可在NVIDIA认证系统上得到支持。获得NVIDIA认证系统认证的服务器包括戴尔科技、新华三、慧与、浪潮、联想和超微等高容量服务器。即便是最先进、要求最严苛的AI应用,也能像传统企业工作负载一样,在通用基础设施上通过VMware vCenter等数据中心管理工具轻松获得支持。

IT部门可以管理可用性、优化资源分配,并在本地和混合云中运行的AI工作负载保障其宝贵的IP和客户数据的安全。

可扩展多节点虚拟化AI性能

NVIDIA AI Enterprise使虚拟工作负载能够在vSphere上以接近裸金属的性能运行,并通过NVIDIA A100GPU在AI和数据科学领域获得突破性性能(见下表1)。现在,AI工作负载可以扩展到多个节点,即便是具有完整GPU虚拟化的最大规模的深度学习训练模型也可以在VMware Cloud Foundation上运行。

表1:用于vSphere的NVIDIA AI Enterprise使分布式深度学习训练可线性扩展至多个节点,并提供与裸机完全相同的性能。

AI工作负载规模不一,对数据的要求也不尽相同。有些需要处理图像,例如实时流量报告系统或网上购物推荐系统等;另一些则基于文本,比如由对话式AI驱动的客户服务支持系统等。

训练一个AI模型需要使用的数据量可能令人难以置信,而且需要在多个节点的多个GPU上扩展性能。在部署中的模型上运行推理所需的计算资源一般较少,并且可能不需要用到整个GPU的性能。

NVIDIA与VMware一起将vSphere打造成唯一一款通过NVIDIA多实例GPU(MIG)技术为实时迁移提供虚拟机监视器支持的计算虚拟化软件。凭借MIG技术,每个A100 GPU可以在硬件层面被分割成多至7个实例,从而最大限度地提高各种规模工作负载的效率。

丰富的AI应用和基础设施资源

NVIDIA AI Enterprise包含了NVIDIA的关键技术和软件。通过它们,可以在VMware Cloud Foundation上运行的虚拟化数据中心中快速部署、管理和扩展AI工作负载。

NVIDIA AI Enterprise是一款经过认证的端到端套件,包含了NVIDIA的关键AI技术、应用及企业支持服务。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
Recogni:将高端AI芯片推向自动驾驶边缘