×
家电数码 > 人工智能 > 详情

得益于人工智能/机器学习发展,FPGA智能网卡成新宠

发布时间:2021-10-15 发布时间:
|

受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。据了解,数据中心加速器市场(包括CPU、GPU、FPGA和ASIC)预计将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)达49.47%。其中,又以FPGA为增长最快的细分市场——企业级工作负载加速应用正对FPGA越来越多地采用。

szAednc

在这个市场中,智能网卡大热,其中又以FPGA为新。日前,Achronix和BittWare(molex旗下子公司)共同发布了基于Achronix Speedster 7t FPGA的VectorPathS7t-VG6加速卡,它让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。

szAednc

数据加速器四大应用

据Achronix Semiconductor公司市场营销副总裁Steve Mensor介绍,数据加速器的主要应用包括计算、网络、存储和传感器处理四大类。具体案例如下图所示。

szAednc

Achronix-1szAednc

“和AI相关的,像语音识别、图像识别、文本分析、语义识别等热门应用,GPU也能做,但DPI、网络加速、网络监控、负载均衡、雷达处理、医疗影像、天气预报等,是FPGA的传统应用领域,这些都不是GPU或CPU所能胜任的。”Mensor介绍说,“在网络方面,以前对于10G以下的速率,都是用服务器CPU来进行处理,而到25G到100G,再用传统的服务器CPU,就来不及处理这些网络负载,因为CPU不仅要处理网络数据,还要处理应用业务。因此,几年前业界开始将一些网络处理交给FPGA来做。在存储方面,同理,随着移动互联和5G产生的数据越来越多,数据最后的存储与分析如果还是依赖服务器CPU处理,性能(处理速度)和功耗都将显著恶化。因此业界都在转用专用CPU或FPGA来卸载这些负载。在信号处理方面,例如天气预报、雷达等都是传统的FPGA加速应用,在这之中,CPU只是用来控制。”

szAednc

FPGA与传统CPU相比性能提升

FPGA和传统CPU相比,性能可提升10-100倍;在实现同样功能时,功耗会低得多。具体数据如下。

szAednc

Achronix-2szAednc

为何设计基于FPGA的PCIe加速卡?

下图是基于FPGA的PCIe加速卡的市场趋势。BittWare公司企业副总裁Sam Bichara介绍说,FPGA在加速卡市场的采用目前正处于上升期。一个很好的例子就是最开始将FPGA用在数据中心的是微软,那时候他们采用的是Altera的方案。然后Amazon追随微软设计,用的是Xilinx的方案。这两家大型云服务提供商有实力和工程资源将FPGA方案集成到自己服务器的板子上。而很多二线厂商没有这个设计实力但又想去用。

szAednc

Achronix-3szAednc

在数据中心中应用FPGA可以带来以下几个好处。

szAednc

Achronix-4szAednc

因此,BittWare联合Achronix发布了VectorPath加速卡,其特性如下。

szAednc

Achronix-5szAednc

VectorPath加速卡功能一览

以下是其硬件功能和接口的概览。“PCIe业界目前还是采用Gen3 x16,这块板卡也是基于Gen3测试,但它是基于Gen4设计。未来,由于Achronix的FPGA芯片支持PCIe Gen5 32Gbps,因此随着Gen4和Gen5成为服务器主流时,这个板卡只需要做软件升级,就可以在客户端应用。”Bichara说,“网络接口还会提供硬件MAC和PEC IP,支持客户做网络接口的开发。网络接口有两种:QSFP56和QSFP-DD,分别提供200GbE和400GbE速率,并可通过铜缆和光模块分解成多路10/25/40/50GbE。存储主要采用GDDR6,与集成到芯片内的HBM2相比配置灵活,价格很低。对于有些应用,没必要把数据和计算放到GDDR6上,DDR4可以提供更好的性价比。OCuLink高速接口可实现接口扩展。它是PCIe规定的标准接口,可以和NVMe闪存直接连接,也可以做板卡级联,提供高速通道……”另外,它提供时钟和扩展接口。时钟输入用于级联,为每块板卡提供同步。GPIO接口则可以用于扩展附加应用和控制。”

szAednc

Achronix-6szAednc
Achronix-7szAednc
Achronix-8szAednc

什么是2D片上网络(NoC)?

下图说明了Speedster7t的部分特性。

szAednc

Achronix-9szAednc

Speedster7t提供独特的2D片上网络(NoC)。“这个网络非常重要,它就好比城市里的高架路。传统的FPGA里是没有2D片上网络的,它里面的布线好比2车道、4车道,没有这么高的带宽。”

szAednc

Achronix-10szAednc

AFX是种标准接口,可以使用户非常容易地把其逻辑接入到这个高速网络。这对开发者来说开辟了一种新的开发方式,大大降低了其开发难度。

szAednc

Speedster7t NoC开创新的设计方式

下面是一个用传统FPGA设计的例子。“假定它里面有两个功能,它们都需要读取外部存储。为了完成这件事情,除了两个功能本身的逻辑外,它还有很多辅助电路——这在传统FPGA中必须存在,但是又没必要。外部存储器控制电路的频率非常高,比如DDR4是一两G,但FPGA内部功能一般只有几百M,这就需要跨时钟域处理电路。然后,在两个功能之间需要有仲裁电路,从而避免它们同时读取相同地址的存储单元。这就会占用FPGA内部的逻辑资源和布线资源,并使设计复杂化。”

szAednc

Achronix-11.jpgszAednc

Speedster7t当中具有二位片上网络,因此开辟了新的开发场景。上述问题在Speedster7t上完全不存在,开发者只要专注开发自己的功能核心,然后把它连到高速网络即可——高速网络就会处理上述所有事情。

szAednc

Achronix-12.jpgszAednc

另外,Speedster7t专为计算密集型人工智能/机器学习(AI/ML)应用而优化,特点如下。

szAednc

Achronix-13.jpgszAednc

同时提供TeraBox FPGA服务器

最后,BittWare除了提供FPGA板卡,还提供TeraBox FPGA服务器,从而可以让客户直接放在机架上运行业务。它的密度可以从1U扩展到5U,里面可以集成多种BittWare的基于FPGA的板卡,同时可以通过板卡去配合戴尔、慧与等OEM供应商。

szAednc

Achronix-14.jpgszAednc


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
周鸿祎PK马斯克.虽然人类数字化不可逆转.但强烈反对脑机接口技术的广泛应用