随着人工智能逐步落地,以及边缘计算的快速发展,FPGA 由于性能比传统 CPU 快 10-100 倍,在加速市场发挥着越来越大的作用。据 Research and Markets 预测,从 2018 年到 2023 年,FPGA 将是年复合增长率最高的细分市场,数据中心加速器市场预计将从 2018 年的 28.4 亿美元增长到 2023 年的 211.9 亿美元,年复合增长率达到 49.7%。而这一高速增长的驱动力就来自于计算、网络、存储、传感器处理等企业级工作负载加速应用对 FPGA 的采用。

 

FPGA 的加速功能最终要靠加速卡完成,随着新技术沿着“采用曲线”移动,消费使用模式在发生变化,超大规模厂商已经实施了“FPGA 芯片级”设计,大多数二类规模厂商还没有足够的规模经济或者内部资源来支持实施芯片级设计,这些客户正在寻求现成可用的板级或者系统级解决方案。

 

左:Achronix 公司市场营销副总裁 Steve Mensor

右:BittWare 公司副总裁 Sam Bichara

 

Achronix联手BittWare打造高速FPGA加速卡

对于 FPGA 加速卡,业内的用户并不陌生,早在几年前,赛灵思和英特尔(原来的 Altera)就已经陆续推出了多款 FPGA 加速卡,目的就是为数据中心提速。Achronix 公司作为后起之秀,早期推出了 eFPGA IP,但是限于 IP 产品的变现速度太慢,随后推出了 FPGA 芯片,今年 5 月发布的新品叫 Speedater7t。Achronix 公司市场营销副总裁 Steve Mensor 介绍,Speedater7t 的优势在于重新思考了 FPGA 架构,以平衡片上处理、互联和外部输入输出接口,实现数据密集型应用吞吐量的最大变化,主要应用于基于边缘和基于服务器的 AI/ML 应用、网络处理和存储。

 

(关于 Speedater7t FPGA 产品的详细介绍,请参照报道:抓住 AI 带来的 3 倍飙升,这家公司拼力打造“FPGA+”实现突破)

 

从芯片到应用端还隔着一个方案设计环节,当自身还不够强大的时候,Achronix 选择了借力,与 BittWare 一起打造基于 Speedater7t FPGA 的 VectorPath PCIe 加速卡。BittWare 是 Molex 的子公司,在业内有 30 多年 FPGA 加速卡设计经验,业务遍布全球 40 个国家与地区,生态链非常完善。BittWare 总裁 Sam Bichara 向与非网记者介绍,“VectorPath S7t-VG6 加速卡搭载了 Achronix 采用 7nm 工艺打造的 Speedster 7tAC7t1500 独立 FPGA 芯片,它在同类 PCIe FPGA 加速卡中,提供了目前业界最高性能的接口。这些高性能接口包括 1x400GbE 和 2x100GbE 接口,以及总带宽为 4Tbps 的 8 组 GDDR6 的板上存储器,使该加速卡成为高带宽数据加速应用的理想选择。”

 

VectorPath PCIe 加速卡

 

其实 BittWare 之前已经基于赛灵思和英特尔的产品推出了 FPGA 加速卡,在 Sam Bichara 看来,Speedster7t FPGA 芯片集成了带宽为 20 Tbps 的二维片上网络(NoC),使 VectorPath PCIe 加速卡的性能更具有优势,提供 400GbE QSFP-DD 和 100GbE QSFP56 接口,具有 8 组 GDDR6 存储器可提供 4 Tbps 的总带宽,1 组带有错误检查和纠正(ECC)功能的、运行频率为 2666MHz 的 DDR4 存储器,符合 PCIe 的要求并获得了认证,具有 692K 的 6 输入查找表(LUT),40K Int8 MAC 提供高于 80 TOps 的算力,OCuLink 可用于连接扩展卡的 4 通道 PCIe Gen 4 连接器。

 

在应用上,Sam Bichara 表示,在市场上,PCIe 加速卡应用越来越多,在两三年前一类规模厂商开始将加速卡放到数据中心,他们的工程师资源比较充分,可以把芯片直接做到主板中,而对于小型数据中心,工程师资源匮乏,可以基于 PCIe 加速卡发挥 FPGA 的优势。与 Achronix 的合作充分利用了 BittWare 和 Achronix 的优势,客户将因此获得巨大的、开箱即用的优势,并且可以利用 Speedster7t FPGA 芯片的各种先进功能。而且 BittWare 已经开发了多种加速卡,有一套标准的质量控制流程,从前端到后端工厂,包括压力、温度、板载测试软件都是自己测试,因此质量更有保证。

 

为了实现开箱即用,BittWare 还推出了 TeraBox 服务器平台,可以更具用户选择 BittWare FPGA 加速器的数量进行配置,预装操作系统喝 FPGA 开发工具,用户简单配置即可部署,将从实验室到市场的转换成本降至最低。而且对于大批量需求,提供定制服务,优化成本结构。

 

相对AI专用芯片,FPGA的应用更广

针对 AI 应用,市面上已经有很多芯片厂商甚至终端产品厂商开始推出 AI 专用芯片,未来 FPGA 芯片会担任怎样的市场角色,是否会因此受到冲击?这也是业界比较关心的问题。Steve Mensor 解释,第一,针对各种应用需要具有针对性的产品,如果不考虑成本因素,ASIC 一定是最有效的方案,但是当用户的购买量小时,成本会上升,而 FPGA 的优势是不只针对某一应用,而是同一款芯片通过可编程适配更多的应用,这恰恰是数据中心所需要的,让他们可以面向不同的客户不同的应用;第二,采用 AISC 意味着这一应用的算法不再革新,不再需要编程,但是目前的情况是新技术在一直演进,包括人工智能,CPU 和 GPU 有很多缺点,而 FPGA 可以超过 GPU、ASIC 的应用范围。

 

坚持硬件定义软件发展思路

相对整个半导体几千亿美元的市场,FPGA 的市场份额并不大,把持大局的公司只有几家,有意思的是,关于 FPGA 的发展趋势,市场上出现了不同的声音。就在前不久,赛灵思发布了软件统一平台 Vitis,主张软件定义硬件的发展趋势;而 Achronix 则持有相反的看法。

 

Steve Mensor 认为,“可以看到,他的系统中不仅有 FPGA,还有处理器、AI 引擎和高速接口,整个系统包含四种不同的底层硬件,这就涉及到各种硬件之间的协调问题。要解决这个问题,从表面看,赛灵思是通过软件的思维开发,实际上当用户使用时,需要搞清楚系统的哪些部分由 FPGA 处理,哪部分由 AI 引擎处理,以及它们互相之间的数据如何流动?这不只是简单的工具问题,而是整体设计的问题,非常具有挑战性。我们选择了另外一个独特的路径,就是在传统的 FPGA 上做了优化,通过二维网络,注意我们不是使用处理器,而是阵列,我们的底层思维还是硬件的思维,也配有开发工具让工程师可以使用 C、TensorFlow 等语言,但是系统中没有不同的单元,不会产生协调数据的问题。数据通信问题不是软件工程师可以想清楚的,原有的工程师可以方便地使用我们的工具,而且我们的产品在性能上有很大的提升,软件工程也很容易使用。”

 

可以看出,两家公司各执一词,至于哪种趋势是主流趋势,笔者认为符合用户设计需求的方案才能代表主流趋势,现在还难以下定论。就像 Steve 所说的那样,我们坚持自己的硬件优化发展思路,谁对谁错由市场决定。FPGA 市场需要有公司能激起不一样的浪花。