嵌入式 > 技术百科 > 详情

介绍一款基于FPGA的CNN硬件加速器IP

发布时间:2024-10-12 发布时间:
|

随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。


CNN(Convolutional Neural Network,卷积神经网络)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的网络结构之一,尤其在图像处理领域取得了很大的成功。随着网络变得越来越大、越来越复杂,我们需要大量的计算资源来对其进行训练,因此人们纷纷将注意力转向FPGA(Field Programmable Gate Array,现场可编程门阵列)器件,FPGA不仅具有软件的可编程性和灵活性,同时又有ASIC高吞吐和低延迟的特性,而且由于具有丰富的I/O接口,FPGA还非常适合用作协议和接口转换的芯片。


近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale,它能够利用实现训练好的CNN网络,比如行业标准的ResNet、AlexNet、Tiny Yolo和VGG-16等,并将它们进行压缩输出二进制描述文件,可以部署到Xilinx全系列可编程逻辑器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供数据给AIScale CNN加速器(PL),经过分类处理将输出数据给PS。压缩后的CNN网络占用资源相对小很多,可以部署在片上存储器中,可以更快更灵活的切换CNN网络。


 

图1:AIScale在计算机视觉应用案例示意图


AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core),用户根据需求可以灵活自定义AIScale RCC模块的数量,AIScale RCC支持卷积预处理、池化/采样、加权和全连接层等处理。资源更丰富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模块,这会给AIScale加速器带来更大的性能提升。当然也可以根据成本、系统功耗、性能需求集成一定的AIScale RCC模块,选择合适的Xilinx FPGA器件。


 

图2:多个 AIScale RCC模块级联连接


KORTIQ公司目前专注于嵌入式和计算机视觉领域,设计工业4.0和物联网(IoT)等,未来将会为AIScale CNN加速器提供更多更先进的特性,比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等,将先进的人工智能网络应用到自动化生产、控制等场景中,提高相关行业的生产力为用户带来更好的服务。


 


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
光纤通道的实时数字图像存储