深度学习HDL工具箱

深度学习HDL工具箱

在fpga和soc上原型和部署深度学习网络

开始:

fpga的深度学习推理

在fpga上原型和实现用于边缘部署的深度学习网络。

可编程深度学习处理器

该工具箱包括一个深度学习处理器,其特点是通用卷积和由调度逻辑控制的全连接层。该深度学习处理器执行基于fpga的网络推理深度学习工具箱™。高带宽存储接口加快了层和权重数据的存储传输速度。

深度学习处理器包含通用卷积和完全连接的处理模块,这些模块被编程为执行指定的网络。

深度学习处理器架构。

编译和部署

将你的深度学习网络编译成一组由深度学习处理器运行的指令。部署到FPGA并运行预测,同时捕获实际的设备上性能指标。

将你的深度学习网络编译成一组要部署到深度学习处理器的指令。

编译和部署YOLO v2网络。

基于fpga的MATLAB推理

用MATLAB在fpga上运行深度学习推理。

创建待部署网络

首先使用深度学习工具箱来设计、训练和分析您的深度学习网络,以完成对象检测或分类等任务。您还可以从其他框架导入经过训练的网络或层开始。

将网络部署到FPGA

一旦你有了一个训练有素的网络,使用部署命令编程FPGA与深度学习处理器以及以太网或JTAG接口。然后使用编译命令为您的训练网络生成一组指令,而无需重新编程FPGA。

使用MATLAB对电路板和接口进行配置,编译网络,并部署到FPGA上。

使用MATLAB配置板和接口,编译网络,并部署到FPGA。

在MATLAB应用程序中运行基于fpga的推理

在MATLAB中运行整个应用程序®,包括你的测试台,预处理和后处理算法,以及基于fpga的深度学习推理。一个MATLAB命令,预测,在FPGA上执行推理并将结果返回到MATLAB工作空间。

捕获图像的MATLAB循环,通过为AlexNet调整大小对其进行预处理,在FPGA上运行深度学习推理,然后后处理并显示结果。

在FPGA上运行执行深度学习推理的MATLAB应用程序。

网络定制

调整您的深度学习网络,以满足目标FPGA或SoC设备上的特定应用需求。

FPGA推理

在FPGA上运行预测时测量层级延迟,以找到性能瓶颈。

深度学习推理分析指标。

基于FPGA的深度学习网络推理。

优化网络设计

使用配置文件度量,使用深度学习工具箱调整网络配置。例如,使用深度网络设计器添加层、删除层或创建新连接。

部署自定义RTL实现

部署深度学习处理器的自定义RTL实现到任何FPGA, ASIC或SoC设备与HDL编码器。

自定义深度学习处理器配置

指定实现深度学习处理器的硬件架构选项,例如并行线程的数量或最大层大小。

生成可合成的RTL

使用HDL编码器从深度学习处理器生成可合成的RTL,用于各种实现工作流和设备。在原型和生产部署中重用相同的深度学习处理器。

dlhdl。BuildProcessor类从自定义深度学习处理器生成可合成的RTL。

从深度学习处理器生成可合成的RTL。

生成集成IP核

当HDL Coder从深度学习处理器生成RTL时,它还生成一个带有标准AXI接口的IP核,用于集成到SoC参考设计中。

HDL编码器生成一个IP核,将深度学习处理器的输入和输出映射到AXI接口。

目标平台接口表,显示I/O和AXI接口之间的映射。

Baidu
map