量化和修剪
通过执行量化或修剪来压缩深度神经网络
功能
应用程序
深层网络量化器 | 将深度神经网络量化为8位缩放整数数据类型 |
主题
GPU目标量化
- 为深度学习网络生成INT8代码(GPU编码器)
为预训练的卷积神经网络量化和生成代码。 - 量化残差网络训练的图像分类和生成CUDA代码
这个例子展示了如何量化深度学习神经网络卷积层中的可学习参数,该神经网络具有残差连接,并经过CIFAR-10数据的图像分类训练。 - 量化层在对象检测器和生成CUDA代码
这个例子展示了如何为SSD车辆检测器和YOLO v2车辆检测器生成CUDA®代码,该检测器以8位整数为卷积层执行推理计算。
FPGA目标的量化
- 将INT8网络部署到FPGA(深度学习HDL工具箱)
通过将卷积层的权重、偏差和激活量化为8位缩放整数数据类型,减少深度神经网络的内存占用。 - 基于量化DAG网络的FPGA图像分类(深度学习HDL工具箱)
在本例中,使用深度学习HDL工具箱™部署量化深度卷积神经网络并对图像进行分类。 - 利用量化的GoogLeNet网络在FPGA上对图像进行分类(深度学习HDL工具箱)
这个例子展示了如何使用深度学习HDL工具箱™部署一个量化的GoogleNet网络来对图像进行分类。
CPU目标的量化
- 为深度学习网络生成int8代码(MATLAB编码器)
为预训练的卷积神经网络量化和生成代码。 - 为树莓派的深度学习网络生成INT8代码(MATLAB编码器)
为在8位整数中执行推理计算的深度学习网络生成代码。
修剪
- 图像分类网络的参数修剪与量化
使用参数修剪和量化来减小网络的规模。 - 用泰勒分数修剪图像分类网络
这个例子展示了如何使用泰勒修剪减小深度神经网络的大小。 - 基于泰勒分数的检测网络剪枝滤波器
这个例子展示了如何在you only look once (YOLO) v3对象检测网络中通过修剪卷积滤波器来减小网络规模和提高推理速度。