帮助中心帮助中心

量化和修剪

通过执行量化或修剪来压缩深度神经网络

使用深度学习工具箱™和深度学习工具箱模型量化库减少深度神经网络的内存占用和计算需求的支持包:

量化层的权重、偏差和激活，以减少精确伸缩的整数数据类型。然后你可以生成C/ c++， CUDA^®，或来自这个量化网络的HDL代码。
对于C/ c++和CUDA代码生成，该软件通过量化卷积层的权重、偏差和激活到8位缩放整数数据类型，为卷积深度神经网络生成代码。通过提供由。产生的校准结果文件来执行量化校准函数codegen(MATLAB编码器)命令。
代码生成不支持量化的深度神经网络产生数字转换函数。
使用一阶泰勒近似从卷积层中修剪滤波器。然后，您可以从这个经过修剪的网络生成C/ c++或CUDA代码。

功能

量化

`dlquantizer`	将深度神经网络量化为8位缩放整数数据类型
`dlquantizationOptions`	量化一个训练过的深度神经网络的选项
`校准`	模拟和收集深度神经网络的范围
`数字转换`	量化深度神经网络
`验证`	量化和验证一个深度神经网络
`quantizationDetails`	显示神经网络的量化细节
`estimateNetworkMetrics`	估计神经网络的特定层的网络度量
`equalizeLayers`	深度神经网络层参数的均衡化

修剪

`taylorPrunableNetwork`	可以用一阶泰勒近似修剪的网络
`向前`	计算用于训练的深度学习网络输出
`预测`	计算用于推理的深度学习网络输出
`updatePrunables`	根据重要性分数从prable层中删除过滤器
`updateScore`	计算和积累基于泰勒的重要分数修剪
`dlnetwork`	用于定制训练循环的深度学习网络

应用程序

深层网络量化器

将深度神经网络量化为8位缩放整数数据类型

主题

深度学习量化

深度神经网络的量化
了解量化的效果以及如何可视化网络卷积层的动态范围。
量化工作流先决条件
2022世界杯八强谁会赢？深度学习网络量化所需的产品。

GPU目标量化

为深度学习网络生成INT8代码(GPU编码器)
为预训练的卷积神经网络量化和生成代码。
量化残差网络训练的图像分类和生成CUDA代码
这个例子展示了如何量化深度学习神经网络卷积层中的可学习参数，该神经网络具有残差连接，并经过CIFAR-10数据的图像分类训练。
量化层在对象检测器和生成CUDA代码
这个例子展示了如何为SSD车辆检测器和YOLO v2车辆检测器生成CUDA®代码，该检测器以8位整数为卷积层执行推理计算。

FPGA目标的量化

将INT8网络部署到FPGA(深度学习HDL工具箱)
通过将卷积层的权重、偏差和激活量化为8位缩放整数数据类型，减少深度神经网络的内存占用。
基于量化DAG网络的FPGA图像分类(深度学习HDL工具箱)
在本例中，使用深度学习HDL工具箱™部署量化深度卷积神经网络并对图像进行分类。
利用量化的GoogLeNet网络在FPGA上对图像进行分类(深度学习HDL工具箱)
这个例子展示了如何使用深度学习HDL工具箱™部署一个量化的GoogleNet网络来对图像进行分类。

CPU目标的量化

为深度学习网络生成int8代码(MATLAB编码器)
为预训练的卷积神经网络量化和生成代码。
为树莓派的深度学习网络生成INT8代码(MATLAB编码器)
为在8位整数中执行推理计算的深度学习网络生成代码。

修剪

图像分类网络的参数修剪与量化
使用参数修剪和量化来减小网络的规模。
用泰勒分数修剪图像分类网络
这个例子展示了如何使用泰勒修剪减小深度神经网络的大小。
基于泰勒分数的检测网络剪枝滤波器
这个例子展示了如何在you only look once (YOLO) v3对象检测网络中通过修剪卷积滤波器来减小网络规模和提高推理速度。

特色的例子

图像分类网络的参数修剪与量化

图像分类网络的参数修剪与量化

使用参数修剪和量化来减小网络的规模。

打开生活的脚本

用泰勒分数修剪图像分类网络

用泰勒分数修剪图像分类网络

使用泰勒修剪减小深度神经网络的大小。通过使用taylorPrunableNetwork函数去除卷积层过滤器，可以减小整个网络的大小并提高推理速度。

打开生活的脚本

基于泰勒分数的检测网络剪枝滤波器

基于泰勒分数的检测网络剪枝滤波器

通过修剪只看一次(YOLO) v3对象检测网络中的卷积滤波器，减少网络规模并提高推理速度。

打开生活的脚本