主要内容

量化和修剪

通过执行量化或修剪来压缩深度神经网络

使用深度学习工具箱™和深度学习工具箱模型量化库减少深度神经网络的内存占用和计算需求的支持包:

  • 量化层的权重、偏差和激活,以减少精确伸缩的整数数据类型。然后你可以生成C/ c++, CUDA®,或来自这个量化网络的HDL代码。

    对于C/ c++和CUDA代码生成,该软件通过量化卷积层的权重、偏差和激活到8位缩放整数数据类型,为卷积深度神经网络生成代码。通过提供由。产生的校准结果文件来执行量化校准函数codegen(MATLAB编码器)命令。

    代码生成不支持量化的深度神经网络产生数字转换函数。

  • 使用一阶泰勒近似从卷积层中修剪滤波器。然后,您可以从这个经过修剪的网络生成C/ c++或CUDA代码。

功能

全部展开

dlquantizer 将深度神经网络量化为8位缩放整数数据类型
dlquantizationOptions 量化一个训练过的深度神经网络的选项
校准 模拟和收集深度神经网络的范围
数字转换 量化深度神经网络
验证 量化和验证一个深度神经网络
quantizationDetails 显示神经网络的量化细节
estimateNetworkMetrics 估计神经网络的特定层的网络度量
equalizeLayers 深度神经网络层参数的均衡化
taylorPrunableNetwork 可以用一阶泰勒近似修剪的网络
向前 计算用于训练的深度学习网络输出
预测 计算用于推理的深度学习网络输出
updatePrunables 根据重要性分数从prable层中删除过滤器
updateScore 计算和积累基于泰勒的重要分数修剪
dlnetwork 用于定制训练循环的深度学习网络

应用程序

深层网络量化器 将深度神经网络量化为8位缩放整数数据类型

主题

深度学习量化

GPU目标量化

FPGA目标的量化

CPU目标的量化

修剪

Baidu
map