主要内容

量化、投影和剪枝

通过执行量化、投影或修剪来压缩深度神经网络

使用深度学习工具箱™与深度学习工具箱模型量化库支持包通过以下方式减少深度神经网络的内存占用和计算需求:

  • 使用一阶泰勒近似从卷积层修剪滤波器。然后可以生成C/ c++或CUDA®来自这个修剪过的网络的代码。

  • 通过使用代表训练数据的数据集对层激活执行主成分分析(PCA)来投影层,并对层可学习参数应用线性投影。当您使用无库的C/ c++代码生成将网络部署到嵌入式硬件时,投影深度神经网络的向前传递通常会更快。

  • 量化层的权重、偏差和激活,以减少精确缩放的整数数据类型。然后,您可以从这个量化网络生成C/ c++、CUDA或HDL代码。

    对于C/ c++和CUDA代码生成,该软件通过将卷积层的权重、偏差和激活量化为8位缩放整数数据类型,为卷积深度神经网络生成代码。量化是通过提供校准结果文件产生的校准函数codegen(MATLAB编码器)命令。

    代码生成不支持量化深度神经网络生成数字转换函数。

功能

全部展开

taylorPrunableNetwork 可以使用一阶泰勒近似修剪的网络
向前 计算用于训练的深度学习网络输出
预测 计算用于推理的深度学习网络输出
updatePrunables 根据重要性分数从pritable层中删除过滤器
updateScore 计算和积累基于泰勒的重要性分数修剪
dlnetwork 用于定制训练循环的深度学习网络
compressNetworkUsingProjection 利用投影压缩神经网络
neuronPCA 神经元激活的主成分分析
dlquantizer 将深度神经网络量化为8位比例整数数据类型
dlquantizationOptions 量化一个训练好的深度神经网络的选项
校准 模拟和收集深度神经网络的范围
数字转换 量化深度神经网络
验证 量化和验证一个深度神经网络
quantizationDetails 显示神经网络的量化细节
estimateNetworkMetrics 估计神经网络特定层的网络指标
equalizeLayers 深度神经网络的层参数均衡

应用程序

深度网络量化器 将深度神经网络量化为8位比例整数数据类型

主题

修剪

投影

深度学习量化

GPU目标量化

FPGA目标的量化

CPU目标量化

Baidu
map