基于MATLAB的计算机视觉深度学习
学习MATLAB®可以帮助深度学习工作流程的任何部分:从预处理到部署。本视频提供了图像和视频深度学习技术的高级概述。它描述了完整的工作流程,并展示了MATLAB如何在各个阶段帮助深度学习应用程序,包括导入和预处理图像,导入预训练模型,使用gpu训练模型,调试深度学习结果,以及将深度学习模型部署到包括嵌入式gpu在内的硬件。
MATLAB中的深度学习框架包括一个完整的工作流程,可帮助您快速入门、识别问题并节省时间。
无论你是深度学习的初学者还是专家,MATLAB都能提供帮助——从预处理一直到部署。
设计一个深度学习模型至少可以说是具有挑战性的。
幸运的是,MATLAB有很多例子可以帮助你入门,它可以让你访问许多流行的模型,这些模型由专家设计,并在数百万张图像上进行了训练,这为迁移学习提供了一个很好的起点。
MATLAB提供了从Pytorch和TensorFlow-Keras导入模型的工具,以及ONNX导入和导出功能。
在你训练一个模型之前,你需要数据。很多。大型数据库随处可见,您可以从MATLAB中访问这些数据库,但为了产生任何合理的结果,我们需要将对象与“非对象”分开。如何在不花费数周时间的情况下给数千张图片中的物体贴上标签?
MATLAB提供了应用程序来帮助应对这一挑战。例如,
您可以在每张图像中选择您关心的对象
您甚至可以选择作为对象或类别一部分的像素。[这对于语义分割数据至关重要]
你可以通过使用物体检测器(自定义或预先构建的)来自动化这一过程,在整个视频中运行,并在几秒钟内生成物体的许多图像。
现在是训练网络的时候了。考虑到所有这些数据以及这些网络的复杂结构,这可能需要几个小时或几天的时间。为了加快速度,我们支持NVIDIA gpu。
MATLAB处理将数据传输到GPU或多个GPU,因此您不需要手动设置或自己编程。扩展到集群和云,更快地训练您的网络,甚至并行运行多个训练。
这里有一个人们有时会忽略的步骤:如果经过训练的网络表现不佳会发生什么?MATLAB可以帮助您深入了解网络。您可以可视化层,并查看当图像通过网络传递时实际发生了什么。你也可以将训练过程形象化,以便在训练结束前了解它的进展情况。
在这些步骤的最后,可能经过几次迭代之后,您就有了一个经过充分训练的网络来执行您的任务。现在是讨论部署的时候了。
MATLAB可以帮助您在任何地方快速部署代码,包括web、手机或嵌入式gpu。
MATLAB代码在GPU上运行预测非常快。显著的变化来自于代码生成优化CUDA代码(在NVIDIA gpu上本机运行的代码)。
你可以清楚地看到速度上的差异。
在其他领域也有关于深度学习的新研究,比如语音识别和文本分析。下面是在MATLAB中运行的两个非图像深度学习任务示例。
虽然它确实使深度学习更容易和更容易访问,但MATLAB不仅仅是一个深度学习框架。您还可以访问MATLAB提供的所有其他功能。
您还可以在MATLAB中访问其他语言。将您的开源工作带入MATLAB,然后使用我们丰富的可视化和应用程序来处理这些数据。
查看我们的网站,了解更多关于最新功能和入门方法的信息。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。