对象检测
使用卷积神经网络(cnn或ConvNets)执行分类,对象检测,迁移学习,创建自定义检测器
目标检测是一种定位图像或视频中目标实例的计算机视觉技术。目标检测算法通常利用机器学习或深度学习产生有意义的结果。在观看图像或视频时,人类可以在瞬间识别并定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。
深度学习技术需要大量标记的训练图像,因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets),如R-CNN和YOLO,或使用单次检测(SSD)。您可以训练自定义对象检测器,或者通过杠杆使用预训练的对象检测器转移学习这种方法使您能够从预训练的网络开始,然后根据您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。在CUDA上支持训练和预测®有能力的GPU。建议使用GPU,并且需要Parallel Computing Toolbox™。有关更多信息,请参见计算机视觉工具箱偏好和MathWorks产品中的并行计算支持2022世界杯八强谁会赢?(并行计算工具箱)。
用于目标检测的机器学习技术包括聚合通道特征(ACF),使用定向梯度直方图(HOG)特征的支持向量机(SVM)分类,以及用于人脸或上体检测的Viola-Jones算法。您可以选择从一个预训练的对象检测器开始,或者创建一个适合您的应用程序的自定义对象检测器。
功能
块
深度学习对象检测器 | 使用经过训练的深度学习对象检测器检测对象 |
主题
开始
- 开始使用深度学习进行对象检测
使用深度学习神经网络的目标检测。 - 点特征类型
为几种类型的特征选择返回和接受点对象的函数。 - 坐标系统
指定像素索引、空间坐标和三维坐标系统 - 局部特征检测与提取
学习局部特征检测和提取的好处和应用。 - 基于视觉词袋的图像分类
使用计算机视觉工具箱™功能,通过创建一个视觉词包进行图像类别分类。 - 开始使用级联对象检测器
训练一个自定义分类器 - 选择功能显示检测到的对象
比较可视化函数。
目标检测和语义分割的训练数据
- 开始使用图像标签器
交互式标记用于对象检测的矩形roi,用于语义分割的像素,用于实例分割的多边形和用于图像分类的场景。 - 开始使用视频标签器
交互式标记用于对象检测的矩形roi,用于语义分割的像素,用于实例分割的多边形,以及用于视频或图像序列中的图像分类的场景。 - 深度学习的数据存储(深度学习工具箱)
了解如何在深度学习应用程序中使用数据存储。 - 开始使用掩码R-CNN进行实例分割
使用掩码R-CNN和深度学习执行多类实例分割。 - 目标检测和语义分割的训练数据
为对象检测或语义分割创建训练数据图片标志或贴标签机视频。
开始学习深度学习
- 深度网络设计器(深度学习工具箱)
- 深度学习层列表(深度学习工具箱)
发现MATLAB中的所有深度学习层®。 - MATLAB中的深度学习(深度学习工具箱)
使用卷积神经网络在MATLAB中发现用于分类和回归的深度学习功能,包括预训练网络和迁移学习,以及在gpu、cpu、集群和云上进行训练。 - 预训练深度神经网络(深度学习工具箱)
学习如何下载和使用预训练的卷积神经网络进行分类、迁移学习和特征提取。