对象检测

使用卷积神经网络(cnn或ConvNets)执行分类，对象检测，迁移学习，创建自定义检测器

目标检测是一种定位图像或视频中目标实例的计算机视觉技术。目标检测算法通常利用机器学习或深度学习产生有意义的结果。在观看图像或视频时，人类可以在瞬间识别并定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量标记的训练图像，因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets)，如R-CNN和YOLO，或使用单次检测(SSD)。您可以训练自定义对象检测器，或者通过杠杆使用预训练的对象检测器转移学习这种方法使您能够从预训练的网络开始，然后根据您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。在CUDA上支持训练和预测^®有能力的GPU。建议使用GPU，并且需要Parallel Computing Toolbox™。有关更多信息，请参见计算机视觉工具箱偏好和MathWorks产品中的并行计算支持2022世界杯八强谁会赢？(并行计算工具箱)。

用于目标检测的机器学习技术包括聚合通道特征(ACF)，使用定向梯度直方图(HOG)特征的支持向量机(SVM)分类，以及用于人脸或上体检测的Viola-Jones算法。您可以选择从一个预训练的对象检测器开始，或者创建一个适合您的应用程序的自定义对象检测器。

应用程序

图片标志	用于计算机视觉应用的标签图像
贴标签机视频	用于计算机视觉应用的标签视频

功能

全部展开

检测对象

深度学习检测器

`rcnnObjectDetector`	使用R-CNN深度学习检测器检测对象
`fastRCNNObjectDetector`	使用Fast R-CNN深度学习检测器检测对象
`fasterRCNNObjectDetector`	使用Faster R-CNN深度学习检测器检测对象
`ssdObjectDetector`	使用SSD深度学习检测器检测对象
`yolov2ObjectDetector`	使用YOLO v2对象检测器检测对象
`yolov3ObjectDetector`	使用YOLO v3对象检测器检测对象
`yolov4ObjectDetector`	使用YOLO v4对象检测器检测对象
`maskrcnn`	使用掩码R-CNN实例分割检测对象

基于功能的探测器

`光学字符识别`	使用光学字符识别识别文本
`readAprilTag`	检测和估计图像中AprilTag的姿态
`readBarcode`	检测和解码图像中的一维或二维条码
`acfObjectDetector`	使用聚合通道特征检测对象
`peopleDetectorACF`	检测使用聚合通道功能的人员
`愿景。CascadeObjectDetector`	使用维奥拉-琼斯算法检测对象
`愿景。ForegroundDetector`	基于高斯混合模型的前景检测
`愿景。PeopleDetector`	使用HOG特征检测直立的人
`愿景。BlobAnalysis`	连通区域的性质

使用点特征检测对象

`detectBRISKFeatures`	检测轻快特征并返回`BRISKPoints`对象
`detectFASTFeatures`	使用FAST算法检测角点并返回`cornerPoints`对象
`detectHarrisFeatures`	使用Harris-Stephens算法检测角点并返回`cornerPoints`对象
`detectKAZEFeatures`	检测KAZE特征并返回`KAZEPoints`对象
`detectMinEigenFeatures`	使用最小特征值算法检测角点并返回`cornerPoints`对象
`detectMSERFeatures`	检测MSER功能并返回`MSERRegions`对象
`detectORBFeatures`	检测ORB关键点并返回一个`ORBPoints`对象
`detectSIFTFeatures`	检测尺度不变特征变换(SIFT)特征并返回`SIFTPoints`对象
`detectSURFFeatures`	检测SURF特征并返回`SURFPoints`对象
`extractFeatures`	提取兴趣点描述符
`matchFeatures`	寻找匹配的特征

选择检测对象

`selectStrongestBbox`	从重叠簇中选择最强的边界框
`selectStrongestBboxMulticlass`	从重叠簇中选择最强的多类边界框

训练自定义对象检测器

负荷训练数据

`boxLabelDatastore`	用于边界框标签数据的数据存储
`groundTruth`	地面真值标签数据
`imageDatastore`	用于图像数据的数据存储
`objectDetectorTrainingData`	为目标检测器创建训练数据
`结合`	合并来自多个数据存储的数据

训练基于特征的对象检测器

`trainACFObjectDetector`	训练ACF对象检测器
`trainCascadeObjectDetector`	训练级联目标检测器模型
`trainImageCategoryClassifier`	训练一个图像分类器

训练基于深度学习的对象检测器

`trainRCNNObjectDetector`	训练一个R-CNN深度学习对象检测器
`trainFastRCNNObjectDetector`	训练一个快速R-CNN深度学习对象检测器
`trainFasterRCNNObjectDetector`	训练一个更快的R-CNN深度学习对象检测器
`trainSSDObjectDetector`	训练一个SSD深度学习对象检测器
`trainYOLOv2ObjectDetector`	训练YOLO v2目标检测器
`trainYOLOv4ObjectDetector`	训练YOLO v4目标检测器
`trainMaskRCNN`	训练掩码R-CNN网络执行实例分割

增强和预处理深度学习训练数据

`balanceBoxLabels`	用于目标检测的平衡边界框标签
`bboxcrop`	裁剪边框
`bboxerase`	移除边界框
`bboxresize`	调整边界框大小
`bboxwarp`	对边界框应用几何变换
`bbox2points`	将矩形转换为角点列表
`imwarp`	应用几何变换图像
`imcrop`	作物图像
`imresize`	调整图像
`randomAffine2d`	创建随机的二维仿射变换
`centerCropWindow2d`	创建矩形中心裁剪窗口
`randomWindow2d`	在图像中随机选择矩形区域
`integralImage`	计算二维积分图像

设计目标检测深度神经网络

R-CNN(卷积神经网络区域)

`rcnnBoxRegressionLayer`	用于Fast和Faster R-CNN的盒回归层
`fasterRCNNLayers`	创建一个更快的R-CNN目标检测网络
`rpnSoftmaxLayer`	区域建议网络(RPN)的Softmax层
`rpnClassificationLayer`	区域提议网络(RPNs)的分类层
`regionProposalLayer`	更快R-CNN的区域提议层
`roiAlignLayer`	Mask-CNN的非量化ROI池化层
`roiInputLayer`	快速R-CNN的ROI输入层
`roiMaxPooling2dLayer`	神经网络层用于输出固定大小的矩形roi特征映射
`roialign`	的非量化ROI池化`dlarray`数据

YOLO v2 (You Only Look Once version 2)

`yolov2Layers`	创建YOLO v2目标检测网络
`yolov2TransformLayer`	创建YOLO v2对象检测网络的变换层
`yolov2OutputLayer`	创建YOLO v2目标检测网络的输出层
`spaceToDepthLayer`	距深层

焦损层

`focalLossLayer`	使用焦损函数创建焦损层
`focalCrossEntropy`	计算焦点交叉熵损失

SSD(单镜头探测器)

ssdMergeLayer 创建用于对象检测的SSD合并层

锚箱

estimateAnchorBoxes 估计深度学习对象检测器的锚盒

可视化检测结果

`cuboid2img`	项目长方体从三维世界坐标到二维图像坐标
`insertObjectAnnotation`	注释原色或灰度图像或视频流
`insertObjectMask`	在图像或视频流中插入掩码
`insertShape`	在图像或视频中插入形状
`showShape`	在图像、视频或点云上显示形状

评估检测结果

`evaluateDetectionAOS`	评估目标检测的平均方向相似度度量
`evaluateDetectionMissRate`	评估目标检测的脱靶率指标
`evaluateDetectionPrecision`	评估目标检测的精度度量
`bboxOverlapRatio`	计算边界框重叠比
`bboxPrecisionRecall`	计算边界盒精度和召回对地面真值
`evaluateInstanceSegmentation`	根据真实情况评估实例分割数据集
`instanceSegmentationMetrics`	实例分割质量指标

块

深度学习对象检测器

使用经过训练的深度学习对象检测器检测对象

主题

开始

开始使用深度学习进行对象检测
使用深度学习神经网络的目标检测。
点特征类型
为几种类型的特征选择返回和接受点对象的函数。
坐标系统
指定像素索引、空间坐标和三维坐标系统
局部特征检测与提取
学习局部特征检测和提取的好处和应用。
基于视觉词袋的图像分类
使用计算机视觉工具箱™功能，通过创建一个视觉词包进行图像类别分类。
开始使用级联对象检测器
训练一个自定义分类器
选择功能显示检测到的对象
比较可视化函数。

目标检测和语义分割的训练数据

开始使用图像标签器
交互式标记用于对象检测的矩形roi，用于语义分割的像素，用于实例分割的多边形和用于图像分类的场景。
开始使用视频标签器
交互式标记用于对象检测的矩形roi，用于语义分割的像素，用于实例分割的多边形，以及用于视频或图像序列中的图像分类的场景。
深度学习的数据存储(深度学习工具箱)
了解如何在深度学习应用程序中使用数据存储。
开始使用掩码R-CNN进行实例分割
使用掩码R-CNN和深度学习执行多类实例分割。
目标检测和语义分割的训练数据
为对象检测或语义分割创建训练数据图片标志或贴标签机视频。

开始学习深度学习

深度网络设计器(深度学习工具箱)
深度学习层列表(深度学习工具箱)
发现MATLAB中的所有深度学习层^®。
MATLAB中的深度学习(深度学习工具箱)
使用卷积神经网络在MATLAB中发现用于分类和回归的深度学习功能，包括预训练网络和迁移学习，以及在gpu、cpu、集群和云上进行训练。
预训练深度神经网络(深度学习工具箱)
学习如何下载和使用预训练的卷积神经网络进行分类、迁移学习和特征提取。