愿景。CascadeObjectDetector

使用Viola-Jones算法检测对象

在页面中全部展开

描述

级联对象检测器使用维奥拉-琼斯算法来检测人们的脸、鼻子、眼睛、嘴巴或上半身。你也可以使用图片标志训练用于此System对象的自定义分类器。有关该函数如何工作的详细信息，请参见开始使用级联对象检测器．

检测:在图像中检测面部特征或上半身:

创建愿景。CascadeObjectDetector对象并设置其属性。
调用带有参数的对象，就像调用函数一样。

要了解更多关于System对象如何工作的信息，请参见什么是系统对象?

创建

语法

探测器=愿景。CascadeObjectDetector

探测器= vision.CascadeObjectDetector(模型)

探测器= vision.CascadeObjectDetector (XMLFILE)

探测器= vision.CascadeObjectDetector(名称、值)

描述

例子

探测器=愿景。CascadeObjectDetector创建一个检测器，使用维奥拉-琼斯算法检测对象。

探测器=愿景。CascadeObjectDetector (模型）创建一个检测器，配置为检测由输入字符向量定义的对象，模型．

探测器=愿景。CascadeObjectDetector (XMLFILE）类指定的自定义分类模型XMLFILE输入。

探测器=愿景。CascadeObjectDetector (名称,值）使用一个或多个名值对设置属性。将每个属性名用引号括起来。例如,探测器= vision.CascadeObjectDetector(“ClassificationModel”、“UpperBody”)

属性

全部展开

除非另有说明，属性为nontunable，这意味着在调用对象后不能更改它们的值。对象在调用时锁定，而释放函数打开它们。

如果属性是可调，您可以随时更改其值。

有关更改属性值的更多信息，请参见在MATLAB中使用系统对象设计系统．

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`(默认)|`字符串`

训练级联分类模型，指定为字符向量。的ClassificationModel属性控制要检测的对象的类型。默认情况下，检测器被配置为检测人脸。

您可以将此字符向量设置为包含自定义分类模型的XML文件，或者设置为下面列出的有效模型字符向量之一。方法可以训练自定义分类模型trainCascadeObjectDetector函数。该函数可以使用haar类特征、定向梯度直方图(HOG)或局部二值模式(LBP)训练模型。该函数的使用方法请参见开始使用级联对象检测器．

分类模型	用于训练模型的图像大小	模型描述
`“FrontalFaceCART”`(默认)	20 [20]	检测垂直和向前的面。该模型基于分类与回归树分析(CART)，由弱分类器组成。这些分类器使用哈尔特征来编码面部特征。基于cart的分类器提供了建模人脸特征之间高阶依赖关系的能力。[1]
`“FrontalFaceLBP”`	24 (24)	检测垂直和向前的面。该模型以决策残桩为基础，由弱分类器组成。这些分类器使用局部二进制模式(LBP)对面部特征进行编码。LBP特征可以对光照变化提供鲁棒性。[２]
`“UpperBody”`	(18 22)	检测上半身区域，它被定义为头和肩膀区域。该模型使用Haar特征对头部和肩部区域的细节进行编码。因为它在头部周围使用了更多的特征，这个模型对姿势的变化(例如头部旋转/倾斜)更健壮。[3]
`“EyePairBig”` `“EyePairSmall”`	45 [11] 22 [5]	发现了一双眼睛。的`“EyePairSmall”`模型使用较小的图像进行训练。这使模型能够检测到比`“EyePairBig”`可以检测模型。[4]
`“LeftEye”` `“RightEye”`	18 [12]	分别检测左右眼。这些模型是由基于决策残桩的弱分类器组成的。这些分类器使用Haar特性对细节进行编码。[4]
`“LeftEyeCART”` `“RightEyeCART”`	20 [20]	分别检测左右眼。构成这些模型的弱分类器是cart树。与决策树桩相比，基于cart树的分类器能够更好地建模高阶依赖项。［5］
`“ProfileFace”`	20 [20]	检测正面轮廓。该模型以决策残桩为基础，由弱分类器组成。这些分类器使用Haar特征对人脸细节进行编码。
`“口”`	25 [15]	检测到嘴。该模型由基于决策残桩的弱分类器组成，利用Haar特征对口腔细节进行编码。[4]
`“鼻子”`	(15 18)	该模型由基于决策残桩的弱分类器组成，利用Haar特征对鼻子细节进行编码。[4]

`MinSize`- - - - - -最小可探测物体的大小
`［］`(默认)|双元素向量

最小可探测物体的大小，指定为双元素向量[高度宽度］．为包含对象的最小区域设置此属性(以像素为单位)。该值必须大于或等于用于训练模型的图像大小。如果在处理图像之前知道了最小对象大小，则可以使用此属性减少计算时间。如果不为该属性指定值，则检测器将其设置为用于训练分类模型的图像的大小。

详细说明设置可检测对象的大小与ScaleFactor财产,看到算法部分。

可调:是的

`最大尺寸`- - - - - -最大可探测物体的尺寸
`［］`(默认)|双元素向量

最大可探测物体的大小，指定为双元素向量[高度宽度］．指定要检测的最大对象的像素大小。如果在处理图像之前知道了最大对象大小，则可以使用此属性减少计算时间。当您没有为该属性指定值时，检测器将其设置为大小（我）.

详细说明设置可检测对象的大小与ScaleFactor财产,看到算法部分。

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`(默认)|标量

用于多尺度对象检测的缩放，指定为大于1.0001．之间的比例因子递增地缩放检测分辨率MinSize而且最大尺寸．您可以使用以下方法将比例因子设置为理想值:

大小（我) / (大小（我）-0．5）

探测器以之间的增量缩放搜索区域MinSize而且最大尺寸使用以下关系:

搜索区域＝轮（(培训规模) * (ScaleFactor^N）)

N当前增量是一个大于零的整数吗培训规模是用于训练分类模型的图像大小。

可调:是的

`MergeThreshold`- - - - - -检测阈值
`4`(默认)|整数

检测门限，整数形式。阈值定义了在一个对象周围有多个检测的区域中声明最终检测所需的标准。满足阈值的配置检测组被合并，以在目标对象周围生成一个边界框。通过要求在多尺度检测阶段多次检测目标对象，增加这个阈值可能有助于抑制错误检测。当您将此属性设置为0，不进行阈值或合并操作，返回所有检测。此属性是可调的。

`UseROI`- - - - - -使用感兴趣的区域
`假`(默认)|`真正的`

使用感兴趣的区域，指定为假或真正的．将此属性设置为真正的在输入图像中感兴趣的矩形区域内检测物体。

使用

语法

bbox =探测器(我)

bbox =检测器(roi),我

detectionResults =探测器(ds)

描述

bbox=探测器(我）返回一个米4矩阵,bbox,定义了米包含检测到的对象的包围框。探测器对输入图像进行多尺度目标检测，我．

bbox=探测器(我，roi）方法指定的矩形搜索区域内检测对象roi．设置“UseROI”财产真正的要使用此语法。我是灰度或真彩色(RGB)图像。

detectionResults=探测器(ds）控件返回的所有图像中检测对象读输入数据存储的函数。

输入参数

全部展开

`我`- - - - - -输入图像
灰度|真彩(RGB)

输入图像，指定为灰度或真彩色(RGB)。

`ds`- - - - - -数据存储
`数据存储`对象

数据存储，指定为数据存储对象，该对象包含图像集合。每张图片必须是灰度或RGB。该函数只处理数据存储的第一列，该列必须包含图像并且必须是单元格数组或具有多列的表。因此,数据存储读函数必须在第一列中返回图像数据。

`模型`- - - - - -分类模型
`“FrontalFaceCART”`(默认)|`字符串`

分类模型，指定为字符向量。的模型Input描述要检测的对象类型。有几个有效的模型字符向量，例如'FrontalFaceCART”、“UpperBody”和“ProfileFace”。看到ClassificationModel可用模型的完整列表的属性描述。

`XMLFILE`- - - - - -自定义分类模型
XML文件

自定义分类模型，指定为XML文件。的XMLFILE可以使用trainCascadeObjectDetector函数或OpenCV(开源计算机视觉)训练功能。对象的完整路径或相对路径XMLFILE，如果不是在MATLAB上^®路径。

`roi`- - - - - -感兴趣的矩形区域
研制出向量(默认)

图像内感兴趣的矩形区域我，指定为四元素向量，[xy宽度高度］．

输出参数

全部展开

`bbox`——检测
米4矩阵(默认)

侦测，作为米4元素的矩阵。输出矩阵的每一行都包含一个四元素向量[xy宽度高度，它以像素为单位指定边界框的左上角和大小。

`detectionResults`——检测结果
三栏表

检测结果作为一个包含变量名的3列表返回，盒子，分数,标签．的盒子列米4矩阵,米在图像中找到的对象的边框。每一行包含一个作为4元素向量的边界框，格式为[x，y，宽度，高度］．该格式指定了相应图像中边界框的左上角位置和像素大小。

对象的功能

要使用对象函数，请将System对象™指定为第一个输入参数。例如，释放名为obj，使用以下语法:

发行版(obj)

全部展开

通用于所有系统对象

`一步`	运行系统对象算法
`释放`	释放资源并允许更改系统对象属性值和输入特征
`重置`	的内部状态重置系统对象

例子

全部折叠

利用正面人脸分类模型检测图像中的人脸

打开生活的脚本

创建一个人脸检测器对象。

faceDetector = vision.CascadeObjectDetector;

读取输入图像。

我= imread (“visionteam.jpg”）;

检测的面孔。

bboxes = faceDetector(我);

注释发现脸。

ifac = insertObjectAnnotation(我“矩形”bboxes,“脸”）;图imshow (ifac)标题(检测到人脸的）;

图中包含一个axes对象。标题为Detected faces的axes对象包含一个类型为image的对象。

用上半身分类模型检测图像中的上半身

打开生活的脚本

创建一个身体检测器对象并设置属性。

bodyDetector =愿景。CascadeObjectDetector (“UpperBody”）;bodyDetector。MinSize＝[60 60]; bodyDetector.MergeThreshold = 10;

读取输入图像并检测上身。

I2 = imread (“visionteam.jpg”）;bboxBody = bodyDetector (I2);

注释检测到的上身。

IBody = insertObjectAnnotation (I2,“矩形”bboxBody,“上身”）;图imshow (IBody)标题(检测到上半身的）;

图中包含一个axes对象。标题为Detected upper body的axes对象包含一个类型为image的对象。

算法

全部展开

分类模型的训练

每个模型都经过训练，以检测特定类型的对象。分类模型是通过从一组已知图像中提取特征来训练的。然后将这些提取的特征输入一个学习算法来训练分类模型。计算机视觉工具箱™软件使用维奥拉-琼斯级联对象检测器。这个检测器使用HOG[7],枸杞多糖[8], Haar-like[6]使用增强训练的特征和分类器级联。

用于训练分类器的图像大小定义了包含对象的最小区域。训练图像的大小根据应用程序、目标对象的类型和可用的正图像而不同。你必须设置MinSize属性设置为大于或等于用于训练模型的图像大小的值。

级联分类器的

该对象使用分级器来有效地处理目标对象存在的图像区域。级联中的每个阶段都应用越来越复杂的二进制分类器，这使得算法能够快速拒绝不包含目标的区域。如果在级联的任何阶段都没有找到所需的对象，检测器立即拒绝该区域并终止处理。通过终止，对象避免在级联中调用计算密集型的分类器。

多尺度对象检测

检测器增量缩放输入图像以定位目标对象。在每一次缩放增量中，一个与训练图像大小相同的滑动窗口扫描缩放后的图像来定位目标。的ScaleFactor属性确定连续增量之间的伸缩量。

搜索区域的大小与ScaleFactor用以下方法:

搜索区域＝轮（(ObjectTrainingSize) * (ScaleFactor^N）)

N当前增量是一个大于零的整数吗ObjectTrainingSize是用于训练分类模型的图像大小。

搜索窗口遍历每个缩放增量的图像。

MinSize、MaxSize和ScaleFactor的关系

理解要检测的对象的大小和比例因子之间的关系将帮助您相应地设置属性。的MinSize而且最大尺寸属性限制要检测的对象的大小范围。理想情况下，当您在处理图像之前知道近似的对象大小时，修改这些属性以减少计算时间。它们的设计目的不是基于对象大小提供精确的结果过滤。这些属性的行为受ScaleFactor的影响。比例因子决定了搜索窗口大小的量化。

搜索区域＝轮（(培训规模) * (ScaleFactor^N）)

方法所选择的对象大小的实际范围可能并不完全相同MinSize而且最大尺寸属性。例如,

对于一个ScaleFactor的价值1．1具有24x24的训练尺寸，用于5增量，搜索区域的计算将是:

>>搜索区域=轮(24*1.1.^(1:5))

>>26 29 32 35 39

如果你要设置最大尺寸来34，由于搜索区域的量化，算法实际使用的最大对象大小为32．

合并检测阈值

对于尺度的每一个增量，搜索窗口遍历图像，在目标对象周围产生多个检测。多个检测被合并到每个目标对象的一个边界框中。您可以使用MergeThreshold属性来控制在组合或拒绝检测之前所需的检测数量。最终边界框的大小是每个检测的边界框大小的平均值，介于两者之间MinSize而且最大尺寸．

参考文献

[1] Lienhart R.， Kuranov A.和V. Pisarevsky“用于快速目标检测的增强分类器检测级联的经验分析”。第25届DAGM模式识别研讨会论文集。德国马格德堡,2003年。

[2] Ojala Timo, Pietikäinen Matti，和Mäenpää Topi，“多分辨率灰度和旋转不变纹理分类与局部二进制模式”。在模式分析与机器智能学报，2002．第24卷，第7期，971-987页。

krupa H.， Castrillon-Santana M.和B. Schiele。“基于局部环境的快速和健壮的人脸搜索”。IEEE视觉监视与跟踪与监视性能评估联合国际研讨会论文集， 2003年，第157-164页。

[4] Castrillón Marco, Déniz Oscar, Guerra Cayetano，和Hernández Mario，“ENCARA2:实时检测视频流中不同分辨率的多个人脸”。在视觉传达与图像表示杂志， 2007 (18) 2: pp. 130-140。

[5]于士奇《眼睛检测》。石漆的主页。http://yushiqi.cn/research/eyedetection。

[6] Viola, Paul和Michael J. Jones，“使用简单特征增强级联的快速物体检测”，2001年IEEE计算机学会计算机视觉与模式识别会议论文集,2001年。数量:1、pp.511 - 518。

[7] Dalal, N.和B. Triggs，“面向人类检测的梯度直方图”。IEEE计算机学会计算机视觉和模式识别会议．第1卷(2005)，第886-893页。

[8] Ojala, T.， M. Pietikainen，和T. Maenpaa，“多分辨率灰度和旋转不变纹理分类与局部二进制模式”。模式分析与机器智能汇刊．第24卷，2002年7月7日，971-987页。

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

使用链接到OpenCV(版本3.4.0)库的c++编译器生成可移植的C代码。看到使用OpenCV库的函数的可移植C代码生成．
看到MATLAB代码生成中的系统对象(MATLAB编码器)．
XMLFILE必须是编译时常量。

版本历史

介绍了R2012a

另请参阅

图片标志|trainCascadeObjectDetector|insertShape|愿景。PeopleDetector|integralImage

主题

外部网站

检测和跟踪实时视频流中的多个面孔

愿景。CascadeObjectDetector

描述

创建

语法

描述

属性

ClassificationModel- - - - - -训练级联分类模型“FrontalFaceCART”(默认)|字符串

MinSize- - - - - -最小可探测物体的大小［］(默认)|双元素向量

最大尺寸- - - - - -最大可探测物体的尺寸［］(默认)|双元素向量

ScaleFactor- - - - - -用于多尺度目标检测的缩放1．1(默认)|标量

MergeThreshold- - - - - -检测阈值4(默认)|整数

UseROI- - - - - -使用感兴趣的区域假(默认)|真正的

使用

语法

描述

输入参数

我- - - - - -输入图像灰度|真彩(RGB)

ds- - - - - -数据存储数据存储对象

模型- - - - - -分类模型“FrontalFaceCART”(默认)|字符串

XMLFILE- - - - - -自定义分类模型XML文件

roi- - - - - -感兴趣的矩形区域研制出向量(默认)

输出参数

bbox——检测米4矩阵(默认)

detectionResults——检测结果三栏表

对象的功能

通用于所有系统对象

例子

利用正面人脸分类模型检测图像中的人脸

用上半身分类模型检测图像中的上半身

算法

分类模型的训练

级联分类器的

多尺度对象检测

MinSize、MaxSize和ScaleFactor的关系

合并检测阈值

参考文献

扩展功能

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

版本历史

另请参阅

主题

外部网站

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`(默认)|`字符串`

`MinSize`- - - - - -最小可探测物体的大小
`［］`(默认)|双元素向量

`最大尺寸`- - - - - -最大可探测物体的尺寸
`［］`(默认)|双元素向量

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`(默认)|标量

`MergeThreshold`- - - - - -检测阈值
`4`(默认)|整数

`UseROI`- - - - - -使用感兴趣的区域
`假`(默认)|`真正的`

`我`- - - - - -输入图像
灰度|真彩(RGB)

`ds`- - - - - -数据存储
`数据存储`对象

`模型`- - - - - -分类模型
`“FrontalFaceCART”`(默认)|`字符串`

`XMLFILE`- - - - - -自定义分类模型
XML文件

`roi`- - - - - -感兴趣的矩形区域
研制出向量(默认)

`bbox`——检测
米4矩阵(默认)

`detectionResults`——检测结果
三栏表

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。