使用GoogLeNet对图像进行分类
这个例子展示了如何使用预先训练的深度卷积神经网络GoogLeNet对图像进行分类。
GoogLeNet已经接受了超过100万张图片的训练,并可以将图片分类为1000个对象类别(如键盘、咖啡杯、铅笔和许多动物)。该网络已经学习了广泛的图像的丰富特征表示。该网络将图像作为输入,然后输出图像中对象的标签以及每个对象类别的概率。
负载Pretrained网络
加载预先训练的GoogLeNet网络。此步骤需要深度学习工具箱™模型GoogLeNet网络支持包。如果您没有安装所需的支持包,那么该软件将提供下载链接。
您还可以选择加载不同的预训练网络来进行图像分类。要尝试一个不同的预训练网络,在MATLAB®中打开这个例子并选择一个不同的网络。例如,你可以试试squeezenet
,这个网络甚至比googlenet
.您可以使用其他预先训练过的网络运行此示例。有关所有可用网络的列表,请参见负载Pretrained网络.
网=googlenet;
要分类的图像必须与网络的输入大小相同。对于GoogLeNet,第一个元素层
网络的属性是图像输入层。网络输入大小为InputSize
属性的图像输入层。
.InputSize inputSize = net.Layers (1)
inputSize =1×3224 224 3
的最后一个元素层
属性是分类输出层。的一会
属性包含网络学习到的类的名称。查看总共1000个类名中的10个随机类名。
一会= net.Layers .ClassNames(结束);numClasses =元素个数(类名);disp(类名(randperm (numClasses 10)))
“蝶耳犬”、“蛋奶酒”、“菠萝蜜”、“城堡”、“睡袋”、“红脚蛇”、“创可贴”、“锅”、“安全带”、“橙色”
读取和调整图像的大小
阅读并显示要分类的图像。
我= imread (“peppers.png”);图imshow(我)
显示图像的大小。该图像是384 × 512像素,有三个颜色通道(RGB)。
大小(我)
ans =1×3384 512 3
使用将图像调整为网络的输入大小imresize
.这种调整会略微改变图像的纵横比。
我= imresize(我inputSize (1:2));图imshow(我)
根据您的应用程序,您可能希望以不同的方式调整图像的大小。例如,您可以使用我(1:inputSize (1), 1: inputSize (2):)
.如果您有图像处理工具箱™,则可以使用imcrop
函数。
图像的分类
对图像进行分类并计算类概率分类
.网络正确地将图像分类为甜椒。分类网络被训练为为每个输入图像输出单一标签,即使图像包含多个对象。
(标签,分数)=分类(净,我);标签
标签=分类甜椒
显示带有预测标签的图像和具有该标签的图像的预测概率。
图imshow(I)标题(字符串(标签)+”、“+ num2str(100*scores(classNames == label),3) +“%”);
显示前预测
以直方图的形式显示前五个预测标签及其相关概率。由于网络将图像划分为许多对象类别,而且许多类别是相似的,所以在评估网络时通常会考虑前五名的准确性。该网络以很高的概率将该图像分类为甜椒。
[~, idx] =排序(分数,“下”);idx = idx (5: 1:1);classNamesTop = net.Layers(结束).ClassNames (idx);scoresTop =分数(idx);图barh(scoresTop) xlim([0 1]) title(“5大预言”)包含(“概率”) yticklabels (classNamesTop)
参考文献
[1] Szegedy, Christian,刘伟,贾扬青,Pierre Sermanet, Scott Reed, Dragomir angelov, Dumitru Erhan, Vincent Vanhoucke和Andrew Rabinovich。“更深入地研究卷积。”在IEEE计算机视觉和模式识别会议论文集1 - 9页。2015.
[2]BVLC GoogLeNet模型.https://github.com/BVLC/caffe/tree/master/models/bvlc_googlenet
另请参阅
DAGNetwork
|googlenet
|分类
|预测
|squeezenet