主要内容

利用预训练网络对图像进行分类

这个例子展示了如何使用预先训练的深度卷积神经网络GoogLeNet对图像进行分类。

GoogLeNet已经接受了超过100万张图片的训练,并可以将图片分类为1000个对象类别(如键盘、咖啡杯、铅笔和许多动物)。该网络已经学习了广泛的图像的丰富特征表示。该网络将图像作为输入,然后输出图像中对象的标签以及每个对象类别的概率。

负载Pretrained网络

加载预先训练的GoogLeNet网络。您还可以选择加载不同的预训练网络来进行图像分类。此步骤需要深度学习工具箱™模型GoogLeNet网络支持包。如果您没有安装所需的支持包,那么该软件将提供下载链接。

网= googlenet;

读取和调整图像的大小

要分类的图像必须与网络的输入大小相同。对于GoogLeNet,网络输入大小是InputSize属性的图像输入层。

读取要分类的图像,并将其调整为网络的输入大小。这种调整会略微改变图像的纵横比。

我= imread (“peppers.png”);inputSize = net.Layers (1) .InputSize;我= imresize(我inputSize (1:2));

图像分类和显示

用预测的标签对图像进行分类和显示。

标签=分类(净,我);图imshow(我)标题(string(标签)

图中包含一个axes对象。标题为bell pepper的axes对象包含一个类型为image的对象。

有关显示如何显示顶级预测及其相关概率的更详细示例,请参见使用GoogLeNet对图像进行分类

对于深度学习的下一步,您可以将预训练的网络用于其他任务。用迁移学习或特征提取解决图像数据的新分类问题。有关示例,请参见使用迁移学习快速启动深度学习而且使用从预训练网络中提取的特征的训练分类器.要尝试其他预先训练的网络,请参见预训练深度神经网络

参考文献

  1. Szegedy, Christian,刘伟,贾扬青,Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich。“更深入地研究卷积。”在IEEE计算机视觉和模式识别会议论文集1 - 9页。2015.

  2. BVLC GoogLeNet模型https://github.com/BVLC/caffe/tree/master/models/bvlc_googlenet

另请参阅

||

相关的话题

Baidu
map