深度学习

什么是深度学习?

你需要知道三件事

深度学习是一种机器学习技术,它教会计算机做人类与生俱来的事情:以身作则。深度学习是无人驾驶汽车背后的一项关键技术,它使无人驾驶汽车能够识别停车标志,或区分行人和路灯柱。它是手机、平板电脑、电视和免提扬声器等消费设备语音控制的关键。深度学习最近受到了广泛关注,这是有充分理由的。它正在取得以前不可能取得的成果。

在深度学习中,计算机模型学习直接从图像、文本或声音中执行分类任务。深度学习模型可以达到最先进的精确度,有时甚至超过人类水平的性能。通过使用大量的标记数据和包含许多层的神经网络体系结构来训练模型。

为什么深度学习很重要

深度学习是如何取得如此令人印象深刻的结果的?

一句话,准确。深度学习的识别精度比以往任何时候都要高。这有助于消费电子产品满足用户的期望,对于像无人驾驶汽车这样的安全关键应用来说,这是至关重要的。深度学习的最新进展已经进步到在一些任务上,如在图像中分类物体,深度学习的表现超过了人类。

虽然深度学习在20世纪80年代首次提出理论,但它直到最近才变得有用,主要有两个原因:

  1. 深度学习需要大量的带安全标签的数据时.例如,无人驾驶汽车的开发需要数百万张图片和数千小时的视频。
  2. 深度学习需要大量的计算能力.高性能gpu有一个并行架构,可以高效地进行深度学习。当与集群或云计算相结合时,这使开发团队能够将深度学习网络的训练时间从几周缩短到几小时或更短。

深度学习在工作中的例子

从自动驾驶到医疗设备,深度学习应用广泛。

自动驾驶:汽车研究人员正在使用深度学习来自动检测停车标志和红绿灯等物体。此外,深度学习被用于检测行人,这有助于减少事故。

航空航天和国防:深度学习用于从定位感兴趣区域的卫星上识别物体,并确定部队的安全或不安全区域。

医学研究:癌症研究人员正在使用深度学习来自动检测癌细胞。加州大学洛杉矶分校的研究团队建造了一种先进的显微镜,可以产生高维数据集,用于训练深度学习应用程序,以准确识别癌细胞。

工业自动化:深度学习通过自动检测人或物体是否在机器的不安全距离内,帮助提高重型机械周围工人的安全。

电子学:深度学习被用于自动听力和语音翻译。例如,能够对你的声音做出反应并知道你的喜好的家庭辅助设备是由深度学习应用程序支持的。

深度学习的工作原理

大多数深度学习方法使用神经网络架构,这就是为什么深度学习模型经常被称为深层神经网络

术语“深度”通常指的是神经网络中隐藏层的数量。传统的神经网络只包含2-3个隐藏层,而深层网络可以有多达150个。

深度学习模型是通过使用大量标记数据和神经网络体系结构来训练的,神经网络体系结构直接从数据中学习特征,而不需要手动提取特征。

图1。神经网络是由一组相互连接的节点组成的分层组织的。网络可以有数十或数百个隐藏层。

图1:神经网络,由一组相互连接的节点组成的分层组织。网络可以有数十或数百个隐藏层。

深度神经网络中最流行的一种叫做卷积神经网络(美国有线电视新闻网事先).CNN将学习到的特征与输入数据进行卷积,并使用2D卷积层,使这种体系结构非常适合处理2D数据,如图像。

cnn消除了手动操作的需要特征提取,因此您不需要识别用于分类图像的特征。CNN的工作原理是直接从图像中提取特征。相关特征没有经过预先训练;它们是在网络对图像集合进行训练时学习到的。这种自动特征提取使得深度学习模型高度准确计算机视觉对象分类等任务。

图2。一个具有许多卷积层的网络的例子。对不同分辨率的训练图像进行滤波处理,卷积后的图像输出作为下一层的输入。

图2:具有许多卷积层的网络示例。对不同分辨率的训练图像进行滤波处理,卷积后的图像输出作为下一层的输入。

cnn学习使用数十或数百个隐藏层来检测图像的不同特征。每一个隐藏层都增加了学习到的图像特征的复杂性。例如,第一个隐藏层可以学习如何检测边缘,最后一个隐藏层学习如何检测更复杂的形状,专门迎合我们试图识别的对象的形状。

机器学习和深度学习的区别是什么?

深度学习是机器学习的一种特殊形式。机器学习工作流从手动从图像中提取相关特征开始。然后,这些特征被用来创建一个模型,对图像中的对象进行分类。通过深度学习工作流,可以自动从图像中提取相关特征。此外,深度学习还可以进行“端到端学习”——给网络一个原始数据和一个要执行的任务,比如分类,然后它学习如何自动完成这项工作。

另一个关键区别是,深度学习算法是根据数据进行扩展的,而浅学习是收敛的。浅学习是指当你向网络中添加更多的例子和训练数据时,机器学习方法会在一定的性能水平上停滞不前。

深度学习网络的一个关键优势是,它们通常会随着数据规模的增加而不断改进。

图3。比较机器学习方法对车辆的分类(左)和深度学习(右)。

在机器学习中,您手动选择特征和分类器来对图像进行排序。通过深度学习,特征提取和建模步骤是自动的。

在机器学习和深度学习之间的选择

机器学习提供了多种技术和模型,您可以根据应用程序、正在处理的数据的大小和想要解决的问题的类型进行选择。一个成功的深度学习应用程序需要非常大量的数据(数千张图像)来训练模型,以及图形处理器或图形处理单元,以快速处理您的数据。

在选择机器学习还是深度学习时,要考虑你是否拥有高性能的GPU和大量的标记数据。如果你没有这两样东西,使用机器学习而不是深度学习可能更有意义。深度学习通常更复杂,所以你至少需要几千张图像才能得到可靠的结果。拥有高性能的GPU意味着该模型分析所有这些图像的时间会更短。

面板的导航

如何创建和训练深度学习模型

人们使用深度学习执行对象分类最常见的三种方式是:

从头开始培训

要从零开始训练一个深度网络,您需要收集一个非常大的标记数据集,并设计一个将学习功能和模型的网络架构。这对于新的应用程序,或者具有大量输出类别的应用程序是很好的。这是一种不太常见的方法,因为由于大量的数据和学习速度,这些网络通常需要几天或几周的时间来训练。

转移学习

大多数深度学习应用程序使用转移学习方法,包括微调预先训练的模型的过程。您从一个现有的网络开始,例如AlexNet或GoogLeNet,并输入包含以前未知类的新数据。在对网络进行一些调整之后,您现在可以执行一个新任务,例如只对狗或猫进行分类,而不是对1000个不同的对象进行分类。这也有需要更少数据的优点(处理数千张图像,而不是数百万张),因此计算时间下降到几分钟或几小时。

迁移学习需要一个到现有网络内部的接口,因此可以对它进行外科手术式的修改和增强,以适应新任务。MATLAB®有工具和功能设计来帮助您进行迁移学习。

特征提取

一种稍微不太常见,但更专业的深度学习方法是使用网络作为一个特征提取器.由于所有层的任务是从图像中学习特定的特征,我们可以在训练过程中的任何时候从网络中提取这些特征。这些特征可以被用作输入机器学习模型支持向量机(SVM)

使用gpu加速深度学习模型

训练一个深度学习模型可能需要很长时间,从几天到几周不等。使用GPU加速可以显著加快这个过程。将MATLAB与GPU一起使用可以减少训练网络所需的时间,并且可以将图像分类问题的训练时间从几天减少到几个小时。在训练深度学习模型时,MATLAB使用gpu(在可用的情况下),而不需要您理解如何显式地对gpu编程。

图4。“深度学习工具箱”命令,用于从零开始训练自己的CNN或使用预训练的模型进行迁移学习。

深度学习的应用

预先训练的深度神经网络模型可以通过执行迁移学习或特征提取来快速地将深度学习应用到您的问题中。对于MATLAB用户,一些可用的模型包括AlexNet、VGG-16和VGG-19,以及使用importCaffeNetwork导入的Caffe模型(例如,来自Caffe Model Zoo)。

117044 _wl_rutgers_fig1_wl.jpg

使用AlexNet与你的网络摄像头识别物体

使用MATLAB,一个简单的网络摄像头和一个深度神经网络来识别你周围的物体。

检测低速车祸

示例:使用深度学习的对象检测

除了对象识别,它可以识别图像或视频中的特定对象,深度学习也可以用于对象检测对象检测像YOLO这样的算法可以识别和定位场景中的对象,也可以定位图像中的多个对象。

基于MATLAB的深度学习

MATLAB使深度学习变得简单。通过管理大型数据集的工具和功能,MATLAB还提供了专门的工具箱,用于机器学习、神经网络、计算机视觉和自动驾驶。

只需几行代码,MATLAB就可以让你在不成为专家的情况下进行深度学习。快速开始,创建和可视化模型,并将模型部署到服务器和嵌入式设备。

团队可以成功地使用MATLAB进行深度学习,因为它可以让您:

  1. 仅用几行代码创建和可视化模型。
  2. MATLAB允许您用最少的代码构建深度学习模型。使用MATLAB,您可以快速导入预先训练的模型,并在调整训练参数时可视化和调试中间结果。

  3. 在没有专家的情况下进行深度学习。
  4. 您可以使用MATLAB学习和获得深度学习领域的专业知识。我们中的大多数人从来没有上过深度学习的课程。我们必须在工作中学习。MATLAB使这一领域的学习变得实用和容易。此外,MATLAB使领域专家能够进行深度学习,而不是把任务交给可能不了解您的行业或应用程序的数据科学家。

  5. 自动标记图像和视频的地面真相。
  6. MATLAB使用户能够在图像中交互式地标记对象,并且可以实现自动化地面实况标签用于训练和测试深度学习模型的视频。这种交互式和自动化的方法可以在更短的时间内获得更好的结果。

  7. 在单一工作流中集成深度学习。
  8. MATLAB可以在一个工作流中统一多个领域。有了MATLAB,你可以在一个环境中思考和编程。它为深度学习提供工具和功能,也为输入深度学习算法的一系列领域提供工具和功能,如信号处理、计算机视觉和数据分析。

通过MATLAB,您可以将结果集成到现有的应用程序中。MATLAB可以在企业系统、集群、云和嵌入式设备上自动部署您的深度学习模型。

查看更多深度学习特性和示例代码

相关产品:2022世界杯八强谁会赢?MATLAB计算机视觉工具箱™统计和机器学习工具箱™深度学习工具箱™,自动驾驶工具箱™

Baidu
map