循环神经网络(RNN)

一个轮回神经网络(RNN)是一种深度学习网络结构,它使用过去的信息来提高网络对当前和未来输入的性能。rnn的独特之处在于网络中包含隐藏状态和循环。循环结构允许网络以隐藏状态存储过去的信息,并对序列进行操作。

循环神经网络的这些特征使其非常适合于解决具有不同长度的顺序数据的各种问题,例如:

展开RNN的单个单元,显示数据序列中的信息如何在网络中移动。单元格的隐藏状态作用于输入以产生输出,并将隐藏状态传递到下一个时间步骤。

展开RNN的单个单元,显示数据序列中的信息如何在网络中移动。单元格的隐藏状态作用于输入以产生输出,并将隐藏状态传递到下一个时间步骤。

RNN如何知道如何将过去的信息应用到当前的输入中?网络有两组权值,一组用于隐藏状态向量,另一组用于输入。在训练过程中,网络学习输入和隐藏状态的权重。在实现时,输出基于当前输入和隐藏状态,隐藏状态基于以前的输入。

LSTM

实际上,简单的rnn在学习长期依赖时会遇到问题。rnn通常通过反向传播来训练,在反向传播中,它们可以经历“消失”或“爆炸”的梯度问题。这些问题导致网络权重变得非常小或非常大,限制了学习长期关系的有效性。

一种特殊类型的循环神经网络克服了这个问题长时间的短期记忆(LSTM)网络。LSTM网络使用额外的门来控制隐藏单元中的哪些信息能够到达输出和下一个隐藏状态。这允许网络更有效地学习数据中的长期关系。lstm是RNN的一种常用实现类型。

RNN(左)和LSTM网络(右)的比较

RNN(左)和LSTM网络(右)的比较

MATLAB®具有一整套的特性和功能,可以用文本、图像、信号和时间序列数据训练和实现LSTM网络。下一节将探讨rnn的应用以及使用MATLAB的一些示例。

应用RNNs

自然语言处理

语言是自然顺序的,文本片段的长度不同。这使得rnn成为解决这一领域问题的一个很好的工具,因为它们可以学习在句子中语境化单词。一个例子包括情绪分析这是一种对单词和短语的意义进行分类的方法。机器翻译,或使用算法在语言之间进行翻译,是另一种常见的应用。首先需要将文字数据转换为数字序列。一种有效的方法是字嵌入层。单词嵌入将单词映射到数值向量。的例子下面使用单词嵌入训练一个单词情感分类器,并用MATLAB的词云函数显示结果。

情绪分析结果在MATLAB。词云显示训练过程的结果,因此分类器可以确定新文本组的情感。

情绪分析结果在MATLAB。词云显示训练过程的结果,因此分类器可以确定新文本组的情感。

在另一个分类器的例子, MATLAB利用rnn对文本数据进行分类,以确定制造故障的类型。MATLAB也被应用于机器翻译的例子训练网络理解罗马数字。

信号分类

信号是自然顺序数据的另一个例子,因为它们通常是随着时间从传感器收集的。自动对信号进行分类是很有用的,因为这可以减少大数据集所需的手动时间,或允许实时分类。原始信号数据可以输入到深度网络或预处理,以专注于其他特征,如频率成分。特征提取可以极大地提高网络性能心脏电信号的例子.下面是一个例子在RNN中使用原始信号数据。

在MATLAB中使用LSTM对传感器数据进行分类。

在MATLAB中使用LSTM对传感器数据进行分类。

视频分析

rnn适用于视频,因为视频本质上是一组图像序列。与处理信号类似,它有助于在将序列输入RNN之前进行特征提取。在这个例子这是一个经过训练的GoogleNet模型(a卷积神经网络)用于每一帧的特征提取。您可以看到下面的网络架构。

LSTM视频分类的基本架构。

LSTM视频分类的基本架构。

Baidu
map