视频和网络研讨会系列

强化学习

本系列概述了强化学习,这是一种机器学习,有可能解决一些传统技术难以解决的控制系统问题。

我们将介绍强化问题的基础知识,以及它与传统控制技术的区别。我们将展示为什么神经网络被用来表示未知函数,以及代理如何使用来自环境的奖励来训练它们。

在本系列的最后,您将更好地准备回答以下问题:

  • 什么是强化学习?为什么我在解决控制问题时应该考虑它?
  • 如何设置和解决强化学习问题?
  • 与传统控制方法相比,强化学习的优点和缺点是什么?

第1部分:什么是强化学习?从工程师的角度概述强化学习。强化学习是一种机器学习,它有潜力解决一些真正困难的控制问题。

第2部分:理解环境和奖励在这个视频中,我们通过探索工作流程来建立我们对强化学习的基本理解。环境是什么?奖励功能是如何激励和代理的?政策是如何构成的?

第3部分:策略和学习算法本视频介绍驻留在代理中的算法。我们将讨论为什么我们使用神经网络来表示函数,以及为什么你可能必须在一个称为actor-批评家的强大方法家族中建立两个神经网络。

第四部分:行走机器人问题这个视频展示了如何使用强化学习工作流来让一个双足机器人行走,以及我们如何通过在设计中添加参考信号来设置RL问题,使其看起来更像一个传统的控制问题。

第五部分:克服强化学习的实际挑战在生产系统中使用强化学习时,会遇到一些挑战,有一些方法可以缓解这些挑战。本视频涵盖了验证学到的解决方案的困难,以及你可以做些什么。

多代理介绍了解什么是多主体强化学习以及它所面临和克服的一些挑战。

为什么选择基于模型的?比较无模型和基于模型的强化学习方法,并根据情况更好地理解使用哪种方法。

Baidu
map