视频和网络研讨会系列

强化学习

本系列提供了强化学习的概述,这是一种机器学习,有潜力解决一些传统技术难以解决的控制系统问题。

我们将介绍加固问题的基本知识,以及它与传统控制技术的区别。我们将展示为什么神经网络被用来表示未知函数,以及代理如何使用来自环境的奖励来训练它们。

在本系列结束时,你将更好地准备回答以下问题:

  • 什么是强化学习?为什么在解决我的控制问题时要考虑它?
  • 我如何设置和解决强化学习问题?
  • 与传统的控制方法相比,强化学习的优点和缺点是什么?

第1部分:什么是强化学习?从工程师的角度了解强化学习。强化学习是一种机器学习,有潜力解决一些真正困难的控制问题。

第二部分:理解环境和奖励在本视频中,我们通过探索工作流程来建立对强化学习的基本理解。环境是什么?奖励函数是如何激励和代理的?政策是如何构成的?

第3部分:策略和学习算法本视频将介绍驻留在代理中的算法。我们将介绍为什么使用神经网络来表示函数,以及为什么必须在一个称为actor-critic的强大方法家族中建立两个神经网络。

第四部分:步行机器人问题这个视频展示了如何使用强化学习工作流让一个双足机器人行走,以及我们如何通过在设计中添加参考信号来设置RL问题,使其看起来更像一个传统的控制问题。

第五部分:克服强化学习的实际挑战在生产系统中使用强化学习时会遇到一些挑战,有一些方法可以缓解这些挑战。本视频介绍了验证所学解决方案的困难,以及您可以对此做些什么。

多代理介绍了解什么是多智能体强化学习,以及它面临和克服的一些挑战。

为什么选择基于模型的?比较了无模型和基于模型的强化学习方法,并根据情况更好地理解使用哪种方法。

Baidu
map