RL代理
强化学习代理
- 库:
强化学习工具箱
描述
使用RL代理块在Simulink中模拟和训练强化学习代理®.您将块与存储在MATLAB中的代理关联起来®工作区或数据字典,例如rlACAgent
或rlDDPGAgent
对象。你连接砖块,这样它就会收到观察结果和计算奖励。例如,考虑下面的方框图rlSimplePendulumModel
模型。
的观察接口的输入端口RL代理块接收一个信号,由瞬时角度和角速度的摆。的奖励端口会收到由相同的两个值和应用的动作计算的奖励。您可以配置适合您的系统的观察和奖励计算。
方块使用代理基于你所提供的观察和奖励而生成行动。连接行动输出端口到您系统的适当输入。例如,在rlSimplePendulumModel
,行动输出端是施加到摆系统上的力矩。有关此模型的更多信息,请参见训练DQN代理上摆和平衡摆.
要在Simulink中训练强化学习代理,您需要从Simulink模型生成一个环境。然后创建和配置代理,以便针对该环境进行培训。有关更多信息,请参见创建Simulink强化学习环境.当你打电话火车
使用环境,火车
模拟模型并更新与块关联的代理。
港口
输入
输出
参数
模型的例子
版本历史
介绍了R2019a