MATLAB环境
用MATLAB建立强化学习环境的动力学模型®
在强化学习场景中,环境对代理交互的动态进行建模。环境:
从代理接收操作
输出由环境模型的动态行为产生的观察结果
生成一个奖励来衡量行为对完成任务的贡献程度
您可以在MATLAB中创建预定义的和自定义的环境。有关更多信息,请参见创建MATLAB强化学习环境.
功能
主题
- 创建MATLAB强化学习环境
使用与代理交互的MATLAB对象建模环境动力学,生成响应代理动作的奖励和观察结果。
- 为强化学习设计器创建MATLAB环境
导入自定义MATLAB环境或创建预定义的MATLAB环境。
- 定义奖励信号
创造一个奖励信号来衡量代理在实现目标时的成功程度。
- 负载预定义控制系统环境
加载预置的MATLAB控制系统环境。
- 加载预定义的网格世界环境
在预定义的MATLAB网格世界环境中训练代理,这些环境的操作、观察和奖励已经定义好了。
- 创建自定义网格世界环境
通过定义自己的大小、奖励和障碍,创建自定义的MATLAB网格世界环境。
- 使用自定义函数创建MATLAB环境
通过提供自定义动态函数来创建强化学习环境。
- 从模板创建自定义MATLAB环境
通过创建和修改模板环境对象来定义自定义强化学习环境。