动态仿真模块环境
模型强化学习环境动力学使用Simulink®模型
在强化学习场景中,环境对智能体与之交互的动态进行建模。环境:
接收来自代理的操作
输出由环境模型的动态行为产生的观测结果
产生一个奖励,衡量行动对完成任务的贡献
您可以使用Simulink模型创建预定义和自定义的环境。有关更多信息,请参见创建Simulink强化学习环境.
功能
块
RL代理 | 强化学习代理 |
主题
- 创建Simulink强化学习环境
使用与代理交互的Simulink模型建模环境动力学,生成响应代理行为的奖励和观察。
- 为强化学习设计器创建Simulink环境
导入自定义的Simulink环境或创建预定义的Simulink环境。
- 定义奖励信号
创建一个奖励信号,衡量代理在实现目标方面的成功程度。
- 加载预定义的Simulink环境
加载预定义的Simulink控制系统环境。
- 水箱强化学习环境模型
创建一个强化学习的Simulink环境,其中包含一个RL Agent块来代替水箱中的水位控制器。