代理
使用常用算法(如SARSA、DQN、DDPG和PPO)创建和配置强化学习代理
应用程序
强化学习设计 | 设计、训练和模拟强化学习代理 |
块
RL代理 | 强化学习代理 |
功能
主题
代理基础知识
- 强化学习代理
可以使用几种标准强化学习算法之一创建代理,也可以定义自己的自定义代理。 - 使用强化学习设计器创建代理
使用强化学习设计器应用程序交互创建或导入训练代理。
剂类型
- q学习的代理
为强化学习创建Q-learning代理。 - 撒尔沙代理
创建SARSA代理进行强化学习。 - DQN (Deep Q-Network)代理
创建用于强化学习的DQN代理。 - 政策梯度代理
创建PG代理进行强化学习。 - 深度确定性策略梯度(DDPG)代理
创建DDPG代理进行强化学习。 - 双延迟深度确定性策略梯度代理
创建用于强化学习的TD3代理。 - Actor-Critic代理
创建AC代理进行强化学习。 - 近端策略优化代理
为强化学习创建PPO代理。 - 信任区域策略优化代理
为强化学习创建TRPO代理。 - 软Actor-Critic代理
创建用于强化学习的SAC代理。 - 基于模型的策略优化代理
基于模型的强化学习代理学习其环境的模型,它可以使用该模型生成额外的训练经验。
自定义代理
- 创建自定义强化学习代理
创建使用自定义强化学习算法的代理。