主要内容

rlPredefinedEnv

创建一个预定义的强化学习环境

描述

例子

env= rlPredefinedEnv (关键字接受预定义的关键字关键字表示环境名称来创建MATLAB®或仿真软件®强化学习环境env.环境env建模与代理交互的动态,生成响应代理动作的奖励和观察结果。

例子

全部折叠

使用预定义的“BasicGridWorld”关键词创建基本网格世界强化学习环境。

env = rlPredefinedEnv (“BasicGridWorld”
模型:[1x1 rl.env. env = rlMDPEnv。GridWorld] ResetFcn: []

使用预定义的“DoubleIntegrator-Continuous”关键词创造连续双积分强化学习环境。

env = rlPredefinedEnv (“DoubleIntegrator-Continuous”
env = DoubleIntegratorContinuousAction with properties:增益:1 Ts: 0.1000 MaxDistance: 5 GoalThreshold: 0.0100 Q: [2x2 double] R: 0.0100 MaxForce: Inf State: [2x1 double]

方法可以可视化环境情节函数并与之交互重置而且一步功能。

图(env)观测=重置(env)
观察=2×14 0
(观察、奖励、结束)=步骤(env, 16)

{

观察=2×14.0800 - 1.6000
奖励= -16.5559
结束=逻辑0

使用预定义的“SimplePendulumModel-Continuous”关键词创建连续简单摆模型强化学习环境。

env = rlPredefinedEnv (“SimplePendulumModel-Continuous”
env = SimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel AgentBlock: rlSimplePendulumModel/RL Agent ResetFcn: [] UseFastRestart: on

输入参数

全部折叠

表示环境名称的预定义关键字,指定为以下之一:

MATLAB环境

  • “BasicGridWorld”

  • “CartPole-Discrete”

  • “CartPole-Continuous”

  • “DoubleIntegrator-Discrete”

  • “DoubleIntegrator-Continuous”

  • “SimplePendulumWithImage-Discrete”

  • “SimplePendulumWithImage-Continuous”

  • “WaterFallGridWorld-Stochastic”

  • “WaterFallGridWorld-Deterministic”

动态仿真模块环境

  • “SimplePendulumModel-Discrete”

  • “SimplePendulumModel-Continuous”

  • “CartPoleSimscapeModel-Discrete”

  • “CartPoleSimscapeModel-Continuous”

输出参数

全部折叠

MATLAB或Simulink环境对象,作为以下之一返回:

  • rlMDPEnv对象,当您使用以下关键字之一时。

    • “BasicGridWorld”

    • “WaterFallGridWorld-Stochastic”

    • “WaterFallGridWorld-Deterministic”

  • CartPoleDiscreteAction对象,当您使用“CartPole-Discrete”关键字。

  • CartPoleContinuousAction对象,当您使用“CartPole-Continuous”关键字。

  • DoubleIntegratorDiscreteAction对象,当您使用“DoubleIntegrator-Discrete”关键字。

  • DoubleIntegratorContinuousAction对象,当您使用“DoubleIntegrator-Continuous”关键字。

  • SimplePendlumWithImageDiscreteAction对象,当您使用“SimplePendulumWithImage-Discrete”关键字。

  • SimplePendlumWithImageContinuousAction对象,当您使用“SimplePendulumWithImage-Continuous”关键字。

  • SimulinkEnvWithAgent对象,当您使用以下关键字之一时。

    • “SimplePendulumModel-Discrete”

    • “SimplePendulumModel-Continuous”

    • “CartPoleSimscapeModel-Discrete”

    • “CartPoleSimscapeModel-Continuous”

版本历史

介绍了R2019a

Baidu
map