getObservationInfo

从强化学习环境、agent或经验缓冲区获取观测数据规格

在页面中全部折叠

语法

obsInfo = getObservationInfo (env)

obsInfo = getObservationInfo(代理)

obsInfo = getObservationInfo(缓冲区)

描述

例子

obsInfo= getObservationInfo (env）从强化学习环境中提取观察信息env．

obsInfo= getObservationInfo (代理）从强化学习agent中提取观察信息代理．

obsInfo= getObservationInfo (缓冲）从经验缓冲区中提取观测信息缓冲．

例子

全部折叠

从强化学习环境中提取行动和观察信息

打开生活的脚本

提取可以用于创建其他环境或代理的操作和观察信息。

本例的强化学习环境是自我车和前导车的简单纵向动力学。训练目标是让自我车以设定的速度行驶，同时通过控制纵向加速度(和刹车)与前车保持安全距离。此示例使用与。相同的车辆模型模型预测控制自适应巡航控制系统(模型预测控制工具箱)的例子。

打开模型并创建强化学习环境。

mdl =“rlACCMdl”；open_system (mdl);agentblk = [mdl' / RL代理'];创建观察信息obsInfo = rlNumericSpec([3 1]，“LowerLimit”负无穷*的(1),“UpperLimit”,正* (3,1));obsInfo。Name =“观察”；obsInfo。描述=“速度误差和自我速度的信息”；%的动作信息actInfo = rlNumericSpec([1 1]，“LowerLimit”3,“UpperLimit”2);actInfo。Name =“加速”；%定义环境env = rlSimulinkEnv (mdl agentblk、obsInfo actInfo)

env = SimulinkEnvWithAgent with properties: Model: rlACCMdl AgentBlock: rlACCMdl/RL Agent ResetFcn: [] UseFastRestart: on

强化学习环境env是一个SimulinkWithAgent具有上述属性的。

从强化学习环境中提取动作和观察信息env．

actInfoExt = getActionInfo (env)

actInfoExt = rlNumericSpec with properties: LowerLimit: -3 UpperLimit: 2名称:"acceleration"描述:[0x0 string]维度:[1 1]数据类型:"double"

obsInfoExt = getObservationInfo (env)

obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double]名称:"observations"描述:"information on velocity error and ego velocity"维度:[3 1]数据类型:"double"

动作信息包含加速度值，观测信息包含自我飞行器的速度和速度误差值。

输入参数

全部折叠

`env`- - - - - -强化学习环境
`rlFunctionEnv`对象|`SimulinkEnvWithAgent`对象|`rlNeuralNetworkEnvironment`对象|预定义的MATLAB环境对象

强化学习环境，从中提取观察信息，指定为以下对象之一。

MATLAB^®表示为以下对象之一的环境。
- rlFunctionEnv
- rlNeuralNetworkEnvironment
- 使用预定义的MATLAB环境创建rlPredefinedEnv
动态仿真模块^®环境表现为SimulinkEnvWithAgent对象。

有关强化学习环境的更多信息，请参见创建MATLAB强化学习环境而且创建Simulink强化学习环境．

`代理`- - - - - -强化学习代理
`rlQAgent`对象|`rlSARSAAgent`对象|`rlDQNAgent`对象|`rlPGAgent`对象|`rlDDPGAgent`对象|`rlTD3Agent`对象|`rlACAgent`对象|`rlPPOAgent`对象|`rlTRPOAgent`对象|`rlSACAgent`对象|`rlMBPOAgent`对象

强化学习代理，从中提取观察信息，指定为以下对象之一。

有关强化学习代理的更多信息，请参见强化学习代理．

`缓冲`- - - - - -经验的缓冲
`rlReplayMemory`对象|`rlPrioritizedReplayMemory`对象

经验缓冲区，从中提取观察信息，指定为rlReplayMemory或rlPrioritizedReplayMemory对象。

输出参数

全部折叠

`obsInfo`-观测数据规范
的数组`rlNumericSpec`对象的|数组`rlFiniteSetSpec`对象

从强化学习环境中提取的观测数据规范，作为以下之一的数组返回:

版本历史

介绍了R2019a

另请参阅

getObservationInfo

语法

描述

例子

从强化学习环境中提取行动和观察信息

输入参数

env- - - - - -强化学习环境rlFunctionEnv对象|SimulinkEnvWithAgent对象|rlNeuralNetworkEnvironment对象|预定义的MATLAB环境对象

代理- - - - - -强化学习代理rlQAgent对象|rlSARSAAgent对象|rlDQNAgent对象|rlPGAgent对象|rlDDPGAgent对象|rlTD3Agent对象|rlACAgent对象|rlPPOAgent对象|rlTRPOAgent对象|rlSACAgent对象|rlMBPOAgent对象

缓冲- - - - - -经验的缓冲rlReplayMemory对象|rlPrioritizedReplayMemory对象

输出参数

obsInfo-观测数据规范的数组rlNumericSpec对象的|数组rlFiniteSetSpec对象

版本历史

另请参阅

主题

`env`- - - - - -强化学习环境
`rlFunctionEnv`对象|`SimulinkEnvWithAgent`对象|`rlNeuralNetworkEnvironment`对象|预定义的MATLAB环境对象

`代理`- - - - - -强化学习代理
`rlQAgent`对象|`rlSARSAAgent`对象|`rlDQNAgent`对象|`rlPGAgent`对象|`rlDDPGAgent`对象|`rlTD3Agent`对象|`rlACAgent`对象|`rlPPOAgent`对象|`rlTRPOAgent`对象|`rlSACAgent`对象|`rlMBPOAgent`对象

`缓冲`- - - - - -经验的缓冲
`rlReplayMemory`对象|`rlPrioritizedReplayMemory`对象

`obsInfo`-观测数据规范
的数组`rlNumericSpec`对象的|数组`rlFiniteSetSpec`对象