getMaxQValue
在给定的环境观测条件下,从具有离散行动空间的q -值函数临界中获得所有可能行动的最大估计值
语法
描述
[
计算离散动作空间q值函数的临界值maxQ
,maxActionIndex
) = getMaxQValue (qValueFcnObj
,奥林匹克广播服务公司
)qValueFcnObj
并返回所有可能操作的最大估计值maxQ
,并附上相应的动作索引maxActionIndex
,根据环境观察奥林匹克广播服务公司
.
[
的更新后的状态maxQ
,maxActionIndex
,状态
) = getMaxQValue (___)qValueFcnObj
当它包含一个循环神经网络时。
例子
输入参数
输出参数
版本历史
介绍了R2020a