rlQAgent
q学习强化学习剂
描述
q学习算法是一种无模型、在线、非策略强化学习方法。q学习代理是一种基于价值的强化学习代理,它训练批评家估计回报或未来的回报。
有关q学习代理的更多信息,请参见q学习的代理.
有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
属性
对象的功能
例子
版本历史
介绍了R2019a
q学习强化学习剂
q学习算法是一种无模型、在线、非策略强化学习方法。q学习代理是一种基于价值的强化学习代理,它训练批评家估计回报或未来的回报。
有关q学习代理的更多信息,请参见q学习的代理.
有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
介绍了R2019a