rlSARSAAgent
SARSA强化学习剂
描述
SARSA算法是一种无模型、在线、策略强化学习方法。SARSA代理是一种基于价值的强化学习代理,它训练批评者估计回报或未来的回报。
有关SARSA代理的更多信息,请参见撒尔沙代理。
有关不同类型的强化学习代理的更多信息,请参见强化学习代理。
属性
对象的功能
例子
版本历史
介绍了R2019a
SARSA强化学习剂
SARSA算法是一种无模型、在线、策略强化学习方法。SARSA代理是一种基于价值的强化学习代理,它训练批评者估计回报或未来的回报。
有关SARSA代理的更多信息,请参见撒尔沙代理。
有关不同类型的强化学习代理的更多信息,请参见强化学习代理。
介绍了R2019a