主要内容

培训和验证

训练和模拟强化学习代理

为了学习最优策略,强化学习代理通过反复的试错过程与环境相互作用。在训练过程中,代理调整其策略表示的参数以实现长期回报的最大化。Reinforcement Learning Toolbox™软件提供训练代理和通过仿真验证训练结果的功能。有关更多信息,请参见训练强化学习代理

应用程序

强化学习设计 设计、训练和模拟强化学习代理

功能

全部展开

火车 在指定的环境中训练强化学习代理
rlTrainingOptions 训练强化学习代理的选项
rlMultiAgentTrainingOptions 训练多个强化学习代理的选项
inspectTrainingResult 绘制以前训练课程的训练信息
rlDataLogger 创建文件记录器对象或监视器记录器对象来记录训练数据
FileLogger 将强化学习训练数据记录到MAT文件中
MonitorLogger 记录强化学习训练数据到监控窗口
trainingProgressMonitor 监控和绘制深度学习自定义训练循环的训练进度
设置 设置强化学习环境或初始化数据记录器对象
商店 将数据存储在(文件或监视器)记录器对象的内部内存中
将存储的数据从内部记录器内存传输到日志目标
清理 清理强化学习环境或数据记录器对象
sim卡 在指定的环境中模拟训练过的强化学习代理
rlSimulationOptions 用于在环境中模拟强化学习代理的选项
runEpisode 模拟针对策略或代理的强化学习环境
设置 设置强化学习环境或初始化数据记录器对象
清理 清理强化学习环境或数据记录器对象

RL代理 强化学习代理
政策 强化学习政策

主题

训练与模拟基础

使用强化学习设计器应用程序

使用多进程和gpu

训练代理控制双积分器系统

训练代理人平衡车杆系统

训练代理人向上摆动和平衡摆

多代理培训

从控制规格中生成奖励

模仿学习

训练代理控制机器人

训练座席执行控制任务

汽车应用培训代理商

其他应用程序

开发定制代理和训练算法

部署代理和策略

Baidu
map