强化学习工具箱是什么?

强化学习工具箱™提供了一个应用程序、函数和模型^®块培训政策使用强化学习算法,包括DQN、PPO、囊,DDPG。你可以用这些策略来实现控制器和决策算法对于复杂的应用,如资源分配,机器人技术,和自治系统。

工具箱可以代表政策和价值函数使用深层神经网络或查找表和培训他们通过与环境的交互作用在MATLAB建模^®或仿真软件。你可以评估多智能体强化学习算法单一或工具箱中提供或开发自己的。你可以尝试hyperparameter设置、监控培训进展,和模拟训练有素的特工通过交互式应用程序或通过编程的方式。改善训练性能,模拟可以并行运行在多个cpu, gpu,计算机集群和云(并行计算工具箱™和MATLAB并行服务器™)。

通过ONNX™模型格式,现有政策可以从深度学习框架,如进口TensorFlow™Keras和PyTorch(深度学习工具箱™)。您可以生成优化的C, c++, CUDA^®微控制器代码部署培训政策和gpu。工具箱包括引用的例子来帮助你开始。

强化学习工具箱™提供了一个应用程序、函数和模块,让你实现控制器和决策算法对于复杂的应用,如机器人和自动驾驶。

工具箱可以通过强化学习工作流程的所有步骤,从创造环境和代理,与MATLAB政策培训和部署^®和仿真软件^®。

定义一个代理通过选择从内置的算法如DQN、PPO和囊,或开发您自己的自定义算法。

在强化学习交互设计师创建代理对象,或通过编程的方式。

对于深层神经网络政策,强化学习工具箱可以自动生成一个默认的网络体系结构。

另外,创建深层神经网络策略和价值函数与深层网络设计师…

或以编程方式,内置函数。

除了神经网络,也支持多项式和查找表。

您可以创建在MATLAB和Simulink仿真环境。

在仿真软件中,创建一个模型,描述了环境的动态,观察,和奖励的信号。

接口环境与创建代理对象模型使用一个或多个实例的代理,分别为单个或多智能训练。