强化学习工具箱

강화학습을사용하여정책을설계하고훈련할수있습니다。

무료평가판받기

가격 보기

强化学习工具箱™는DQN、PPO、囊및DDPG와같은강화학습알고리즘을사용하는정책을훈련시키기위한앱,함수,仿真软件^®블록을제공합니다。이러한정책을사용하여자원할당,로봇공학,자율시스템과같은복잡한응용사례의제어기및의사결정알고리즘을구현할수있습니다。

이툴박스를사용하면심층신경망또는룩업테이블을사용하여정책및가치함수를표현할수있고MATLAB^®또는仿真软件에서모델링된환경과의상호작용을통해이런정책과가치함수를훈련시킬수있습니다。툴박스에서제공하는단일에이전트또는다중에이전트강화학습알고리즘을평가하거나직접개발할수있습니다。앱을통한대화형방식또는프로그래밍방식으로하이퍼파라미터설정을실험하고훈련진행상황을모니터링하고훈련된에이전트를시뮬레이션할수있습니다。훈련성능을향상하기위해시뮬레이션을다중CPU、GPU,컴퓨터클러스터및클라우드에서병렬로실행할수있습니다。(并行计算工具箱및MATLAB并行服务器사용)

ONNX™모델형식을통해TensorFlow™Keras및PyTorch등의딥러닝프레임워크에서기존정책을가져올수있습니다。(深度学习工具箱™사용)최적화된C, c++， CUDA^®코드를생성하여훈련된정책을마이크로컨트롤러및gpu에배포할수있습니다。툴박스에는시작을돕기위한참조예제가포함되어있습니다。

시작하기:

强化学习工具箱란?

강화학습에이전트

강화학습에이전트를생성하고구성하여MATLAB및仿真软件에서정책을훈련할수있습니다。내장된강화학습알고리즘을사용하거나사용자지정강화학습알고리즘을개발할수있습니다。

강화학습알고리즘

DQN(Deep Q-network)， DDPG(Deep deterministic policy gradient)， PPO(proximal policy optimization)및기타내장알고리즘을사용하여에이전트를만들수있습니다。템플릿을사용하여정책을훈련시키는사용자지정에이전트를개발할수있습니다。

강화학습에이전트훈련시키기

내장에이전트

사용자지정에이전트만들기

이족보행로봇에게보행훈련시키기

强化学习工具箱에서사용가능한훈련알고리즘。

强化学习设计器앱

대화형방식으로강화학습에이전트를설계，훈련，시뮬레이션할수있습니다。향후사용및배포를위해훈련된에이전트를matlab으로내보낼수있습니다。

强化学习设计

强化学习设计师앱을사용하여에이전트를설계하고훈련시키기

대화형방식으로강화학습에이전트생성및훈련하기

심층신경망을사용한정책및가치함수현

대규모상태-행동공간을사용하는복잡한시스템의경우深度学习工具箱의계층을사용하거나대화형방식의심층신경망디자이너를통해심층신경망정책을프로그래밍방식으로정의할수있습니다。또는툴박스에서제하는기본네트워크아키텍처를사용할수도있습니다。모방학습으로정책을초기화하여훈련을가속화할수있습니다。다른딥러닝프레임워크와의상호운용성을위해ONNX모델을가져오고내보낼수있습니다。

심층신경망현만들기및가져오기

심층신경망디자이너를사용하여에이전트만들기

모방학습으로DDPG演员网초기화하기

강화학습에이전트초기화옵션