이번역페이지는최신내용을담고있지않습니다。최신내용을문으로보려면여기를클릭하십시오。
RL代理
강화학습에이전트
- 라이브러리:
强化学习工具箱
설명
RL代理블록을사용하여Simulink®에서강화학습에이전트를시뮬레이션하고훈련시킵니다。이블록을matlab®작업공간또는데이터사전에저장된에이전트(예:rlACAgent
또는rlDDPGAgent
객체)와연결합니다。이블록이관측값과계산된보상을받을수있도록연결합니다。예를들어,rlSimplePendulumModel
모델의블록다이어그램이다음과같다고가정하겠습니다。
RL代理블록의观察입력포트는진자의순시각과(瞬时角)각속도에서도출되는신호를받습니다。奖励
포트는이두개의동일한값과적용된행동으로부터계산된보상을받습니다。이시스템에적합한관측값과보상계산은사용자가구성합니다。
이블록은에이전트를사용하여사용자가제공하는관측값과보상에기반한행동을생성합니다。行动출력포트를사용자의시스템에들어가는입력으로적절하게연결합니다。예를들어,rlSimplePendulumModel
에서行动출력포트는진자시스템에적용되는토크입니다。이모델에대한자세한내용은训练DQN代理人摆动和平衡摆항목을참조하십시오。
仿真软件에서강화학습에이전트를훈련시키려면仿真软件모델에서환경을생성하십시오。그다음,에이전트를만들고구성하여이환경에대해훈련시킵니다。자세한내용은Simulink강화학습환경만들기항목을참조하십시오。해당환경을사용하여火车
을호출하면火车
은모델을시뮬레이션하고이블록과연결된에이전트를업데이트합니다。
포트
입력값
출력값
파라미터
버전 내역
R2019a에개발됨