模具强化学习工具箱™bietet eine应用程序,Funktionen und einen Simulink®-Block zum Trainieren von Richtlinien mit强化学习算法wie DQN, PPO, SAC和DDPG。Mithilfe diesel richtlinen können Sie Steuerungen und Entscheidungsalgorithmen für complex Anwendungen wie resourcenzuweisung, Robotik and autonome Anlagen implementieren。
模具工具箱ermöglicht das Darstellen von Richtlinien und Wertefunktionen durch tiefe neurale Netze oder查找- tabellen und ihr Trainieren durch Die Interaktion mit Umgebungen, Die als MATLAB®- oder simulink - model dargestellt werden。Sie haben die Möglichkeit, die in der Toolbox bereitgestellten Single-Agent- oder Multi-Agent-Reinforcement-Learning-Algorithmen zu evaluieren oder eigenzerellen。Sie können mit超参数爱因斯坦实验,den trainingsforschritt überwachen und trainierte Agents entweder interaktiv durch die App oder per programulieren。Um die Trainingsleistung zu optimieren, können Sie并行仿真的cpu, gpu,在计算机集群和在云下(mit并行计算工具箱™和MATLAB并行服务器™)ausführen。
Durch das ONNX™- modelellformat lassen sich vorhandene Richtlinien aus Deep-Learning- frameworks wie TensorFlow™Keras und PyTorch (mit der Deep Learning Toolbox™)importieren。Sie können optimierten C, c++和CUDA®代码generieren, um trainierte Richtlinien auf微控制器和gpu anzuwenden。模具工具箱beinhaltet refenzbeispiele,嗯Ihnen Die ersten Schritte zu erleichtern。
现在beginnen:
Reinforcement-Learning-Algorithmen
深度q -网络(DQN),深度确定性策略梯度(DDPG),近端策略优化(PPO)和积分算法。我的朋友,我的朋友,我的朋友,我的朋友,我的朋友,我的朋友。
强化学习设计器应用程序
训练者和模拟者相互作用强化学习剂。出口培训代理在MATLAB zur weiteren Verwendung和Bereitstellung。
Darstellung von richtlinen和Wertefunktionen mithillife tiefer neuraler Netze
Definieren Sie tiefe neurale Netzrichtlinien programatisch für komplexe Systeme mit großen zustanding -/Handlungsräumen mithillife von Schichten ausder深度学习工具箱奥德interaktiv MIT他们深度网络设计器.备选können Sie die Standardnetzarchitektur verwenden, die die Toolbox vorschlägt。首字母“Sie die Richtlinie mithillife von Imitation Learning, um das Training zu beschleunigen”。Importieren und exportieren Sie onnx - model, um die Kompatibilität mit anderen Deep Learning-Frameworks zu gewährleisten。
Simulink中的单智能体与多智能体强化学习
Erstellen和trainieren Sie Reinforcement-Learning-Agenten in Simulink mit RL-Agentenblock。Trainieren Sie mehrere Agenten gleichzeeitig(多智能体强化学习)在Simulink mithillife mehrerer Instanzen des RL-Agentenblocks。
Simulink- und Simscape-Umgebungen
Verwenden Sie Simulink- und Simscape™- model für die Darstellung einer Umgebung。手包和手包在模型的内部。
MATLAB-Umgebungen
Verwenden Sie MATLAB-Funktionen und -Klassen für die Modellierung einer Umgebung。Bestimmen Sie Beobachtungs-, handlung - und Belohnungsvariablen inhalb der MATLAB-Datei。
分布式计算与计算机
Beschleunigen Sie das Training, indem Sie parallel simulation auf mehrkerncomputer, cloud - resource oder computer cluster mithilife der并行计算工具箱和MATLAB并行服务器durchfuhren。
GPU-Beschleunigung
Beschleunigen Sie das Training and die Inferenz tiefer neuraler Netze mit leistungsstarken NVIDIA®gpu。Verwenden Sie MATLAB mit der并行计算工具箱und den meisten CUDA-fähigen nvidia - gpu mit einerRechenfähigkeit ab 3.0版本.
Codegenerierung
Verwenden Sie denMATLAB编码器™, um optimierten CUDA代码aus MATLAB程序代码zu generieren, der trainierte Richtlinien darstellt。Verwenden您MATLAB编码器™C/ c++ Code zur Bereitstellung von Richtlinien zu generieren。
Unterstützung für MATLAB编译器
麻省理工学院MATLAB编译器™和MATLAB编译SDK™können Sie trainierte Richtlinien als eigenständig ausführbare Anwendungen, C/ c++共享库,微软®.NET程序集,Java®-克拉森和Python®-Pakete bereitstellen。
奥地利第一储蓄Schritte
Sehen Sie zu, wie Sie auf强化学习basierende Steuerungen für problem wie den Ausgleich eines inverversen Pendels, die Navigation im Grid-World-Labyrinth, den Ausgleich eines Wagen-Pendel-Systems und das Lösen generischer Markov-Entscheidungsprozesse entwickeln。
Automatisiertes。
Entwerfen Sie Reinforcement-Learning-Richtlinien für Anwendungen des automatisierten Fahrens wie adaptive tempaten, Spurhalteassistenten und Einparkhilfen。
Robotik
Entwerfen Sie Reinforcement-Learning-Richtlinien für Roboteranwendungen。
Feinabstimmung, Kalibrierung和Terminierung
Entwerfen Sie reinforcement - learning - richtlinen zur Feinabstimmung, Kalibrierung and Terminierung von Anwendungen。
Produktressourcen:
强化学习-视频
Erfahren Sie in dieser Videoreihe mehr über强化学习。