Schulungsübersicht
Einführung
- Lernen durch positive Verstärkung
Elements von Reinforcement Learning
Wichtige Begriffe (Aktionen, Zustände, Belohnungen, Politik, Wert, Q-Wert, usw.)
Überblick über tabellarische Lösungsmethoden
Erstellen eines Software-Agenten
Verstehen von wertbasierten, richtlinienbasierten und modellbasierten Ansätzen
Arbeiten mit dem Markov-Entscheidungsprozess (MDP)
Wie Richtlinien die Verhaltensweisen eines Agenten definieren
Monte-Carlo-Methoden verwenden
Lernen mit zeitlichen Differenzen
n-schrittiges Bootstrapping
Näherungsweise Lösungsmethoden
Richtungsabhängige Vorhersage mit Approximation
On-Policy-Steuerung mit Approximation
Off-Policy-Methoden mit Approximation
Verstehen von Berechtigungsspuren
Verwendung von Policy-Gradienten-Methoden
Zusammenfassung und Schlussfolgerung
Voraussetzungen
- Erfahrung mit maschinellem Lernen
- Programming Erfahrung
Zielgruppe
- Datenwissenschaftler