Schulungsübersicht

Einführung

  • Lernen durch positive Verstärkung

Elements von Reinforcement Learning

Wichtige Begriffe (Aktionen, Zustände, Belohnungen, Politik, Wert, Q-Wert, usw.)

Überblick über tabellarische Lösungsmethoden

Erstellen eines Software-Agenten

Verstehen von wertbasierten, richtlinienbasierten und modellbasierten Ansätzen

Arbeiten mit dem Markov-Entscheidungsprozess (MDP)

Wie Richtlinien die Verhaltensweisen eines Agenten definieren

Monte-Carlo-Methoden verwenden

Lernen mit zeitlichen Differenzen

n-schrittiges Bootstrapping

Näherungsweise Lösungsmethoden

Richtungsabhängige Vorhersage mit Approximation

On-Policy-Steuerung mit Approximation

Off-Policy-Methoden mit Approximation

Verstehen von Berechtigungsspuren

Verwendung von Policy-Gradienten-Methoden

Zusammenfassung und Schlussfolgerung

Voraussetzungen

  • Erfahrung mit maschinellem Lernen
  • Programming Erfahrung

Zielgruppe

  • Datenwissenschaftler
 21 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Kommende Kurse

Verwandte Kategorien