101.789 AKNUM Reinforcement Learning
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2019S, VU, 4.0h, 6.0EC

Merkmale

  • Semesterwochenstunden: 4.0
  • ECTS: 6.0
  • Typ: VU Vorlesung mit Übung

Ziele der Lehrveranstaltung

Verständnis der Theorie und der wichtigsten Algorithmen des Reinforcement Learning sowie die Fähigkeit zur Implementierung zur Lösung von realistischen Problemstellungen.

Inhalt der Lehrveranstaltung

Reinforcement Learning ist ein Teilgebiet der künstlichen Intelligenz und beschäftigt sich mit der Entwicklung von Strategien, mit deren Hilfe ein Agent seinen Erfolg in einer stochastischen Umgebung (model free) maximieren kann. Zu den Anwendungen zählen Robotik (OpenAI gym), computer vision, Spiele (wie z.B. Go, Schach, Atari 2600 oder Dota 2) auf menschlichem Niveau oder besser und vieles mehr.

Theorie und Algorithmen des Reinforcement Learning:

  • Introduction
  • Bandit problems
  • Markov decision problems
  • Bellman equations
  • Hamilton-Jacobi-Bellman equation
  • Dynamic programming
  • Monte-Carlo learning
  • Temporal-difference learning
  • Tabular methods
  • Function approximation and deep learning
  • On-policy vs. off-policy
  • Eligibility traces
  • Policy gradients and actor-critic
  • Applications

Im Übungsteil wird die Theorie vertieft und die Algorithmen werden implementiert.

Vortragende Personen

Institut

LVA Termine

TagZeitDatumOrtBeschreibung
Mi.13:00 - 14:0006.03.2019 Freihaus, grüner Turm, 3.St. DA 03 C22Vorbesprech. Reinforc. Learning
Do.12:00 - 14:0007.03.2019 - 13.06.2019 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.12:00 - 13:3013.03.2019 - 26.06.2019 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
AKNUM Reinforcement Learning - Einzeltermine
TagDatumZeitOrtBeschreibung
Mi.06.03.201913:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Vorbesprech. Reinforc. Learning
Do.07.03.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.13.03.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.14.03.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.20.03.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.21.03.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.27.03.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.28.03.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.03.04.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.04.04.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.10.04.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.11.04.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.02.05.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.08.05.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.09.05.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.15.05.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.16.05.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.22.05.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Do.23.05.201912:00 - 14:00 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning
Mi.29.05.201912:00 - 13:30 Freihaus, grüner Turm, 3.St. DA 03 C22Reininforcement Learning

Leistungsnachweis

Zwei Tests, Übungsbeispiele und Projekte, Mitarbeit.

LVA-Anmeldung

Von Bis Abmeldung bis
04.03.2019 00:00 10.04.2019 00:00 10.04.2019 00:00

Curricula

StudienkennzahlVerbindlichkeitSemesterAnm.Bed.Info
860 GW Gebundene Wahlfächer - Technische Mathematik Keine Angabe

Literatur

Ein Skriptum (englisch) wird kostenlos an die Teilnehmer ausgegeben.

Vorkenntnisse

Die Theorie wird in der Vorlesung in sich abgeschlossen erklärt, sodass die LVA ab dem vierten Semester absolviert werden kann. Programmierkenntnisse werden vorausgesetzt (z.B. Python oder Julia).

Sprache

bei Bedarf in Englisch