Am 30. Juli 2024 wird es aufgrund einer wichtigen Datenbankaktualisierung zwischen 8 und 11 Uhr zu Serviceunterbrechungen in den Bereichen Student-Self-Service und Personalbedarf kommen. Vielen Dank für Ihr Verständnis.

194.163 AKNUM Reinforcement Learning
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2024S, VU, 4.0h, 6.0EC

TUWEL-Kurs

Merkmale

Semesterwochenstunden: 4.0
ECTS: 6.0
Typ: VU Vorlesung mit Übung
Format der Abhaltung: Präsenz

Lernergebnisse

Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage, sowohl die Theorie und die Methoden des Reinforcement Learning inklusive der neuesten Entwicklungen zu verstehen, zu erklären und anzuwenden als auch die wichtigsten Algorithmen zu implementieren.

Inhalt der Lehrveranstaltung

[Heuer (Sommersemester 2024) mit erweitertem Skriptum!]

Reinforcement Learning ist ein Teilgebiet der künstlichen Intelligenz bzw. des maschinellen Lernens und beschäftigt sich mit der Entwicklung von Strategien, mit deren Hilfe ein Agent seinen Erfolg in einer stochastischen Umgebung (model free) maximieren kann. Zu den Anwendungen zählen Robotik (OpenAI gym bzw. Gymnasium), computer vision, Spiele (wie z.B. Go, Schach, Atari 2600 oder Dota 2) auf menschlichem Niveau oder besser und vieles mehr. Nicht zuletzt ist RL der letzte und wichtigste Trainingsschritt in Large Language Models (LLM) wie ChatGPT und Gemini.

Theorie und Algorithmen des Reinforcement Learning:

Introduction
Bandit problems
Markov decision problems
Bellman equations
Hamilton-Jacobi-Bellman equation
Dynamic programming
Monte-Carlo learning
Temporal-difference learning
Tabular methods
Function approximation and deep learning
On-policy vs. off-policy
Eligibility traces
Policy gradients and actor-critic
RL with human feedback: InstructGPT and ChatGPT
Applications

Im Übungsteil wird die Theorie vertieft und die Algorithmen werden implementiert.

Methoden

Vortrag, Skriptum, Übung.

Prüfungsmodus

Schriftlich

Vortragende Personen

Institut

E194 Institut für Information Systems Engineering

LVA Termine

Tag	Zeit	Datum	Ort	Beschreibung
Do.	11:00 - 13:00	07.03.2024	HS 7 Schütte-Lihotzky - ARCH	Vorbesprechung
Di.	11:00 - 13:00	12.03.2024	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	11:00 - 13:00	14.03.2024 - 27.06.2024	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	14:00 - 16:00	19.03.2024 - 30.04.2024	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	13:00 - 15:00	14.05.2024	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	11:00 - 13:00	28.05.2024 - 25.06.2024	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	11:00 - 13:00	20.06.2024	HS 7 Schütte-Lihotzky - ARCH	Vorlesung und Übung

Einzeltermine anzeigen

AKNUM Reinforcement Learning - Einzeltermine

Tag	Datum	Zeit	Ort	Beschreibung
Do.	07.03.2024	11:00 - 13:00	HS 7 Schütte-Lihotzky - ARCH	Vorbesprechung
Di.	12.03.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	14.03.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	19.03.2024	14:00 - 16:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	21.03.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	09.04.2024	14:00 - 16:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	11.04.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	16.04.2024	14:00 - 16:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	18.04.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	23.04.2024	14:00 - 16:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	25.04.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	30.04.2024	14:00 - 16:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	02.05.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	14.05.2024	13:00 - 15:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	16.05.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	23.05.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	28.05.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	04.06.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Do.	06.06.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung
Di.	11.06.2024	11:00 - 13:00	EI 5 Hochenegg HS	Vorlesung und Übung

Leistungsnachweis

Übungsteil und zwei Tests.

LVA-Anmeldung

Von	Bis	Abmeldung bis
01.03.2024 00:00	17.03.2024 23:59	07.04.2024 23:59

Curricula

Studienkennzahl	Verbindlichkeit	Semester	Anm.Bed.	Info
066 645 Data Science	Gebundenes Wahlfach

Literatur

Es wird kein Skriptum zur Lehrveranstaltung angeboten.

Vorkenntnisse

The theoretical aspects will be explained in the lectures in a self-contained manner. The usual knowledge of linear algebra, calculus, and probability theory is required.

Weitere Informationen

Homepage der Lehrveranstaltung

Sprache

Englisch