Computer sind in ihrer Fähigkeit, mit der Welt und mit den menschlichen Benutzern interagieren noch eingeschränkt, weil sie nicht ¿sehen¿ können. Wenn man sich mit Computer-Vision beschäftigt, so muss man sich auch die Physik der Welt versuchen zu verstehen, zum Beispiel wie das Licht an Oberflächen reflektiert wird, wie sich Objekte bewegen, und wie alle diese Informationen auf ein Bild durch die Optik der Kamera projiziert werden. Es erfordert auch, dass wir Algorithmen entwickeln, die einige dieser physikalischen Eigenschaften aus einem oder aus mehreren Bildern rekonstruieren. Dieses "inverse" Problem ist eigentlich ein großes Puzzle. Informationen gehen verloren, wenn die dreidimensionale Welt auf ein zweidimensionales Bild projiziert wird, wie können wir nun diese Informationen aus einem Bild wiederherstellen? Diese Lehrveranstaltung zeigt die grundlegenden Algorithmen die dieses Ziel erreichbar machen und entwickelt Methoden zur Lösung verschiedener inverser Probleme. Aber Vision ist mehr als nur die Rekonstruktion der 3D-Welt aus 2D-Bildern, es beschäftigt sich auch mit der Extraktion von Semantik. Die Lehrveranstaltung zeigt auch grundlegende Methoden des maschinellen Lernens und probabilistischer Inferenz Methoden, um dieses Problem zu lösen. In diesem Kurs beinhaltet:
¿ einen Blickwinkel auf viele Bereiche der aktuellen Computer Vision Forschung
¿ eine Umsetzung von Programmieraufgaben um praktische Erfahrungen mit der Arbeiten mit Bildern und Bildsequenzen zu sammeln
¿ die Anwendung von linearer Algebra und Analysis für etwas was man in der Realität brauchen kann
Auch wenn Sie nicht vorhaben sich weiter mit Computer-Vision zu beschäftigen können die grundlegenden Werkzeuge und Techniken, die dort verwendet werden in vielen anderen Bereichen nützlich sein. Für all jene die sich näher mit Computer Vision beschäftigen wollen bietet diese Lehrveranstaltung eine gute Basis um sich weiter vertiefen zu können
Wie können Computer die visuelle Welt der Menschen verstehen?
Dieser Kurs behandelt Vision als einen Prozess aus verrauschten und unsicheren Daten und betont probabilistische und statistische Ansätze. Themen sind ua: Struktur von Bildern, Textur, Szenen und Context, Feature Based Alignment, Stereo Korrespondenz, Struktur aus Motion, Image Stitching, Computational Photography, Image Based Rendering und Baysian Modeling zu Zweck der Objekterkennung. Diese Lehrveranstaltung ist für Studierende die sich für Vision, künstliche Intelligenz, oder maschinelles Lernen interessieren, gedacht. Sie bietet eine umfassende Einführung in das Feld, zeigt die aktuellen Probleme und Theorien, die grundlegende Mathematik und einige interessante Algorithmen sowie die Möglichkeit, den Inhalt direkt in Übungen anzuwenden.
ECTS Breakdown: 4.5 ECTS = 112.5h
24h Vorlesung
12h Lösen der Übungsbeispiele mittels Matlab im Labor (mit Tutor-Unterstützung)
25h Erstellung eines Reports zur Dokumentation der Übungsergebnisse
0.5h Abgabegespräch zur Übung
49h Prüfungsvorbereitung
2h Prüfung
-----
112.5h