389.196 Audio- und Sprachverarbeitung
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2017S, VU, 2.0h, 3.0EC, wird geblockt abgehalten

Merkmale

  • Semesterwochenstunden: 2.0
  • ECTS: 3.0
  • Typ: VU Vorlesung mit Übung

Ziele der Lehrveranstaltung

Das Hauptziel der Lehrveranstaltung ist es die Prinzipien der Sprachtechnologien zu erläutern und die heutigen sowie künftigen Anwendungen zu präsentieren. In den Vorlesungen ist der Lehrstoff auf folgende Schwerpunkte konzentriert: Methoden der Vorverarbeitung des Sprachsignals, Merkmale des Sprachsignals, Erkennung von einzelnen Wörtern, Erkennung kontinuierlicher Sprache, Sprechererkennung und Sprachsynthese. Die Vorlesungen werden mit praktischen Übungen ergänzt. Dabei besteht für Studierende die Möglichkeit, mit realen Sprachdaten praktisch zu arbeiten und eigene Stimme zu analysieren.

Nach Absolvieren der Lehrveranstaltung werden Studierende theoretische Grundlagen der Sprachverarbeitung beherrschen und in der Lage sein einfache Systeme zur Sprachverarbeitung selbst zu programmieren und diese problembezogen anwenden. 

Inhalt der Lehrveranstaltung

State-of-the-Art der Sprachverarbeitung, akustische Signale und ihre Digitalisierung, Sprachsignal, Vokale, Konsonanten, Spektrum, Spektrogramm, Signalmerkmale zur Spracherkennung, Auswahl der optimalen Merkmale, Bestimmung der Wortgrenzen, Einzelworterkennung durch Mustervergleich, statistische Modellierung zur Erkennung kontinuierlicher Sprache, Zeitanpassung, Signalmerkmale zur Sprechererkennung, Grundfrequenz der Stimme, textabhängigen und textunabhängigen Sprechererkennung, Prinzipien der Sprachsynthese, spezielle Gebiete der Sprachsignalanalyse wie Sprecheremotionserkennung und Alkoholerkennung.



Inhaltliche Schwerpunkte: Grundlagen digitaler Sprachsignalverarbeitung, Merkmale des Sprachsignals, Erkennung von einzelnen Wörtern, Erkennung kontinuierlicher Sprache, Sprechererkennung (Verifikation, Identifikation), Sprachsynthese (Text-to-Speech), Anwendungsfelder der Sprachverarbeitung, Experimentelle Untersuchungen.

Die erste Vorlesung des Teils 3 findet am Mittwoch, 1.3.2017, in Raum CG402 in der Zeit von 13.00 Uhr bis 16.00 statt. Weitere Vorlesungen des Teils 3 finden am 8.3, 15.3. und 22.3.2017 in Raum CG402 in der Zeit von 14.00 Uhr bis 17.00 Uhr statt sowie am 10.3., 17.3. und 24.3.2017 in Raum EI6 von 14.00 Uhr bis 17.00 Uhr (d.h. an insgesamt 7 Terminen im März 2017).

Vortragende Personen

  • Sigmund, Milan

Institut

Leistungsnachweis

Mündliche Prüfung über Vorlesungsstoff (70%) mit integrierten Übungen (30%).

Die mündliche Prüfung findet im Zeitraum 27.3. - 31.3.2017 nach Vereinbarung statt und dauert 30 Minuten pro Prüfling.

LVA-Anmeldung

Nicht erforderlich

Curricula

StudienkennzahlVerbindlichkeitSemesterAnm.Bed.Info
710 FW Freie Wahlfächer - Elektrotechnik Freifach

Literatur

Es wird kein Skriptum zur Lehrveranstaltung angeboten.

Vorkenntnisse

Keine speziellen Vorkenntnisse sind erforderlich. Vorausgesetzt sind grundlegende Kenntnisse der Signalverarbeitung (komplexe Zahlen, Klassifizierung von Signalen, Fourier-Reihe, Fourier-Transformation, Frequenzspektrum).

Sprache

Deutsch