184.729 Semantic Technologies
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2020W, VU, 2.0h, 3.0EC, wird geblockt abgehalten
TUWEL

Merkmale

  • Semesterwochenstunden: 2.0
  • ECTS: 3.0
  • Typ: VU Vorlesung mit Übung
  • Format der Abhaltung: Online

Lernergebnisse

Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage:

  1. zu beurteilen, wie Daten aus verschiedenen Domänen als Diagramm betrachtet werden können, graphisch-strukturierte Darstellungen von Daten zu vergleichen, und solche Darstellungen in und aus verwandten Datenmodellierungsformalismen wie relationalen Datenbanken und RDF-Tripelspeichern zu übersetzen.
  2. Spezifikationen von Domänenwissen für einen gegebenen Graphen-Datensatz unter Verwendung von RDF-S, SHACL und verschiedenen Varianten der OWL-Profile zu schreiben, zu lesen und zu verstehen.  
  3.  Informationsbedürfnisse als Abfragen über Wissensgraphen unter Verwendung geeigneter Abfragesprachen zu formulieren: Konjunktivabfragen, Vereinigungen von Konjunktivabfragen und deren Erweiterungen mit regulären Pfaden. 
  4. zu erkennen, welche Abfragesprachen eine bestimmte Abfrage ausdrücken können, und Abfragen zwischen verschiedenen Darstellungen zu transformieren. 
  5.  zwischen den erwähnten Spezifikationsformalismen zu wählen, die für verschiedene Settings angemessen ist, wobei die Vollständigkeit der Daten, der Informationsbedarf und die erwartete rechnerische Effizienz des Zugangs berücksichtigt werden.
  6. einen Algorithmus zur Validierung eines Wissensgraphen, der Wissen in einer dieser Sprachen enthält, und zum Zugriff auf die Daten zu beschreiben. Bei kleine bis mittlerer Eingaben, die Studierenden sind in der Lage, Anfragen manuell zu beantworten oder Ziele zu validieren.
  7. die untersuchten Abfrage- und Validierungsalgorithmen zu vergleichen, zu argumentieren, welche Techniken für welche Formalismen geeignet sind, und eine Erklärung ihrer rechnerischen Komplexität zu geben. 
  8. die Reparaturen eines inkonsistenten Wissensgraphen aufzulisten und die Antworten auf eine gegebene Frage über Standardvarianten der Reparatursemantik zu berechnen. 
  9.  eine OBDI-Spezifikation zu schreiben, um einen virtuellen Wissensgraphen zu erstellen, der eine Beschreibung einer Domäne und einiger möglicherweise heterogener unvollständiger Datenquellen enthält.
  10. erklären, wie die Antworten auf eine Anfrage über die dargestellten virtuellen Wissensgraphen für eine gegebene OBDI-Spezifikation berechnet werden können.

 

(1) ...Domänenspezifikationen in RDF-S, SHACL und in den OWL-Profilen zu schreiben.  

(2) ... zu einer gegebenen Spezifikation und eines Datengraphen, einen geeigneten Validierungs-Algorithmus auszuwählen, und einen vorhandenen Engine für die Aufgabe zu nennen. Für kleine Beispiele, können die Studierenden  die Validierung manuell auf Papier durchführen.  

(3) ...die Semantik von closed-world Formalismen wie SHACL, mit open-world Formalismen wie OWL zu vergleichen. Die Studierenden können auch erklären, welche Konsequenzen sich aus diesen unterschiedlichen semantischen Annahmen ergeben.  

(4) ...einen Algorithmus zur Auswertung einer gegebenen SPARQL-Abfrage (in einem wohlgeformten monotonen SPARQL-Fragment) über einen Wissensgraph zu erklären. 

 (5) ...wenn ein inkonsistenter Wissensgraph vorliegt, seine Reparaturen zu beschreiben, und die Antworten auf eine gegebene Frage zu berechnen, wobei die Standardvariationen der Reparatursemantik berücksichtigt werden.    

(6) ...angesichts der Beschreibung einer Domäne und möglicherweise heterogener, unvollständiger Datenquellen, eine OBDA-Spezifikation für diese Domäne zu schreiben.    

(7) ...anhand einer Anfrage und einer OBDA-Spezifikation, zu erklären wie die Antworten über die dargestellten virtuellen Wissensgraphen berechnet werden können.


Inhalt der Lehrveranstaltung

Der Kurs behandelt verschiedene semantische Technologien und die Art und Weise, wie sie für die Integration und den Zugriff auf Daten eingesetzt werden können, insbesondere auf Daten, die mit Legacy-Techniken nicht einfach zu handhaben sind, weil sie unvollständig, inkonsistent oder heterogen sind und ihre Integration und Pflege teuer sein kann.
Wir werden Spezifikationssprachen wie RDF-S, SHACL und die OWL-Profile sowie die Abfragesprache SPARQL untersuchen. Diese Formalismen werden im Detail untersucht, wobei ihre abstrakte Syntax, ihre semantischen Annahmen und ihre Kernalgorithmen für die Validierung und Abfrageauswertung verglichen werden. Wir werden sehen, wie RDF-S, SHACL und OWL zur Validierung von Graphen-Daten und zur Gewinnung nützlicher Wissensgraphen aus möglicherweise unvollständigen und heterogenen Daten verwendet werden können. Wir werden untersuchen, wie diese Graphen in (Fragmenten der) SPARQL-Abfragesprache abgefragt werden können, einige der algorithmischen und rechnerischen Herausforderungen, die sich aus der unterschiedlichen Wahl der Formalismen ergeben, sowie Lösungen für die Abfrage sowohl virtueller als auch inkonsistenter Wissensgraphen.


Teil 1:  Abfragen von Graphen

Thema 1: Datenmodell für graphisch-strukturierte Daten (GSD)
1.1 Das Grundmodell des GSD

- Definition einer GSD-Instanz
- Darstellungen von GSD-Instanzen (als beschriftete Graphen und als Menge von Atomen, Konversionen)
- Das GSD-Modell als Spezialfall des relationalen Modells

1.2 Eigenschaftsgraphen

- Eigenschaftsdiagramme: Definition, Eigenschaftsgraphen als relationale Instanzen  

Thema 2: Abfragen von Graphen

- Definitionen von CQs, UCQs, 2RPQs, C2RPQs
- Vergleich der Abfragesprachen, Aussagekraft  
- Syntaktische Varianten zur Darstellung von Abfragen

2.1 Beantwortung von Anfragen

- Abfrageantworten: Definition, bestimmte Antworten, Entscheidungsprobleme
- Grundlagen der Abfrageauswertung über eine GSD-Instanz

2.2 Komplexität der Anfragebeantwortung

- Definition von Daten und kombinierter Komplexität
- Komplexitätsgrenzen
    

Thema 3: Abfragen von RDF-Grafiken

- RDF-Dreifache und Diagramme
- GSD vs. RDF-Grafiken, RDF-ABoxen
- BGPs und CQ-BGPs, syntaktische Darstellungen
- Bewertung von CQ-BGP über RDF-ABoxen: Regeln für den Abschluss
- Kombiniert und Datenkomplexität bei der Bewertung von CQ-BGPs über RDF-ABoxen


Teil 2: Ontologien und Wissensgraphen  

Thema 4: Abfragen mit Wissen

- RDF-S-Ontologien, abstrakte Syntax, Wissensgraphen (KGs)
- Definition von Modellen für KGs
- Abfrageauswertung mit RDF-S-Ontologien, Vervollständigungsregeln
- Komplexität der Abfrageauswertung

 3.1 Inkonsistenz

- Behauptungen zur Uneinheitlichkeit in RDF
- Datenkonsistenz w.r.t. einer Ontologie
- Konsistenzprüfung: Definition, Algorithmen und Komplexität
     

Thema 5: OWL-Ontologien

- DL-ähnliche Syntax für OWL QL, OWL EL, OWL 1 Lite, OWL 2
- Formale Semantik von OWL: Definition von Interpretationen, Modellhaftigkeit
- Begründungsaufgaben: Klassenerfüllbarkeit, Klassensubsumtion,
- Schreiben von OWL-Ontologien
- Profile vergleichen
- Anfragebeantwortung in LQ: Algorithmen und Komplexität
- Anfragebeantwortung in EL: Algorithmen und Komplexität
- Jenseits der Leichtbauprofile: Ausdruckskraft und Komplexität


Teil 3: Variationen

Thema 6: SHACL

- SHACL-Schemata, abstrakte Syntax
- SHACL-Validierung  
- Vergleich von OWL und SHACL

Thema 7: Ontologie-basierte Datenintegration und virtuelle KGs

- OBDI und VKGs: Ziele und Grundsätze
- OBDI-Spezifikationen und OBDI-Instanzen, Modelle
- Bestimmte Antworten: Definition
- Abfrageauswertungspipeline, grundlegende Algorithmen

Methoden

Der Vorlesung hat verschiedene Komponenten.

(1) *Vorlesungsvideos* (asynchron)
Videopräsentationen der Vortragsmaterialien werden jede Woche online gestellt und können asynchron angesehen werden.

(2)*Online-Diskussion*
(Teilnahme optional;
synchron - vorläufiger Zeitplan Di 9:00-10:00)
In einer wöchentlichen Zoom-Sitzung werde ich die in der Vorwoche eingestellten Materialien kommentieren, Fragen beantworten, und Übungen diskutieren.
In einigen dieser Treffen wird es optionale Online-Quizzes geben (ich werde sie eine Woche vorher ankündigen), die als Alternative zur Prüfung gelten.

(3) *Übungen*
Es werden optionale Übungen ausgeschrieben, die unabhängig zu lösen sind. Ich werde zu den Lösungen, die ich erhalte, Feedback geben. Korrekte Lösungen können als Alternative zur Prüfung ebenfalls zur Note beitragen.

*Noten*
Sie können zwischen zwei Formen der Benotung wählen:
(A) Sie können Ihre Note während des Semesters erhalten, indem Sie anhand von Übungen und Quizfragen zeigen, dass Sie den Stoff aller Lerneinheiten beherrschen.
(B) Eine Prüfung am Ende des Semesters (schriftlich + mündlich).
In Modell (A) können Sie Noten oder frühere Lerneinheiten wiederholen und verbessern.

Weitere Einzelheiten werden in der Einführungsvorlesung am Dienstag, 13.10., 9:00 Uhr auf Zoom bekannt gegeben.

Prüfungsmodus

Schriftlich und Mündlich

Weitere Informationen

ECTS breakdown: 3 ECTS = 75 Stunden

Vorlesungen: 20 Stunden
Übungen und Selbstlernen: 53 Stunden
Prüfung: 2 Stunden

 

Vortragende Personen

Institut

LVA Termine

TagZeitDatumOrtBeschreibung
Di.09:00 - 10:0013.10.2020 - 26.01.2021 Zoom meeting (TUWEL) (LIVE)Online-Besprechung von Vortragsmaterialien
Semantic Technologies - Einzeltermine
TagDatumZeitOrtBeschreibung
Di.13.10.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.20.10.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.27.10.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.03.11.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.10.11.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.17.11.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.24.11.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.01.12.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.15.12.202009:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.12.01.202109:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.19.01.202109:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
Di.26.01.202109:00 - 10:00 Zoom meeting (TUWEL)Online-Besprechung von Vortragsmaterialien
LVA wird geblockt abgehalten

Leistungsnachweis

*Benotung *
Sie können zwischen zwei Formen der Benotung wählen: 
(A) Sie können Ihre Note während des Semesters erhalten, indem Sie anhand von Übungen und Quizfragen zeigen, dass Sie den Stoff aller Lerneinheiten beherrschen. 
(B) Eine Prüfung am Ende des Semesters (schriftlich + mündlich). 
In Modell (A) können Sie Noten oder frühere Lerneinheiten wiederholen und verbessern.

Weitere Einzelheiten werden in der Einführungsvorlesung am Dienstag, 13.10., 9:00 Uhr auf Zoom bekannt gegeben.

LVA-Anmeldung

Von Bis Abmeldung bis
19.08.2020 09:00 16.11.2020 23:00

Curricula

StudienkennzahlVerbindlichkeitSemesterAnm.Bed.Info
066 645 Data Science Keine Angabe
066 926 Business Informatics Gebundenes Wahlfach
066 931 Logic and Computation Gebundenes Wahlfach

Literatur

Es wird kein Skriptum zur Lehrveranstaltung angeboten.

Begleitende Lehrveranstaltungen

Sprache

Englisch