Information Extraction, Ansätze und Technologien der Wrappergenerierung, Abfragen für das Web, Datenintegration, XML.
- Information Extraction: Setting, History, IE vs. IR
- Structured Data Extraction and Wrapping
- XML Transformation and Query Languages
- Web Wrapper Languages
- Wrapper Generation Tools
- Wrappers for Mashups, SOA and BI
- Inductive Wrapper Generation
- Automatic Data Extraction / Web Data Mining
- Supervised Wrapper Generation
- Deep Web Navigation Approaches
- Data Extraction from PDF documents
- Mediation and Integration Approaches
- Web Data Cleaning
- Lixto Visual Wrapper and Transformation Server
Die LVA besteht aus Vorlesungs- und Übungsteil. Der Vorlesungsteil dient primär zur Vermittlung von Informationen, sowie der Illustration von Konzepten in der Praxis anhand von Live Demonstrationen verschiedener Systeme. Der Übungsteil zur selbständigen Vertiefung derselben bzw. insbesondere der praktischen Anwendung von Tools und Methoden im Bereich der Webdatenextraktion. Am Ende der VU werden weiterführende Aspekte in Gruppenvorträgen behandelt. An einem der Termine wird auch ein Überblick über laufende Projekte am DBAI gegeben um einen Einblick in aktuelle Forschungsgebiete zu geben.
Ausgewählte Freitage 15:30-19:00 (UE Termin A 15:30-16:20, VO 16:30-17:30, UE Termin B 17:40-18:30), Vorbesprechung am 1. Oktober 15:30-16:30 (A und B), insgesamt 9 Termine, Details auf Webseite http://www.dbai.tuwien.ac.at/staff/baumgart/exin1011/.
Course Language: English
Betreute Übungen mit Tutor.