Information Extraction, Ansätze und Technologien der Wrappergenerierung, Abfragen für das Web, Datenintegration, XML.
- Information Extraction: Setting, History, IE vs. IR
- Structured Data Extraction and Wrapping
- XML Transformation and Query Languages, DOM, jQuery
- Web Wrapper Languages
- Wrapper Generation Tools
- Wrappers for Mashups, SOA and BI
- Inductive Wrapper Generation
- Automatic Data Extraction / Web Data Mining
- Supervised Wrapper Generation
- Deep Web Navigation Approaches
- Mediation and Integration Approaches
- Web Data Cleaning
- Lixto Visual Wrapper and Transformation Server
Die LVA besteht aus Vorlesungs- und Übungsteil. Der Vorlesungsteil dient primär zur Vermittlung von Informationen, sowie der Illustration von Konzepten in der Praxis anhand von Live Demonstrationen verschiedener Systeme. Der Übungsteil zur selbständigen Vertiefung derselben bzw. insbesondere der praktischen Anwendung von Tools und Methoden im Bereich der Webdatenextraktion. Am Ende der VU werden weiterführende Aspekte in Gruppenvorträgen behandelt. An einem der Termine wird auch ein Überblick über laufende Projekte am DBAI gegeben um einen Einblick in aktuelle Forschungsgebiete zu geben.
ECTS-Breakdown:
Vorlesung: 14 Stunden
Übungsbesprechung: 8 Stunden
Übungsaufwände: 26 Stunden
Abschlussprojekt/prüfung: 27 Stunden
Summe: 75h (3 ECTS)
Ausgewählte Freitage 16:00-19:00 (UE Termin A 16:00-17:00, VO 17:00-18:00, UE Termin B 18:00-19:00), erster Termin am 5. Oktober 16:00-17:30 (A und B), insgesamt 9 Termine, Details auf http://www.dbai.tuwien.ac.at/staff/baumgart/exin1213/.
Course Language: English
Betreute Übungen mit Tutor.
Die Übungen werden nach einer anfänglichen Einzelphase in Gruppen von ca. 5 Teilnehmern entsprechend der Gruppenanmeldung im TISS gemeinsam ausgearbeitet. Falls Sie mit bestimmten Kollegen zusammenarbeiten möchten, ersuchen wir Sie daher, sich nach Möglichkeit gemeinsam in eine der TISS-Gruppen anzumelden.
Die VU findet am 5.10., 19.10., 9.11., 16.11., 23.11., 30.11., 7.12., 14.12., 11.1., 18.1. und 25.1. statt.
Der Leistungsnachweis erfolgt zum einen Teil über Einzelabgaben und Gruppenabgaben von Übungsaufgaben sowie deren Präsentation während des Semesters, zum anderen Teil am Semesterende durch ein Abschlussprojekt, in dem ein Thema in einer Abschlusspräsentation und -arbeit ausgearbeitet, präsentiert und besprochen wird.
Die Anmeldung zur VU erfolgt durch Registrierung für eine Übungsgruppe via TISS. Falls Sie ECML Student sind und sich noch nicht registrieren können, melden Sie sich bitte per email zur Übung an. A Gruppen 16:00 bis 17:00, B Gruppen 18:00-19:00.