Diese Lehrveranstaltung liefert eine Einleitung in Data Science. Der Schwerpunkt liegt auf Strategien für den Entwurf von Experimenten, unter Berücksichtigung von Workflow Umgebungen und Aspekten der Reproduzierbarkeit und Nachvollziehbarkeit von Ergebnissen. Weiters werden Kenntnisse über den Life Cycle von Daten, von der Erhebung über deren Verarbeitung bis hin zur langfristigen Zurverfügungstellung und Nachnutzung vermittelt. Sie führt Studierende in die komplexen rechtlichen und ethischen Anforderungen ein, die das Arbeiten mit Daten bedingen.
Die folgende Themen werden in den Vorlesungen behandelt:
- Einführung in Data Science
- Daten und der Daten Life Cycle
- Konzeptuelle Entwurf von Experimenten
- Workflow Paradigmen
- Daten Management, Reproduzierbarkeit und Nachverfolgbarkeit
- Fehler Analyse und statistische Tests
- Fortgeschrittene Entwurf von Experimenten
Zwei praktische Übungen sind Teil vom Kurs.
Aufwand:
7 2-Stunden Vorlesungen, inklusive ein Multiple-Choice-Quiz: 14h
Übungsbeispiel 1: 15h
Übungsbeispiel 2: 25h
Vorbereitung Prüfung: 20h
Prüfung: 1h
SUMME: 75h
Termine
(alle Seminarraum von Neumann, Mi, 16-18h)
BLOCK 1
18. Okt: Introduction to data science - data science process, algorithmic ethics, human-in-the-loop -Hanbury
25. Okt: Data and the data lifecycle (include ethical and legal aspects introduction) -Hanbury
BLOCK 2
8. Nov: Conceptual Experiment Design: Planning and Execution of Experiments, Crisp-DM -Knees
22. Nov: Workflow paradigms and Scientific Workflow Environments: Taverna, Kepler, Myexperiments.org, environment set-up: iPython, iPython Notebook Versioning, Yesworkflow, Noworkflow; -Schindler, Knees
Exercise 1: Design an experimental workflow for a given dataset (start: 22.11, hand-in: 12.12)
BLOCK 3
29. Nov: Facilitating reproducibility and traceability; Basics data management planning and data stewardship; - Rauber
6. Dez: Experiment Error Analysis and Statistical Testing -Knees
13. Dez: Deep Experiment Design (statistical power, application in workflows, metastudies, ...) -Knees
Exercise 2: Reproduce experimental results from a paper (start: 29.11, zwischenabgabe: 5.12, hand-in: 19.1)
24. Jan: Exam