Diese Lehrveranstaltung liefert eine Einleitung in Data Science. Der Schwerpunkt liegt auf Strategien für den Entwurf von Experimenten, unter Berücksichtigung von Workflow Umgebungen und Aspekten der Reproduzierbarkeit und Nachvollziehbarkeit von Ergebnissen. Weiters werden Kenntnisse über den Life Cycle von Daten, von der Erhebung über deren Verarbeitung bis hin zur langfristigen Zurverfügungstellung und Nachnutzung vermittelt. Sie führt Studierende in die komplexen rechtlichen und ethischen Anforderungen ein, die das Arbeiten mit Daten bedingen.
Die folgende Themen werden in den Vorlesungen behandelt:
- Einführung in Data Science
- Daten und der Daten Life Cycle
- Konzeptuelle Entwurf von Experimenten
- Workflow Paradigmen
- Daten Management, Reproduzierbarkeit und Nachverfolgbarkeit
- Fehler Analyse und statistische Tests
- Fortgeschrittene Entwurf von Experimenten
Zwei praktische Übungen sind Teil vom Kurs.
Aufwand:
7 2-Stunden Vorlesungen: 14h
Übungsbeispiel 1: 15h
Übungsbeispiel 2 (inkl. Präsentation): 25h
Vorbereitung Prüfung: 20h
Prüfung: 1h
SUMME: 75h
Termine
(alle FH HS2, Do, 14-16h c.t.)
BLOCK 1
4.10.: Introduction to data science - data science process -Hanbury
11.10.: Data and the data lifecycle, ethical and legal aspects -Hanbury
BLOCK 2
[18.10.: Optional: Machine Learning Primer -Knees]
25.10.: Conceptual Experiment Design: Planning and Execution of Experiments, hypotheses -Knees
Exercise 1: Design an experimental workflow for a given dataset
22.11.: Workflow paradigms and Scientific Workflow Environments; iPython, Jupyter Notebook, WEKA, Graphical Experimentation Workflow; -Schindler, Knees
BLOCK 3
29.11.: Facilitating reproducibility and traceability; Basics data management planning and data stewardship; - Rauber
6.12.: Experiment Error Analysis and Statistical Testing 1 -Knees
20.12.: Experiment Error Analysis and Statistical Testing 2 -Knees
Exercise 2: Reproduce experimental results from a paper
17.1.: Presentations of Exercise 2
24.1.: Written Exam