Touristische Datensätze (strukturierte und unstrukturierte Hotelbeschreibungen), geliefert von der Firma RoomBonus GmbH, werden mit Hilfe von Data Mining Methoden analysiert, wobei in diesen Beschreibungen touristische Zusatzleistungen als Konzepte identifiziert werden sollen. Hierbei werden folgende Schritte durchgeführt:
- Parsing der Datensätze
- Pre-Processing (Tokenizing, Filtering, Stemming, etc.)
- Analyse (Classification, Clustering, Information Extraction)
- Mapping der Ergebnisse auf bestimmte Datensätze / Konzepte
- (Manuelles) Überprüfen anhand von Testcases