Know it All and Know it Right: High Quality Mining in the Web

01.01.2005 - 31.07.2009

Forschungsförderungsprojekt

Aus der Sicht des Konsumenten hat unsere Welt ein eindrucksvolles, schnell wachsendes Angebot an Informationen, Waren und Dienstleistungen geschaffen. Allerdings ist der Durchschnittsverbraucher durch diese unübersehbare Anzahl von Angeboten überfordert und verwirrt, was zu falschen Entscheidungen, Zeitverschwendung und Frustration führt. Deshalb werden wissensbasierte Systeme eingesetzt, die dem Verbraucher helfen und seine Entscheidungsprozesse vereinfachen sollen. Ein Schlüsselproblem dabei ist das effiziente Anlegen und Instandhalten der Wissenbasen, was die Anwendung von semantischen Systemen zur Steigerung des Wohlbefindens der Verbraucher erst ermöglicht. Der Zweck des eingereichten Projektes ist es, im Web verfügbare Information derart auszunutzen, daß der Wissensakquisitionsprozeß im höchsten Ausmaß automatisiert werden kann. Automatisch nutzbare Information ist im Web typischerweise in semistrukturierten Dokumenten gespeichert, die Tabellen, Listen und Beschreibungen in natürlicher Sprachen enthalten. Das Ziel von automatischer Wissensaneignung ist daher die Übersetzung dieser semistrukturierten Informationen in strukturierte Konzeptbeschreibungen, die von einem Reasoning-System verarbeitet werden können. Basierend auf einer allgemeinen Beschreibung eines Konzepts (z.B. der Definition einer Digitalkamera) soll das eingereichte System automatisch Instanzen dieses Konzepts (z.B. Digitalkameras einer bestimmten Marke) und dessen Eigenheiten finden und Bezüge zu anderen Instanzen herstellen (z.B. Zubehör). Weil die Qualität von wissensbasierten Systemen eng an die der Wissensbasen gebunden ist, wollen wir eine höchstmögliche Recall und Präzision erzielen (beides zumindest mehr als 90%). Um dieses Ziel zu erreichen wollen wir, auf der Basis von Informationsextraktionen, natürlichen Sprachprozessen, maschinellem Lernen und modellbasierter Schlussfolgerung ein Knowlege Mining Framework schaffen. Dieses Knowledge Mining Framework soll an die verschiedenen Branchen höchst anpassungsfähig sein, sodass der Aufwand für die Entwicklung neuer Wissensbasen niedrig gehalten werden kann (weniger als 3 Werktage für eine geübte Person). Das zentrale Forschungsziel ist zu zeigen, dass ein derartiges Knowledge Mining Framework mit einem überschaubaren Aufwand entwickelt werden kann. Wir werden diesen Ansatz demonstrieren, indem wir neue Methoden und Algorithmen entwickeln und die Plausibilität anhand einer empirischen Evaluation verifizieren.

Personen

Projektleiter_in

Reinhard Pichler (E184)

Projektmitarbeiter_innen

Institut

E184 - Institut für Informationssysteme

Förderungmittel

FFG - Österr. Forschungsförderungs- gesellschaft mbH (National) Österreichische Forschungsförderungsgesellschaft mbH (FFG)

Forschungsschwerpunkte

Computational Intelligence: 100%

Schlagwörter

Deutsch	Englisch
Extraktion	extraction
data mining	data mining
www	www

Externe Partner_innen

Universität Klagenfurt Institut für Wirtschaftsinformatik und Anwendungssysteme
ConfigWorks Informationssysteme&Consultung GmbH
Lixto Software GmbH

Publikationen

Publikationsliste