Inhaltsverzeichnis

1 Ähnlichkeitssuche in Multi-Domain-Zeitreihen

Ähnlichkeitssuche in Multi-Domain-Zeitreihen

Motivation

Darstellung einer Multi-Domain-Zeitreihe

Zeitabhängige Vorgänge sind überall im Leben präsent. Die Dauer von bestimmten Ereignissen oder die Beschreibung von sich zeitlich verändernden Attributen von Objekten finden als Zeitreihen z.B. im Finanzwesen, in der Industrie, in der Medizin oder in der Umweltbeobachtung ihre Anwendung. Sie können als simple Kurven über einen zeitlichen Verlauf verstanden werden. Zeitreihen beinhalten sehr häufig charakteristische und wiederkehrende Muster. Diese Periodizität kann durch die Einführung einer zweiten Zeitdomäne gesondert betrachtet werden. Eine Sequenz von Punkten mit gleichmäßigen Zeitabständen kann auf diese Weise in eine Matrix von Punkten überführt werden.

Eine elementare Anfrageform in Zeitreihen-Datenbanken ist die Ähnlichkeitsanfrage, die als Basisanfrage für Anwendungen im Data Mining dient. Für die Berechung der Ähnlichkeit von zwei Multi-Domain-Zeitreihen vergleichen die meisten Abstandmaße wie bei den eindimensionalen Kurven bisher lediglich jeden Zeitpunkt der einen Zeitreihen mit einem passenden Zeitpunkt der anderen Zeitreihe. Bei komplexen, großen Zeitreihen kann dies sehr aufwändig und ungenau werden. Durch geeignete Extrakrion und Betrachtung der periodischen Muster, welche aus den Zeitreihen extrahiert werden, können Ähnlichkeitsanfragen sowohl effektiv als auch effizient beantwortet werden.

Problemstellung

Threshold-basierte Repräsentation

In diesen Projekten sollen verschiedene Methoden zur Mustererkennung in Daten, zur Aufbereitung der Daten als Multi-Domain-Zeitreihen und zur Ähnlichkeitssuche auf diesen entwickelt werden. Der Schwerpunkt der Arbeit liegt dabei in der threshold-basierten Ähnlichkeitssuche. Ziel ist es, geeignete Features (sowohl rein statistisch als auch form- und lagebasiert) zur bestböglichen Beschreibung der Muster aus Multi-Domain-Zeitreihen zu finden und zu testen.
Die zu entwicklnden Methoden sollen insbesondere eine eine hohe Effektivität aufweisen. Zur Steigerung der Effizienz werden außerdem Ansätze mit Filterschritt sowie der Einsatz von Indexstrukturen wie z.B. der MVR-Baum untersucht. Dabei kann auf Methoden und Werkzeuge zurückzugegriffen werden, die bereits am Lehrstuhl entwickelt wurden.

Die Arbeit ist möglich als Bachelor-, Projekt-, Master- und Diplomarbeit.

Vorkenntnisse

Kenntnisse in Java oder C/C++ werden vorausgesetzt
Kenntnisse in KDD und/oder Indextrukturen sind hilfreich

Veröffentlichungen

more information...

Ansprechpartner

Thomas Bernecker, Matthias Renz

Von „http://fogo.dbs.ifi.lmu.de/cms/OffeneThemen/TimeSeries“