Search:
Lehrstuhl  |  Institut  |  Fakultät  |  LMU
print

Bachelorseminar "Information-theoretic Data Mining" im WS 2016/17



Aktuelles

  • 01.02.2017 Abgabe der Ausarbeitung bis 03.03.2017
  • 01.02.2017 Für die Erstellung der Ausarbeitung soll dieses LaTeX Template verwendet werden (bare-conf.tex).
  • 01.02.2017 Aktueller Beginn des Seminars am 03.02.2017: 13.00 Uhr
  • 12.10.2016 Die Folien der Vorbesprechung sind nun verfügbar. Alle Informationen zu wichtigen Abgabefristen sind hier enthalten.
  • 11.10.2016 Anmeldung und Themenvergabe ist abgeschlossen.
  • 05.10.2016 Der Termin für die Vorbesprechung findet am 11.10.2016 um 10.00 Uhr in Raum 131 statt.

Inhalt

Neue informationstheoretische Ansätze verbinden Data Mining mit Daten-Kompression: Data Mining Methoden finden Muster oder Regelmäßigkeiten in Daten. Je effektiver diese Daten mit Hilfe der gefundenen Muster komprimiert werden können, desto größer ist der gewonnene Informationsgehalt. Das Potential dieser Methodik wird in vielen wissenschaftlichen Arbeiten verdeutlicht: Informationstheoretische Ansätze können vollständige Parameterfreiheit gewährleisten, so dass der Nutzer keine Eingabeparameter spezifizieren muss, die oft schwer zu schätzen sind. Des Weiteren können informationstheoretische Methoden eine Vielzahl von Data Mining Techniken integrieren, wie zum Beispiel Clustering, Outlier Detection und Association Rule Mining. Außerdem können die Verfahren auf verschiedenste Datenstrukturen angewandt werden, wie numerische Feature Vektoren, kategorische Daten oder Graphen.

Im Rahmen dieses Seminars sollen aktuelle Forschungsarbeiten aus dem Bereich informationstheoretisches Data Mining präsentiert und diskutiert werden.

Für eine erfolgreiche Teilnahme am Seminar gibt es folgende Voraussetzungen:

  • Teilnahme an der Vorbesprechung
  • Aktive Teilnahme an beiden Seminartagen
  • Eigenständig vorbereitete Präsentation, die zeigt, dass die präsentierte Forschung verstanden wurde
  • schriftliche Ausarbeitung von etwa 5-10 Seiten

Grundkenntnisse im Bereich Data Mining und/oder Machine Learning werden vorausgesetzt.

Die Vortragszeit beträgt 25 Min., darauf folgen 5-10 Min. Diskussion. Die Teilnehmerzahl ist auf 15 Teilnehmer begrenzt.



Organisation


Anmeldung

abgeschlossen


Ablauf

Jeder Teilnehmer bekommt eine wissenschaftliche Veröffentlichung. Diese soll in einem Referat von 25 Minuten vorgestellt werden. Weiterhin relevante Literatur soll vom jeweiligen Referenten selbständig hinzugezogen werden. Im Anschluss an jedes Referat wird die vorgestellte Veröffentlichung von allen Teilnehmern diskutiert.

Nach dem Blockseminar soll jeder Teilnehmer eine schriftliche Ausarbeitung von etwa 5-10 Seiten einreichen, die sowohl die wesentlichen Punkte der vorgestellten Veröffentlichung als auch die Ergebnisse der Diskussion präsentiert.

In die Bewertung gehen sowohl Qualität von Referat und schriftlicher Ausarbeitung ein als auch qualifizierte Mitarbeit und Teilnahme an den Diskussionen jeder Sitzung.


Ort und Zeit

Veranstaltung Datum Zeit Raum
Vorbesprechung Di, 11.10.2016 10.00-12.00 Uhr Raum 131 (Oettingenstr. 67)
Seminarblock 1 Fr, 03.02.2017 8.00-18.00 Uhr Raum 067 (Oettingenstr. 67)
Seminarblock 2 Fr, 10.02.2017 8.00-18.00 Uhr Raum 067 (Oettingenstr. 67)

Planung

Tag 1: Freitag, 03.02.2017

Zeit Thema Vortragender
12:00 Begrüßung und Einführung Dr. Bianca Wackersreuther und Dominik Mautz
12:15 Robust Information-theoretic Clustering Matthias Haupt
13:00 A Nonparametric Information Theoretic Clustering Algorithm Eva-Maria Schinzel
13:45 minCEntropy: a Novel Information Theoretic Approach for the Generation of Alternative Clusterings Entfällt
14:30 Integrative Parameter-Free Clustering of Data with Mixed Type Attributes Lukas Rambold
15:15 Pause
15:45 INCONCO: Interpretable Clustering of Numerical and Categorical Objects Ramin Rastin
16:30 Dependency Clustering Across Measurement Scales Erik Daxberger
17:15 Relevant Overlapping Subspace Clusters on Categorical Data Matthias Albert

Tag 2: Freitag, 10.02.2017

Zeit Thema Vortragender
12:00 Fully Automatic Cross-associations Bernhard Gröttrup
12:45 Weighted Graph Compression for Parameter-free Clustering with PaCCo Jonas Müller
13:30 Summarization-based Mining Bipartite Graphs Tom Müller
14:15 Subdue: Compression-based Frequent Pattern Discovery in Graph Data Sebastian Rehms
15:00 Pause
15:30 Compression-based Graph Mining Exploiting Structure Primitives Maximilian Bley
16:15 PICS: Parameter-free Identification of Cohesive Subgroups in Large Attributed Graphs Daniel Hämmerle
17:00 VoG: Summarizing and Understanding Large Graphs Alexandra Ferber
17:45 Mining Connection Pathways for Marked Nodes in Large Graphs Kristi Lubonja

Zusätzliche Informationen

Latex

Literaturrecherche

Lesen&Verstehen

Vortrag

Ausarbeitung


Vorhergehende Semester

WS 16/17, SS 16, WS 15/16, WS 14/15

blank