Search:
Lehrstuhl  |  Institut  |  Fakultät  |  LMU
print

Bachelorseminar "Information Theoretic Data Mining" im WS 2015/16



Aktuelles

  • 15.12.2015 Die Abgabefrist für die Ausarbeitung ist am 22.02.2016. Es soll dieses LaTeX Template verwendet werden (bare-conf.tex).
  • 15.12.2015 Die Abgabefrist für die Vortragsfolien ist am 18.01.2016.
  • 19.10.2015 Die Folien der Vorbesprechung sind nun verfügbar.
  • 19.10.2015 Die Themenvergabe ist abgeschlossen.
  • 12.10.2015 Ort und Zeit aller Termine zum Seminar stehen jetzt fest
  • 06.10.2015 Die Einführungsveranstaltung findet in der zweiten Vorlesungswoche statt. Der genaue Termin wird noch bekanntgegeben.
  • 06.10.2015 Vergabe der Plätze über die Zentralanmeldung ist abgeschlossen.

Inhalt

Neue informationstheoretische Ansätze verbinden Data Mining mit Daten-Kompression: Data Mining Methoden finden Muster oder Regelmäßigkeiten in Daten. Je effektiver diese Daten mit Hilfe der gefundenen Muster komprimiert werden können, desto größer ist der gewonnene Informationsgehalt. Das Potential dieser Methodik wird in vielen wissenschaftlichen Arbeiten verdeutlicht: Informationstheoretische Ansätze können vollständige Parameterfreiheit gewährleisten, sodass der Nutzer keine Eingabeparameter spezifizieren muss, die oft schwer zu schätzen sind. Des Weiteren können informationstheoretische Methoden eine Vielzahl von Data Mining Techniken integrieren, wie zum Beispiel Clustering, Outlier Detection und Association Rule Mining. Außerdem können die Verfahren auf verschiedenste Datenstrukturen angewandt werden, wie numerische Feature Vektoren, kategorische Daten oder Graphen.

Im Rahmen dieses Seminars sollen aktuelle Forschungsarbeiten aus dem Bereich informationstheoretisches Data Mining präsentiert und diskutiert werden.

Für eine erfolgreiche Teilnahme am Seminar gibt es folgende Voraussetzungen:

  • Teilnahme an der Vorbesprechung
  • Aktive Teilnahme an beiden Seminartagen
  • Eigenständig vorbereitete Präsentation, die zeigt, dass die präsentierte Forschung verstanden wurde
  • schriftliche Ausarbeitung von etwa 5-10 Seiten

Grundkenntnisse im Bereich Data Mining und/oder Machine Learning sind hilfreich aber nicht verpflichtend.

Die Vortragszeit beträgt 25 Min., darauf folgen 5-10 Min. Diskussion. Die Teilnehmerzahl ist auf 15 Teilnehmer begrenzt.



Organisation


Anmeldung

  • Zentralanmeldung per UniWorX. Bitte die Hinweise unter Aktuelles beachten!

Ablauf

Jeder Teilnehmer bekommt eine wissenschaftliche Veröffentlichung. Diese soll in einem Referat von 25 Minuten vorgestellt werden. Weiterhin relevante Literatur soll vom jeweiligen Referenten selbständig hinzugezogen werden. Im Anschluss an jedes Referat wird die vorgestellte Veröffentlichung von allen Teilnehmern diskutiert.

Nach dem Blockseminar soll jeder Teilnehmer eine schriftliche Ausarbeitung von etwa 5-10 Seiten einreichen, die sowohl die wesentlichen Punkte der vorgestellten Veröffentlichung als auch die Ergebnisse der Diskussion präsentiert.

In die Bewertung gehen sowohl Qualität von Referat und schriftlicher Ausarbeitung ein als auch qualifizierte Mitarbeit und Teilnahme an den Diskussionen jeder Sitzung.


Ort und Zeit

Veranstaltung Datum Zeit Raum
Vorbesprechung Mo, 19.10.2015 14.00-16.00 Uhr Raum 065 (Oettingenstr. 67)
Seminarblock 1 Fr, 22.01.2016 12.00-18.00 Uhr Raum C003 (Oettingenstr. 67)
Seminarblock 2 Fr, 29.01.2016 12.00-16.00 Uhr Raum C003 (Oettingenstr. 67)

Planung

Tag 1: Freitag, 22.01.2016

Zeit Thema Vortragender
12:00 Begrüßung und Einführung Prof. Dr. Christian Böhm und Dr. Bianca Wackersreuther
12:15 Robust Information-theoretic Clustering Simon Lackerbauer
13:00 A Nonparametric Information Theoretic Clustering Algorithm Collin Leiber
13:45 minCEntropy: a Novel Information Theoretic Approach for the Generation of Alternative Clusterings Wolfgang Engelbrecht
14:30 Integrative Parameter-Free Clustering of Data with Mixed Type Attributes Verena Knerich
15:15 Pause
15:45 INCONCO: Interpretable Clustering of Numerical and Categorical Objects Hendrik Börger
16:30 Dependency Clustering Across Measurement Scales Alev Canoglu
17:15 Relevant Overlapping Subspace Clusters on Categorical Data Aldo Brießmann

Tag 2: Freitag, 29.01.2016

Zeit Thema Vortragender
12:00 Fully Automatic Cross-associations Gabriel Gadain
12:45 Weighted Graph Compression for Parameter-free Clustering with PaCCo Florian Kirchgeßner
13:30 Summarization-based Mining Bipartite Graphs Ludwig Grill
14:15 Subdue: Compression-Based Frequent Pattern Discovery in Graph Data Christoph Thiele
15:00 Compression-based Graph Mining Exploiting Structure Primitives Benedikt Schweickhardt
15:45 PICS: Parameter-free Identification of Cohesive Subgroups in Large Attributed Graphs Tobias Heider
16:30 VoG: Summarizing and Understanding Large Graphs Filip Hristov
17:15 Mining Connection Pathways for Marked Nodes in Large Graphs Ludwig Wacker

Zusätzliche Informationen


Vorhergehende Semester

WS 14/15

blank