Seminar: Implementierungtechniken für Hauptspeicherdatenbanksysteme

Informationen

Inhalt

In diesem Seminar behandeln wir Implementierungstechniken für Hauptspeicherdatenbanksysteme und verwandte Themen.

Vorraussetzungen

  • Grundlagen Datenbanken, GDB oder ähnliche Kurse
  • sehr gute Kenntnisse in Datenbanken, gute Programmierfähigkeiten in C++

Termine

  • wöchentliches Treffen: Montags, 16:00 - 18:00, Raum MI 02.09.014
  • erstes Treffen: 22.10.2018

Organisation

  • Auftakttreffen für das Seminar: Donnerstag, 28.06.2018, 12:00 - 14:00, Raum MI 02.11.018
  • Neben einer kurzen Ausarbeitung (max. 5 Seiten) und der Präsentation erwarten wir eine Beispielimplementierung des wichtigsten Aspekts Ihrer Arbeit in C++
  • Zur Themenvergabe und für Literaturempfehlungen kontaktieren Sie uns persönlich oder per E-Mail
  • Die Ausarbeitung/Präsentation kann wahlweise in Deutsch oder Englisch verfasst werden

Themen und Zuordnung

Alle Themen orientieren sich an der Architektur unseres Hauptspeicher-Datenbanksystems HyPer (hyper-db.de). Auf der Webseite finden Sie auch entsprechende Literaturreferenzen. Viele Themen werden auch im entsprechenden Kapitel des Lehrbuchs "Datenbanksysteme: Eine Einführung" abgehandelt (dort allerdings in knapperer Form als wir es von Ihrer Ausarbeitung erwarten). Weiterhin empfehlen wir die Nutzung der Bibliographie-Datenbank dblp. Kontaktieren Sie uns rechtzeitig nachdem Sie sich eingelesen/eingearbeitet haben, um den Aufbau Ihrer Arbeit zu besprechen.

Themenliste

  • 22.10.2018: Flajolet-Martin Sketches (Omar Zeidan, slides)
  • 22.10.2018: Index-Based Join Sampling
  • 29.10.2018: Count and Count-Min Sketches
  • 29.10.2018: SIMD-Accelerated Regular Expression Matching (Stefan Lachnit, slides)
  • 05.11.2018: SIMD-Accelerated Hash Tables: Linear Probing and Double Hashing (Jakob Huber, slides)
  • 05.11.2018: SIMD-Accelerated Hash Tables: Cuckoo Hashing (Rafid Ahmed, slides)
  • 12.11.2018: Main Memory Hash Join Algorithms for Multi-Core CPUs (Benjamin Wagner, slides)
  • 12.11.2018: Parallel Array-Based Single- and Multi-Source Breath First Search (Mahrad Zoonemat Kermani, slides)
  • 19.11.2018: SLACID: Sparse Linear Algebra in a Column-Oriented In-Memory Database System (Bernhard Hempfer)
  • 19.11.2018: ArrayStore: A Storage Manager for Complex Parallel Array Processing (Martin Hirschberger, slides)
  • 26.11.2018: Data Blocks: Hybrid OLTP and OLAP on Compressed Storage (Ben Brümmer, slides)
  • 26.11.2018: Database Compression on Graphics Processors (requires NVIDIA GPU, Maximilian Springer, slides)
  • 03.12.2018: MILC: Inverted List Compression in Memory (Yorrick Müller, slides)
  • 03.12.2018: Column Sketches: A Scan Accelerator for Rapid and Robust Predicate Evaluation (Alexander Beischl, slides)
  • 10.12.2018: Column Imprints: A Secondary Index Structure (Katerina Intzevidou, slides)
  • 10.12.2018: Result Set Serialization (Ferdinand List, slides)
  • 17.12.2018 - 04.02.2018: backup slots

Material