Seminar: Implementierungtechniken für Hauptspeicherdatenbanksysteme
Informationen
Inhalt
In diesem Seminar behandeln wir Implementierungstechniken für Hauptspeicherdatenbanksysteme und verwandte Themen.
Vorraussetzungen
- Grundlagen Datenbanken, GDB oder ähnliche Kurse
- sehr gute Kenntnisse in Datenbanken, gute Programmierfähigkeiten in C++
Termine
- wöchentliches Treffen: Montags, 16:00 - 18:00, Raum MI 02.09.014
- erstes Treffen: 22.10.2018
Organisation
- Auftakttreffen für das Seminar: Donnerstag, 28.06.2018, 12:00 - 14:00, Raum MI 02.11.018
- Neben einer kurzen Ausarbeitung (max. 5 Seiten) und der Präsentation erwarten wir eine Beispielimplementierung des wichtigsten Aspekts Ihrer Arbeit in C++
- Zur Themenvergabe und für Literaturempfehlungen kontaktieren Sie uns persönlich oder per E-Mail
- Die Ausarbeitung/Präsentation kann wahlweise in Deutsch oder Englisch verfasst werden
Themen und Zuordnung
Alle Themen orientieren sich an der Architektur unseres Hauptspeicher-Datenbanksystems HyPer (hyper-db.de). Auf der Webseite finden Sie auch entsprechende Literaturreferenzen. Viele Themen werden auch im entsprechenden Kapitel des Lehrbuchs "Datenbanksysteme: Eine Einführung" abgehandelt (dort allerdings in knapperer Form als wir es von Ihrer Ausarbeitung erwarten). Weiterhin empfehlen wir die Nutzung der Bibliographie-Datenbank dblp. Kontaktieren Sie uns rechtzeitig nachdem Sie sich eingelesen/eingearbeitet haben, um den Aufbau Ihrer Arbeit zu besprechen.
Themenliste
- 22.10.2018: Flajolet-Martin Sketches (Omar Zeidan, slides)
22.10.2018: Index-Based Join Sampling29.10.2018: Count and Count-Min Sketches- 29.10.2018: SIMD-Accelerated Regular Expression Matching (Stefan Lachnit, slides)
- 05.11.2018: SIMD-Accelerated Hash Tables: Linear Probing and Double Hashing (Jakob Huber, slides)
- 05.11.2018: SIMD-Accelerated Hash Tables: Cuckoo Hashing (Rafid Ahmed, slides)
- 12.11.2018: Main Memory Hash Join Algorithms for Multi-Core CPUs (Benjamin Wagner, slides)
- 12.11.2018: Parallel Array-Based Single- and Multi-Source Breath First Search (Mahrad Zoonemat Kermani, slides)
19.11.2018: SLACID: Sparse Linear Algebra in a Column-Oriented In-Memory Database System (Bernhard Hempfer)- 19.11.2018: ArrayStore: A Storage Manager for Complex Parallel Array Processing (Martin Hirschberger, slides)
- 26.11.2018: Data Blocks: Hybrid OLTP and OLAP on Compressed Storage (Ben Brümmer, slides)
- 26.11.2018: Database Compression on Graphics Processors (requires NVIDIA GPU, Maximilian Springer, slides)
- 03.12.2018: MILC: Inverted List Compression in Memory (Yorrick Müller, slides)
- 03.12.2018: Column Sketches: A Scan Accelerator for Rapid and Robust Predicate Evaluation (Alexander Beischl, slides)
- 10.12.2018: Column Imprints: A Secondary Index Structure (Katerina Intzevidou, slides)
- 10.12.2018: Result Set Serialization (Ferdinand List, slides)
17.12.2018 - 04.02.2018: backup slots
Material
- Introduction to Modern C++: link
- LaTeX Template for Thesis (suggestion, based on the official ACM template): link
- Slides of the organisational meeting: link
- Gitlab of our Chair: link