Home > News >

SIGMOD 2020 Best Paper Award

BIFOLD-Forschende Erhalten SIGMOD 2020 Best Paper Award

Forschende an Datenbanksystemen an der Technischen Universität Berlin (TU Berlin), dem Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und dem Hasso-Plattner-Institut (HPI) waren in diesem Jahr außerordentlich erfolgreich. Vier ihrer Arbeiten wurden auf der 2020 ACM SIGMOD/PODS International Conference on the Management of Data angenommen. SIGMOD/PODS ist eine der führenden Fachkonferenzen für Forschende, Entwickler und Anwender von Datenbanksystemen.

One of the papers even won the SIGMOD Best Paper Award. The paper entitled “Pump Up the Volume: Processing Large Data on GPUs with Fast Interconnects,” by Clemens Lutz, Sebastian Breß, Steffen Zeuch, Tilmann Rabl, and BIFOLD Co-Director Volker Markl explores the use of GPUs to accelerate database query processing.

Clemens Lutz erhält den SIGMDO 2020 Best Paper Award (© Clemens Lutz)

“Fast interconnects enable us to pump up the data volume, with high performance.”

Clemens Lutz, PhD-Student und Forscher in den Forschungsgruppen IAM (DFKI) und DIMA (TUB)

GPUs sind im Allgemeinen aus zwei Gründen für die Verarbeitung großer Datenmengen ungeeignet: (1) die integrierte Speicherkapazität ist zu klein, um große Datensätze zu speichern, und (2) die Verbindungsbandbreite zum CPU-Hauptspeicher reicht für Ad-hoc-Datenübertragungen nicht aus. Infolgedessen stehen GPU-fähige Systeme vor einem Datentransfer-Engpass und lassen sich nicht auf große Datensätze skalieren. In ihrem Artikel untersuchen die Autoren, wie eine schnelle Verbindung wie NVLink 2.0 (die dedizierte GPUs mit einer CPU verbindet) die beiden Skalierbarkeitsprobleme überwinden kann. Folglich zeigen sie in ihren Experimenten, dass eine Hash-Verbindung ohne Partitionierung eine bis zu 18-fache Beschleunigung gegenüber PCI-e 3.0 und eine bis zu 7,3-fache Beschleunigung gegenüber einer optimierten CPU-Implementierung erreicht.

Weitere Details erläutert Clemens Lutz in einem Blogpost für das E2Data-Projekt sowie in seiner Präsentation während der SIGMOD-Konferenz.

Das Paper im Detail:

Pump Up the Volume: Processing Large Data on GPUs with Fast Interconnects

Authors:
Clemens Lutz, Sebastian Breß, Steffen Zeuch, Tilmann Rabl, and Volker Markl

Abstract:
GPUs have long been discussed as accelerators for database query processing because of their high processing power and memory bandwidth. However, two main challenges limit the utility of GPUs for large-scale data processing: (1) the onboard memory capacity is too small to store large data sets, yet (2) the interconnect bandwidth to CPU main-memory is insufficient for ad-hoc data transfers. As a result, GPU-based systems and algorithms run into a transfer bottleneck and do not scale to large data sets. In practice, CPUs process large-scale data faster than GPUs with current technology. In this paper, we investigate how a fast interconnect can resolve these scalability limitations using the example of NVLink 2.0. NVLink 2.0 is a new interconnect technology that links dedicated GPUs to a CPU. The high bandwidth of NVLink 2.0 enables us to overcome the transfer bottleneck and to efficiently process large data sets stored in main-memory on GPUs. We perform an in-depth analysis of NVLink 2.0 and show how we can scale a no-partitioning hash join beyond the limits of GPU memory. Our evaluation shows speedups of up to 18× over PCI-e 3.0 and up to 7.3× over an optimized CPU implementation. Fast GPU interconnects thus enable GPUs to efficiently accelerate query processing.

Publication:
SIGMOD ’20: Proceedings of the 2020 ACM SIGMOD International Conference on Management of Data. June 2020, Pages 1633–1649
https://doi.org/10.1145/3318464.3389705

Preprint