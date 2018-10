Im Rahmen der GPU Technology Conference in München hat der Grafikkartenhersteller Nvidia die quelloffene Plattform Rapids vorgestellt. Sie richtet sich primär an Nutzer in den Bereichen Datenwissenschaft und Machine Learning und stellt eine Sammlung von Bibliotheken dar, die eine GPU-beschleunigte Datenanalyse ermöglichen sollen. Neben Nvidia haben auch Firmen wie IBM, HPE, Oracle und Databricks die Unterstützung des Projekts bekanntgegeben.

Der Grafikkartenhersteller erläutert, dass Rapids auf Cuda aufbaut, der hauseigenen Plattform für parallele Programmierung. Die neue Plattform soll Entwicklern das Erstellen von Ende-zu-Ende-Pipelines für die Datenanalyse ermöglichen. Im Vergleich zu Systemen, die nur auf CPUs setzen, hat Nvidia auf dem Supercomputer DGX-2 bis zu 50-mal schnellere Ergebnisse erzielt. Die Plattform baut auf bekannten Open-Source-Projekten wie Apache Arrow, pandas und scikit-learn auf, und soll somit GPU-Beschleunigung in beliebte Python-Toolchains bringen. Eine Integration mit Apache Spark ist ebenfalls vorgesehen.

NVIDIA arbeitete seit zwei Jahren mit Mitgliedern der Python-Community zusammen, um Rapids auf die Beine zu stellen. Zurzeit setzt sich die Sammlung aus einer Python-GPU-DataFrame-Bibliothek, einer C-GPU-DataFrame-Bibliothek und Alpha-Versionen einer cuML- und cuDF-Bibliothek zusammen. Das Gesamtpaket soll laut NVIDIA-Gründer Jensen Huang die Arbeiten in den Bereichen Datenanalyse und Machine Learning vorantreiben.

Das gesamte Rapids-Projekt findet sich auf GitHub. Weiterführende Informationen inklusive einer Installationsanleitung bietet die offizielle Website. Bei Unternehmen wie Walmart ist die neue Plattform bereits im Einsatz. (bbo)