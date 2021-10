Softwareanbieter Databricks gibt die Übernahme des deutschen Startups 8080 Labs bekannt. Dessen als GUI angelegtes Datenanalysetool Bamboolib soll künftig integraler Bestandteil der Lakehouse-Architektur werden, mit der Databricks die individuellen Vorteile von Data Lakes und Data Warehouses auf einer zentralen Plattform vereinen will. Databricks steckt hinter den von der Linux Foundation verwalteten Data-Science- und ML-Projekten Apache Spark, Delta Lake und MLflow,

Data Science und ML für jedermann

Während der von Analysten erwartete Börsengang des üppig mit Kapital ausgestatteten Unternehmens im laufenden Jahr weiterhin aussteht, setzt Databricks seine Akquisitionsstrategie konsequent fort. Die Übernahme von 8080 Labs knüpfte nahtlos an den Zukauf von Redash im Sommer 2020 an, betont Ali Ghodsi, der CEO und Mitbegründer von Databricks. In beiden Fällen gehe es primär darum, den Einsatz der Lakehouse-Architektur zu vereinfachen und die Data-Science-Möglichkeiten einem breiteren Anwenderkreis zugänglich zu machen.

Mit der Bamboolib hat 8080 Labs eine erweiterbare grafische Schnittstelle für Pandas entwickelt, die typische Data-Science- und Machine-Learning-Aufgaben wie die Aufbereitung, Transformation, Visualisierung und Exploration von Daten auch ohne tiefgreifende Programmierkenntnisse ermöglicht. Stattdessen greift Bamboolib die von der Makroerstellung in Tabellenkalkulationen wie Excel vertraute Arbeitsweise auf. Als GUI für Pandas DataFrames exportiert die Library produktionsreifen Pythoncode, der sich in Jupyter Notebooks oder Jupyter Lab für die interaktive Datenauswertung nutzen lässt. Während Pandas und Bamboolib bisher nur für den Single-Maschine-Einsatz ausgelegt sind, will Databricks über das Koala-Projekt auch die direkte Anbindung an größere Spark-Cluster implementieren, um die vereinfachte Datenanalyse auch in verteilten Umgebungen zu ermöglichen.

Lesen Sie auch data2day 2021: Von den Daten zum datengetriebenen Unternehmen

Citizen Data Scientists im Blick

In die Lakehouse-Plattform eingebunden soll die No-Code-Funktionalität der Bamboolib künftig für die verschiedensten Einsatzbereiche dienen, von Visualisierungs- und Dashboard-Services bis hin zu Databricks AutoML, mit dem sich schon heute viele der bisher von Data Scientists manuell zu erledigenden Schritte bei der ML-Modell-Entwicklung und dem Training weitgehend automatisieren lassen. Neben ausgewiesenen Datenexpertinnen und -experten wollen Databricks und 8080 Labs sämtliche Data Teams in Unternehmen – einschließlich der sogenannten Citizen Data Scientists – in die Lage versetzen, auch komplexe Datenanalysen und ML-Aufgaben selbständig durchzuführen.

Das Ende der Community-Edition?

Im Zuge der Akquisition wechselt auch das Team von 8080 Labs rund um Mitgründer Tobias Krabel und Florian Wetschoreck zu Databricks. Weitere Informationen zur Übernahme finden sich in der offiziellen Mitteilung. Zu den finanziellen Details der Transaktion äußern sich beide Seiten öffentlich nicht. 8080 Labs weist allerdings darauf hin, dass die bisherige Community-Edition der Bamboolib voraussichtlich nur noch bis Anfang 2022 kostenlos – und ohne weiteren Support – verfügbar bleiben wird. Wie Clemens Mewald, Director of Product Management bei Databricks, im Gespräch mit heise Developer jedoch versichert, wird künftig die gesamte Funktionalität in der Community-Edition der Databricks-Plattform zur Verfügung stehen, sobald die Integration abgeschlossen ist.

(map)