Menü
Developer

DataWorks Summit Europe 2019: Enterprise Data Cloud als Vision

Die Cloudera Data Platform verspricht "API first", Service-Orientierung und hohe Rechenleistung bei ruhenden und bewegten Daten in der Cloud.

vorlesen Drucken Kommentare lesen 1 Beitrag

(Bild: Cloudera)

Inhaltsverzeichnis

"In etwa sechs Monaten soll die gemeinsame Plattform von Hortonworks und Cloudera zur Nutzung in der Public Cloud zur Verfügung stehen", verkündete Wolfgang Huber, Clouderas Senior Regional Sales Director in Central Europe, auf dem DataWorks Summit Europe 2019 in Barcelona. Zunächst werde die Cloudera Data Platform (CDP) auf Amazon Web Services und Microsoft Azure bereitstehen, etwas später folgen Google Cloud Platform (GCP) und die IBM Cloud. "Wir unterstützen die IBM Cloud vor allem, weil Hortonworks und IBM eine enge Partnerschaft verbindet", ergänzt Huber. Erst in der zweiten Jahreshälfte sollen Kunden CDP auch On Premises in einer Private Cloud nutzen können. Dazu soll es ein bis zwei Updates pro Monat geben.

Nach der zum Jahresauftakt besiegelten Fusion führt die neue Cloudera Data Platform CDP die Cloudera Distribution of Hadoop (CDH) und die Hortonworks Data Platform HDP zusammen. CDP besteht aus 32 Komponenten, darunter die Data Science Workbench, Cloudera Data Warehouse und Cloudera DataFlow. Die CDP schließt Analysefunktionen wie DataFlow ebenso ein wie Data Engineering, Data Warehouse, Operational Database und Machine Learning. Sie bietet zudem eine gemeinsame Ebene für Identität, Orchestrierung, Management und Betrieb.

Roadmap für die Zusammenführung der Produktplattformen von Cloudera und Hortonworks

(Bild: Cloudera)

Als Grund für den offenbar bereits seit dreieinhalb Jahren diskutierten Merger nennt Huber, dass "Cloudera und Hortonworks über eine Codebasis verfügen, die zu 70 Prozent identisch ist. Daher passen sie bestens zusammen und ergänzen einander mit dem Rest." Die Kunden hätten häufig nach einer Ergänzung aus der jeweils anderen Distribution gefragt. Clouderas Alleinstellungsmerkmal in seiner CDH liegt auf dem Gebiet KI, nämlich in Form der Data Science Workbench (DSW). Sie unterstütze als Portal einerseits die klassische IT, die einen Hadoop Data Lake nutzt, andererseits auch Developer und deren Kollaboration. Hortonworks habe 2018 seine Governance- und Admin-Fähigkeiten verstärkt, aber auch die Nutzung von IoT und Edge Computing ausgebaut.

Auch auf der Business-Seite sei die Bilanz positiv: "Beide Firmen", fährt Huber fort, "haben die gleiche Zielklientel, sodass der Merger eine Verdopplung der Kundenbasis und der Vertriebskapazität darstellt." Daher bedeutete der 3. Januar 2019, als die Fusion in Kraft trat, den Startschuss für Up- und Cross-Selling im gemeinsamen Vertrieb. Cloudera hat weltweit über 2000 Enterprise-Kunden. Mit dieser Klientel wolle das neue Unternehmen weiterwachsen und neue Kunden hinzugewinnen. An den bestehenden Verträgen soll sich zumindest vorerst nichts ändern.

Für Hadoop-Entwickler könnte dies eine erhebliche Ausweitung ihres Marktes bedeuten. Denn der steht laut einer Gartner-Studie erst am Anfang einer Reifung der Hadoop-basierten Analytik. "Mehr als 87 Prozent der Unternehmen verfügen laut Gartner noch nicht über Data Maturity", sagt Huber. Zwar sammelten die Unternehmen große Datenmengen in Data Lakes, benötigten aber Modelle, um diese mit den Daten zu trainieren – beispielsweise um damit autonomes Fahren realisieren zu können. Die nötige Datensicherheit soll dabei ein von Cloudera kommendes Security Framework namens Shared Data Experience (SDX) gewährleisten.

Da beide Firmen Open-Source-Software nutzen, spielt die Open-Source-Entwicklergemeinde eine große Rolle, erläuterte Huber. Die Distributionen mit ihren zahlreichen Komponenten verfügen über entsprechende APIs, über die sich die Community einbringen kann. "Für uns gilt: API first. Cloudera wird für viele Partner entsprechende Konnektoren zur Verfügung stellen", sagte Vikram Makhija, Vice President und General Manager Cloud bei Cloudera. "Wir unterstützen Agile Development mit einer API zu jeder CI/CD-Toolchain." Tatsächlich können Entwickler CDP-Komponenten wie Cloudera DataFlow per API in ihre Umgebungen integrieren.