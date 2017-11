Knapp zwei Jahre nach der Übergabe des Projekts von Cloudera an die Apache Foundation hat die Open-Source-Organisation nun die interaktive SQL-Abfrage-Engine zum offiziellen Apache-Projekt erklärt.

Die Apache Foundation hat in ihrem Blog erklärt, dass Impala nun ein offizielles Top-Level-Projekt ist. Cloudera hatte die native analytische Datenbank für Hadoop Ende 2015 zusammen mit Kudu an die Foundation übergeben. Beide Projekte sind nach afrikanischen Antilopengattungen benannt, was durchaus als Anspielung auf die Flexibilität in der Welt der eher schwerfälligen Hadoop-Elefanten zu verstehen ist.

Impala bietet eine parallel Query-Engine für analytische Abfragen Abfragen von Daten, die entweder im lokalen Rechenzentrum in HDFS (Hadoop Distributed File System) beziehungsweise Kudu oder in der Cloud gespeichert sind. Damit soll das System Business-Intelligence-Funktionen ermöglichen, ohne dass Data Scientists die Daten zuvor in spezielle Formate überführen müssen. Die Abfrageschnittstelle setzt dabei herkömmliches SQL.

Cloudera hat sich bei Impala von Googles F1-Datenbank inspirieren lassen, die ebenfalls die Verarbeitung der Abfragen vom Storage-Management trennt. Die Entwicklung begann 2011, und 2013 erschien das erste GA-Release. Impala ist unter anderem Bestandteil der Big-Data-Plattformen von Cloudera, MapR und Oracle. (rme)