Microsoft SQL Server 2019 integriert Hadoop und Spark

Die relationale Datenbank enthält in ihrer nächsten Ausgabe eine tiefergehende Unterstützung für die Verarbeitung sehr großer Datenmengen.

 –  5 Kommentare
Microsoft SQL Server 2019 integriert Hadoop und Spark

Auf der eigenen Veranstaltung Ignite hat Microsoft eine erste Public Review des SQL Server 2019 vorgestellt. Damit ist klar, dass der Konzern keinen SQL Server 2018 auf den Markt bringen und damit eine Jahresangabe überspringen wird. Zuletzt hatte es Ausgaben mit den Jahreszahlen 2016 und 2017 gegeben.

Die wichtigsten Neuerungen geschahen offenbar vor dem Hintergrund, dass nur sehr wenige Unternehmen auf nur ein Datenbankprodukt setzen. So hat Microsoft der nächsten Ausgabe seiner relationalen Datenbank etliche neue Konnektoren spendiert, mit denen Anwender den SQL Server zur Abfrage anderer Datenbanken wie Oracle, Teradata und MongoDB oder generische ODBC-Datenquellen und andere SQL-Server-Instanzen nutzen können.

Damit nicht genug wird in SQL Server 2019 das Big-Data-Framework Apache Spark und das Hadoop Distributed File System (HDFS) integrieren. Daran ist abzulesen, dass die Wichtigkeit des Umgangs mit Big-Data-Workloads für die Datenbank zugenommen hat. Die Einbindung von Spark und Hadoop ist da naheliegend, sind beide doch die vermutlich wichtigsten Frameworks im Umfeld von Big Data. Ein Artikel auf ZDnet beschreibt das Szenario wie folgt: Die Nodes können als SQL-Rechenknoten und -Speicherknoten oder HDFS-Datenknoten ausgeführt werden. Im Fall von HDFS werden SQL Server und Apache Spark gemeinsam im selben Container ausgeführt. Die Interoperabilität ermöglicht die Container-Orchestrierungssoftware Kubernetes, und die Kubernetes-Kompatibilität von SQL Server 2019 gewährt wiederum das Ausführen der Workloads in lokalen Umgebungen oder über die verschiedenen Public Clouds hinweg.

Überarbeitet hat Microsoft außerdem die Speicher-Engine und die PolyBase-Technik. Letztere kann Anfragen auf in Hadoop oder Azure Blob Storage hinterlegte Daten ausführen. Die Unterstützung für Azure-Speicher sowie sowohl Cloudera- als auch Hortonworks-Hadoop-Cluster ist ebenfalls ausgebaut worden.

Der SQL Server 2019 bringt außerdem erweiterte Funktionen für die in SQL Server 2017 eingeführte SQL-Graph-Architektur mit. Nun wird zusätzlich die direkte Ausführung von Java-Code unterstützt, wobei dieselbe Infrastruktur zum Einsatz kommt, die R- und Python-Code in der Datenbank ausführen kann und die Machine-Learning-Services des Produkts unterstützt, die jetzt selbst auf SQL-Server-Linux-Instanzen so laufen, wie man das bei den Windows-Instanzen kennt.

Dann wurde die Azure SQL Database Managed Instance als fertiges Produkt angekündigt. Sie bietet nahezu vollständige Kompatibilität mit dem lokalen SQL Server, die Serverinstanzen werden jedoch von Microsoft verwaltet. Microsoft hat darüber hinaus einen neuen Service, Azure SQL Database Hyperscale, als Public Preview vorgestellt, der die Arbeit mit großen Datenmengen (bis zu 100 Terabyte) erleichtern soll.

Eine letzte SQL-Server-News ist die Umbenennung von SQL Operations Studio in Azure Data Studio. Im Zuge des neuen Namens will Microsoft das plattformübergreifende Frontend-Tool für SQL Server modularer gestalten, sodass es mit anderen Datenquellen als SQL Server arbeiten kann. (ane)