Datenanalyse: Elastic 8.5 mit neuen Konnektoren und konfigurierbaren Pipelines

Die vorgestellte Version 8.5 des Datenanalyse-Werkzeugs beinhaltet neue native Konnektoren sowie konfigurierbare Pipelines für maschinelles Lernen (ML).

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 1 Beitrag

(Bild: whiteMocca/Shutterstock.com)

Von
  • Frank-Michael Schlede

In der neuen Version 8.5 von Elastic Enterprise Search sollen nun konfigurierbare Pipelines für maschinelles Lernen (ML) und Ingestion den Anwendern und Anwenderinnen dabei helfen, ihre Dokumente mit natürlicher Sprachverarbeitung (NLP) anzureichern. Sie sollen dazu in der Lage sein, schneller und einfacher Aufgaben wie beispielsweise die Identifizierung der Benutzerstimmung in Supportanfragen oder die Verwendung von Named Entity Recognition (NER) zur Abfragezeit erstellen und verwalten zu können. Eine weitere Neuerung stellen die nativen Konnektoren von Elastic für Enterprise Search dar, die es Entwicklern und Entwicklerinnen, die MongoDB und MySQL verwenden, erleichtern sollen, die volle Leistung des Elastic Stack zu nutzen.

Nachdem Elasticsearch bereits Anfang des Jahres mit einer neuen Vektorsuchfunktion aufwarten konnte – die mit dieser Version nun allgemein verfügbar ist – kündigt das Entwicklerteam in einem Blog-Beitrag Pipeline-Management-Tools für suchoptimierte Indizes an.

Sie sollen eine tiefgreifende Anpassung und ML-gestützte Anreicherung der eingehenden Daten ermöglichen. Dazu gehört unter anderem die Anwendung von Machine-Learning-Modellen zur Aufnahmezeit, wodurch beispielsweise Sentiment-Analyse, NLP, NER, Spracherkennung und weitere Methoden möglich werden. Laut Aussagen der Entwickler und Entwicklerinnen bei Elastic sollen die Pipeline-Management-Tools für suchoptimierte Indizes eine bessere Anpassung und ML-gestützte Anreicherung der eingehenden Daten ermöglichen.

So generiert etwa die standardmäßig aktivierte Inhaltsextraktion Dokumente aus gängigen Dateiformaten wie PDFs und Microsoft Word. Anwenderinnen und Anwender können sowohl bei der Vorbereitung von Daten für weitere Analysen als auch bei der Bereinigung der Ausgabe eines ML-Modells Leerraum reduzieren. Zudem können sie benutzerdefinierte Ingest-Pipelines erstellen, um die eingehenden Daten ihren Anforderungen entsprechend zu erweitern oder in Ihre bestehenden ETL-Workflows einzubinden.

Als Technical Preview veröffentlicht Elastic mit dieser Version 8.5 native Konnektoren für suchoptimierte Indizes von MongoDB und MySQL. Damit sollen Benutzer und Benutzerinnen ihre operativen Datenbanken schnell auf Elasticsearch auslagern und die darin enthaltenen Daten unter Elastic Stack und Elastic Cloud nutzen können.

Noch als "Technical Preview" in der Version 8.5 von Elasticsearch enthalten: Native Konnektoren für MongoDB und MySQL

(Bild: Elasticsearch)

Bereits in der Version 8.4 veröffentlichte Elastic das Enterprise Search Connector Framework mit Unterstützung für Ruby. Dieses Framework ermöglicht es Entwicklerinnen und Entwicklern, Connector-Clients zu erstellen, mit denen sie Schnittstellen zu Inhalten in Datenquellen schaffen können, die aktuell nicht von Enterprise Search bereitgestellt werden. Für die Version 8.5 hat das Entwicklerteam nun ein zweites Connector-Framework-Repository mit Unterstützung für Python-Benutzer angekündigt. Auch dieses Framework, steht als technische Vorschau bereit, um die bestehende Bibliothek von Ruby-Konnektoren, wie MongoDB, oder Python-Konnektoren, wie MySQL, entsprechend anzupassen. Entwickler und Entwicklerinnen können dabei auch Ihre eigenen Konnektoren in der Sprache Ihrer Wahl erstellen.

Im Blog auf der Webseite von Elasticsearch finden Interessierte detaillierte Informationen über Neuerungen und Verbesserungen für Elastic Stack und Elastic Cloud in Elastic 8.5.

(fms)