Data Science: Lucidworks Fusion 5.1 bindet Apache Pulsar ein

Die Data-Discovery-Plattform bietet erweiterten Support für Streaming Data und ein neues SDK für Index Stages.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Data Science: Lucidworks Fusion 5.1 bindet Apache Pulsar ein

(Bild: Blackboard/Shutterstock.com)

Von
  • Matthias Parbel

Lucidworks hat Version 5.1 seiner Data-Discovery-Plattform Fusion vorgestellt. Mit dem Update liefert der Anbieter einige neue Funktionen etwa für den Umgang mit Streaming Data und Verbesserungen bei der Abstimmung von Datenmodellen mit den auf sie zugeschnittenen Suchanwendungen. Aufbauend auf dem in Fusion 5.0 eingeführten nativen Support für Python stehen Data Scientists damit nicht nur gängige Frameworks wie TensorFlow und Scikit-learn zur Verfügung, sondern mit dem neuen Fusion-Release reicht Lucidworks auch die Integration von Jupyter Notebooks nach.

Dank der Einbindung von Apache Pulsar eröffnet sich Fusion-Anwendern die Möglichkeit, native Streaming-Transformationen über die Pulsar Functions zu nutzen. Fusion legt dazu einen Pulsar-Namespace für jede erstellte App an. Als Message-Bus stellt Pulsar dabei sowohl Queuing- wie auch Publish-Subscribe-Funktionen für die Nachrichtenübermittlung zwischen Servern zur Verfügung. Für das Konfigurationsmanagement können Fusion-Nutzer auf Apache ZooKeeper zurückgreifen, das der Data-Discovery-Plattform als Komponente in Version 3.5.6 beiliegt. Dauerhafte Speicherressourcen etwa für den Backlog, der Nachrichten zu aktiven Subscriptions für potenzielle Consumer parat hält, steuert Apache BookKeeper bei. Nähere Informationen dazu finden sich im passenden Abschnitt der Fusion-Dokumentation.

Zu den weiteren nennenswerten Neuerungen in Fusion 5.1 zählen neue V2-Konnektoren für Couchbase und SharePoint sowie der Active Directory Connector for ACLs. Darüber hinaus steht Fusion-Anwendern nun ein Index Stage SDK parat, da sich aus dem öffentlichen GitHub-Repository klonen lässt. Es enthält Lucidworks zufolge sämtliche Ressourcen, die zum Entwickeln benutzerdefinierter Index Stages mit Java erforderlich sind.

Mehr Informationen zum neuesten Release fasst der Blogbeitrag von Lucidworks zusammen, eine komplette Übersicht aller Verbesserungen und neuen Funktionen findet sich in den Release Notes. Anwender, die von Version 5.0 updaten wollen, sollten einen Blick in die spezifischen Upgrade-Hinweise werfen.

Lucidworks stellt seine Fusion-Plattform in den drei Versionen Standard, Advanced und Enterprise wahlweise als selbstgehosteten Dienst oder Managed Service parat. Das Preismodell ist nutzungsabhängig. (map)