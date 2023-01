Informationen sind vielfältig, sie existieren nicht nur in geschriebenen Text, sondern auch in Bildern, Tönen, Videos und vielem mehr. Während in klassischer lexikalischer Suche diese Informationen nur mit viel Aufwand über Umwege zugänglich gemacht werden können, bietet semantische Suche den direkten Zugriff auf Informationen nicht nur jeder Sprache, sondern auch jeder Modalität wie Bildern und Videos.

In Folge 40 hat Nico Kreiling Joschka Braun von Jina.AI zu Gast. Jina ist ein Startup aus Berlin, das Entwicklerinnen und Entwicklern beim Erstellen multimodaler ML-Anwendungen hilft. Gemeinsam erkären die beiden zunächst, wieso Multimodalität, also dem Zusammenwirken von unterschiedlichen Medientypen wie Text, Bild und Ton, die Zukunft gehört. Sie gehen auf Clip- und Dall-E als erste populäre Vertreter multimodaler Machine Learning Modelle ein und erklären wie sie Dokumenten-Vektoren generieren.

Anschließend sprechen sie über geeignete Verfahren zur performanten Durchsuchung der generierten Vektoren mittels Approximate Nearest Neighbor (ANN) Search. Sie können entweder direkt mittels Bibliotheken wie etwa HNSWLib, Annoy oder Faiss genutzt werden oder als Retrieval-Verfahren innerhalb einer Vektordatenbank. Sie verbinden die Transaktions- und Skalierungsqualtiäten von Datenbanken mit der effizienten Vektorabfrage. Hier reden Joschka und Nico insbesondere über die Vorzüge und Nachteile der dedizierten Vektordatenbanken wie Weaviate, Milvus und Qdrant sowie den klassischen Datenbanken mit Vektorsuche wie beispielsweise ElasticSearch.

Zum Abschluss sprechen sie noch einmal über Jina.AI, DocArray, ihren neuen Dienst JinaNow und NLP-Modell-Finetuning.

Empfohlener redaktioneller Inhalt Mit Ihrer Zustimmmung wird hier ein externer Inhalt geladen. Externen Inhalt jetzt laden

Zusätzliche Links:

(rme)