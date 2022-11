Das von ehemaligen Google-Mitarbeitern 2021 gegründete KI-Start-up Cohere hat sich zum Ziel gesetzt, NLP-Anwendungen zum festen Bestandteil der Entwicklerwerkzeuge zu machen. KI-gestütztes Sprachverständnis für das Erzeugen, Kategorisieren und Organisieren von Text mittels großer Sprachmodelle (LLM) soll nun das jüngste Projekt des Unternehmens Entwicklern und ihren Builds erschließen: Cohere Sandbox.

Sammlung quelloffener GitHub-Repos in der Sandbox

Die Sandbox ist eine Sammlung experimenteller, quelloffener GitHub-Repositories, die das Erstellen von Anwendungen mit großen Sprachmodellen auf der Cohere-Plattform ermöglichen. Machine-Learning-Erfahrung ist offenbar keine Voraussetzung, um die Sandbox als Entwickler zu nutzen und zu dem Experiment beizutragen, geht aus der Ankündigung im Cohere-Blog hervor. Das Bauen und Deployen von Anwendungen, das Forken und Abwandeln großer Sprachmodelle sowie das Testen verschiedener Lösungen für die eigenen Use Cases stehen hierbei offen.

Von Konversation über Chatbos zu semantischer Suche

In der Sandbox veröffentlicht das Cohere-Team ab sofort experimentelle und sehr frühe ("Earlybird") Versionen von quelloffenen Sprach-KI-Modulen, -Bibliotheken und Demos. Der neue Bereich soll es Interessierten ermöglichen, schneller als bisher eigene Anwendungen und Dienste zu entwickeln. Da die in der Sandbox veröffentlichten Inhalte Open Source sind, lassen sie sich forken und weiterbearbeiten. Cohere hat damit auch eine stärkere Vernetzung der Sprach-KI-Community im Sinn, lässt sich dem Blogeintrag entnehmen. Die Beitragsrichtlinien sind in der README-Datei des jeweiligen Repository zu finden.

Zum Auftakt bietet Cohere Sandbox fünf Themenbereiche von Konversation über funktionale Chatbots und Q&A-Tools bis hin zu Topic-Modeling und semantischer Suche: das Framework Conversant zum Erstellen von Konversationsagenten über die Cohere-API, Route Generation zum Erstellen von Chatbots, die die Nutzerabsichten erkennen und eintreffende Nachrichten kartieren, Grounded QA mit einem Fragen beantwortenden Discord-Bot, der Embeddings, Texterzeugung und Internetsuche kombiniert, Topically als Tool-Suite für bestimmte Textsammlungen wie Nachrichten, E-Mails, Nachrichten-Überschriften und Toy Semantic Search als semantische Suchmaschine auf der Cohere-API.

Weiterführende Links

Die Zielgruppe sind offenbar Entwicklerinnen und Entwickler sowie Unternehmen, die sich für LLM-Funktionen in ihren Produkten interessieren, aber noch keinen direkten Zugang zu einem großen Sprachmodell (wie GPT-3) haben.

Das Projekt Cohere Sandbox ist auf GitHub verfügbar. Mehr dazu lässt sich dem Blogeintrag auf der Cohere-Website entnehmen. Die deutsche Ausgabe der MIT Technology Review hatte im Vorjahr zu Hintergründen der Unternehmensgründung und wirkmächtiger Sprach-KI-Modelle berichtet.

(sih)