Claude 2 ist die neue Version des Sprachmodells von Anthropic und damit direkter Konkurrent von ChatGPT und Googles Bard. Laut den Machern ist Claude 2 besser in Mathemathik, im Coden und im Reasoning, damit sind die Denkfähigkeiten gemeint. Auch eine bessere Konversationsfähigkeit und klarer verständliche Argumentationen sowie ein größeres Gedächtnis kommen mit der neuen Version. Wobei auch die erste Version von Claude bei allen Benchmarks schon gut abschnitt.

Zunächst gibt es nur eine Beta-Webseite, um Claude 2 als Chatbot zu testen. Sie steht auch nur in den USA und Großbritannien zur Verfügung, weitere Länder sollen folgen. Man muss sich per E-Mail registrieren und erhält einen zeitlich begrenzten Zugangscode. Die API ist ebenfalls bereits verfügbar, sie kostet das gleiche, wie die bisher verfügbare Version 1.3.

Besseres Abschneiden in Tests

"Im Vergleich zu College-Studenten, die sich für die höhere Schule bewerben, punktet Claude 2 über der 90. Perzentile bei den Lese- und Schreibprüfungen", schreibt Anthropic im Blogbeitrag. Perzentile ist ein Durchschnittswert. Vor allem kann Claude 2 mehr Informationen verarbeiten. Nutzerinnen und Nutzer können bis zu 100.000 Token mit einem Prompt eingeben – das entspricht laut Blogbeitrag "hunderte Seiten einer technischen Dokumentation oder einem Buch", englischsprachig dürften es etwa 75.000 Wörter sein. Und auch der Output vergrößert sich auf "einige tausend Tokens".

In einem Python-Coding-Test erreichte die neue Version von Claude 71,2 Prozent im Vergleich zu zuvor 56 Prozent. Auch in Mathe konnte Claude 2 sich verbessern. Anthropic hat auch die Sicherheit des Sprachmodells erhöht. Nach eigener Aussage ist es nun deutlich schwieriger aus Claude 2 gefährliche Antworten zu bekommen. Man sei vor Jailbreaks nicht gefeit, habe aber auch hier Mechanismen eingebaut. Anthropic wurde von ehemaligen Mitarbeitern von OpenAI gegründet.

Auf die Frage, was gestern in Hannover passiert ist, bittet Claude 2 um eine Spezifikation der Frage, weil sehr viel in einer Hauptstadt passiert. Anders handhaben das Googles Bard und Microsoft Bing. Bei Tests haben diese beiden Chatbots zuletzt mehrere Ereignisse auf die Tage geschoben, die teilweise aber deutlich länger her waren oder sogar gar nicht in Hannover stattfanden.

Antwort von Claude 2

Antwort von Bard

Antwort von Bing

(emw)