Claude Opus 4.8 übertrifft GPT-5.5 in den neuesten KI-Benchmark-Tests

Inhaltsverzeichnis Anthropic hat Claude Opus 4.8 vorgestellt, das bislang fortschrittlichste KI-System des Unternehmens, das jetzt weltweit verfügbar ist. Diese Version baut auf Opus 4.7 auf und bietet bemerkenswerte Verbesserungen bei der Codegenerierung, dem logischen Denken und der Wahrhaftigkeit. Wir stellen vor: Claude Opus 4.8: Es baut auf Opus 4.7 auf und bietet ein schärferes Urteilsvermögen, mehr Ehrlichkeit hinsichtlich des eigenen Fortschritts und die Fähigkeit, länger unabhängig zu arbeiten als seine Vorgänger. Heute zum gleichen Preis erhältlich. pic.twitter.com/EufxL7T1kb – Claude (@claudeai) 28. Mai 2026 Von Anthropic durchgeführte Benchmark-Bewertungen zeigen, dass Opus 4.8 im Vergleich zu OpenAIs GPT-5.5 und Googles Gemini 3.1 Pro in mehreren Testkategorien überlegene Ergebnisse liefert. Das Modell zeichnet sich insbesondere durch autonome Codierungsaufgaben, Finanzdatenanalysen und Computerinteraktionsszenarien aus. Autonome KI beschreibt eine Technologie, die in der Lage ist, komplexe Vorgänge mit minimaler menschlicher Aufsicht auszuführen. Diese Funktion wird immer wichtiger, da Unternehmen KI-gestützte Agenten in ihre Arbeitsabläufe integrieren. Zu den bemerkenswertesten Funktionen gehört die Einführung von Steuerelementen zur Aufwandsanpassung, die jetzt über Claude.ai und Claude Cowork verfügbar sind. Mit dieser Funktionalität können Benutzer die Rechenressourcen regulieren, die bestimmten Anforderungen zugewiesen werden. Bei der Bearbeitung einfacher Abfragen können Benutzer die Verarbeitungsintensität reduzieren, um sowohl Zeit als auch Recheneinheiten zu sparen. Umgekehrt können anspruchsvolle Projekte eine höhere Rechenleistung für eine gründlichere Analyse erhalten. Recheneinheiten dienen als Messstandard, den KI-Dienste zur Quantifizierung von Input und Output verwenden. Jede Interaktion mit einem KI-System verbraucht diese Einheiten, unabhängig von der Komplexität – von einfachen Fragen bis hin zu anspruchsvollen Programmieranfragen. Eine geringere Verarbeitungsintensität führt zu einem geringeren Einheitenverbrauch und damit möglicherweise zu geringeren Kosten für Unternehmen mit hohem Nutzungsvolumen. Was die Zuverlässigkeitsverbesserungen betrifft, zeigt Opus 4.8 im Vergleich zu Opus 4.7 eine 400-prozentige Verbesserung bei der Identifizierung von Codierungsfehlern. Dies stellt eine wesentliche Verbesserung für Softwareentwickler dar, die das Modell in Live-Produktionssystemen bereitstellen. Gleichzeitig stellt das Unternehmen eine experimentelle Version dynamischer Workflows innerhalb von Claude Code vor. Diese Fähigkeit ermöglicht die Koordination Hunderter gleichzeitiger Unterprozesse zur Verwaltung umfangreicher Code-Migrationsprojekte. Zudem wurde das System für mehr Transparenz verfeinert. Laut Anthropic wird das Modell Einschränkungen in seiner Analyse anerkennen und auf die Darstellung unbegründeter Informationen verzichten. Der Betrieb im Schnellbetrieb ist deutlich wirtschaftlicher geworden. Die Betriebskosten sind um 66 % gesunken, während der veröffentlichte Satz von 10 US-Dollar pro Million Input-Tokens und 50 US-Dollar pro Million Output-Tokens für Endbenutzer beibehalten wurde. Die Standardpreise bleiben konstant bei 5 US-Dollar pro Million Input-Tokens und 25 US-Dollar pro Million Output-Tokens. Die Einführung von Opus 4.8 fällt mit Berichten zusammen, dass Anthropic eine Pre-IPO-Finanzierungsrunde über 30 Milliarden US-Dollar abschließt. Diese Investition könnte zu einer Unternehmensbewertung von über 900 Milliarden US-Dollar führen. Während Anthropic keine offiziellen Pläne für einen Börsengang bekannt gegeben hat, deuten Branchenquellen auf ein mögliches Börsendebüt im Jahr 2026 hin. Dieser Zeitplan steht im Einklang mit vergleichbaren Vorbereitungen, die bei OpenAI und SpaceX laufen, die beide über öffentliche Angebote nachdenken. Anthropic wurde von ehemaligen OpenAI-Teammitgliedern gegründet und hat sich zu einem wichtigen Akteur im Bereich der künstlichen Intelligenz entwickelt. Entdecken Sie mit Expertenanalysen Aktien mit der besten Performance in den Bereichen KI, Krypto und Technologie.