#38

Claude Opus 4.8

Anthropic Veröffentlichung: 2026-05-28 Getestet am: 2026-06-30 22:08 anthropic/claude-opus-4.8::low

(medium) (low) (none)

Zusammenfassung

Claude Opus 4.8 erreicht 7.7 bei AI BENCHY und liegt auf #38. Das Modell hat 10.0 Zuverlässigkeit, 79.4% Erfolgsrate, $1.270 Gesamtkosten und 10.83s durchschnittliche Antwortzeit.

Was Claude Opus 4.8 besonders macht: Am stärksten ist es in Rätsellösen, wo es #1 erreicht; am schwächsten ist Datenanalyse und -extraktion mit #17.

Punktzahl

7.7

Konsistenz

8.8

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$1.270

Gesamte Ausgabe-Token

38,602

Gesamte Eingabe-Token

60,946

Eingabepreis

$5.000 / 1M

Ausgabepreis

$25.000 / 1M

Korrekte Tests

Falsche Tests: 6

Erfolgsquote pro Versuch: 79.4%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

10.83s

Antwortzeit (Maximum): 127.97s

Antwortzeit (Gesamt): 227.39s

Falsche Antwort: 4 Zusätzliche Formatierung: 1 Keine Antwort: 1

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low

Kosten: $0.031
Zeit: 14.1s
Token: 1,345 tok

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-30 22:09	$5.000 / 1M	$25.000 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Claude Opus 4.8lowvsKimi K2.6mediumKostenlos verfügbar Claude Opus 4.8lowvsGemini 3.1 Flash Litemedium Claude Opus 4.8lowvsGrok 4.3medium Claude Opus 4.8lowvsQwen3.5 Plus 2026-04-20medium Claude Opus 4.8lowvsClaude Opus 4.6medium Claude Opus 4.8lowvsGemini 3.5 Flashhigh Claude Opus 4.8lowvsGemini 3 Flash Previewmedium Claude Opus 4.8lowvsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar Claude Opus 4.8lowvsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	10.0	10.0
Programmierung	6.6	4.6
Kombiniert	9.8	10.0
Datenanalyse und -extraktion	6.3	5.8
Domänenspezifisch	5.3	10.0
Allgemeine Intelligenz	10.0	10.0
Befolgung von Anweisungen	9.8	10.0
Rätsellösen	10.0	10.0
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

Claude Opus 4.8

Hamster playing table tennis

#38 Claude Opus 4.8

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle