#117

Claude Sonnet 5

Anthropic Veröffentlichung: 2026-06-30 Getestet am: 2026-06-30 21:33 anthropic/claude-sonnet-5::none

(medium) (none)

Zusammenfassung

Claude Sonnet 5 erreicht 5.7 bei AI BENCHY und liegt auf #117. Das Modell hat 10.0 Zuverlässigkeit, 42.9% Erfolgsrate, $0.287 Gesamtkosten und 4.74s durchschnittliche Antwortzeit.

Punktzahl

5.7

Konsistenz

8.6

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.287

Gesamte Ausgabe-Token

13,325

Gesamte Eingabe-Token

76,797

Eingabepreis

$2.000 / 1M

Ausgabepreis

$10.000 / 1M

Korrekte Tests

Falsche Tests: 14

Erfolgsquote pro Versuch: 42.9%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

4.74s

Antwortzeit (Maximum): 29.46s

Antwortzeit (Gesamt): 99.46s

Falsche Antwort: 7 Zusätzliche Formatierung: 4 Keine Antwort: 2 Anweisungen nicht befolgt: 1

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Kosten: $0.061
Zeit: 53.7s
Token: 6,172 tok

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-30 21:35	$2.000 / 1M	$10.000 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Claude Sonnet 5nonevsQwen3.5-Flashnone Claude Sonnet 5nonevsGemini 3.1 Flash Liteminimal Claude Sonnet 5nonevsGemma 4 31BnoneKostenlos verfügbar Claude Sonnet 5nonevsGemini 2.5 Flashnone Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bnoneKostenlos verfügbar Claude Sonnet 5nonevsGemini 3.5 Flashhigh Claude Sonnet 5nonevsGemini 3 Flash Previewmedium Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar Claude Sonnet 5nonevsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	5.3	10.0
Programmierung	4.6	7.9
Kombiniert	3.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.3	7.2
Allgemeine Intelligenz	4.7	3.1
Befolgung von Anweisungen	6.4	10.0
Rätsellösen	6.0	7.4
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

Claude Sonnet 5

Hamster playing table tennis

#117 Claude Sonnet 5

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle