#16

Claude Opus 4.7

Anthropic Veröffentlichung: 2026-04-16 Getestet am: 2026-06-04 13:44 anthropic/claude-opus-4.7::medium

(medium) (none)

Zusammenfassung

Claude Opus 4.7 erreicht 8.7 bei AI BENCHY und liegt auf #16. Das Modell hat 10.0 Zuverlässigkeit, 82.5% Erfolgsrate, $0.679 Gesamtkosten und 4.73s durchschnittliche Antwortzeit.

Was Claude Opus 4.7 besonders macht: Es ist im Vergleich zu ähnlichen Modellen auffällig schnell.

Punktzahl

8.7

Konsistenz

9.6

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.679

Gesamte Ausgabe-Token

14,056

Gesamte Eingabe-Token

65,406

Eingabepreis

$5.000 / 1M

Ausgabepreis

$25.000 / 1M

Korrekte Tests

Falsche Tests: 4

Erfolgsquote pro Versuch: 82.5%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

4.73s

Antwortzeit (Maximum): 23.18s

Antwortzeit (Gesamt): 94.51s

Falsche Antwort: 3 Zeitüberschreitung: 1

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#16 Claude Opus 4.7

medium

Kosten: $0.059
Zeit: 26.8s
Token: 2,475 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-06-04 13:44 Neuer Test hinzugefügt	8.7	10.0	$0.679	Aktueller Lauf
2026-05-22 00:18 Erneuter Test	8.9	10.0	$0.625	Vergleichen
2026-04-16 15:59 Erster erfasster Lauf	9.2	k. A.	$0.447	Vergleichen

Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-04 15:40	$5.000 / 1M	$25.000 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Claude Opus 4.7mediumvsClaude Opus 4.8medium Claude Opus 4.7mediumvsGLM 5.2medium Claude Opus 4.7mediumvsQwen3.6 Max Previewmedium Claude Opus 4.7mediumvsGLM 5medium Claude Opus 4.7mediumvsGPT-5.3-Codexmedium Claude Opus 4.7mediumvsGPT-5 Minimedium Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3 Flash Previewmedium Claude Opus 4.7mediumvsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar Claude Opus 4.7mediumvsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	8.3	10.0
Programmierung	7.6	7.2
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	7.7	10.0
Allgemeine Intelligenz	10.0	10.0
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	10.0	10.0
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

Claude Opus 4.7

Hamster playing table tennis

#16 Claude Opus 4.7

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle