Anthropic: Claude Opus 4.7 vs Anthropic: Claude Sonnet 4.6

Claude Opus 4.7 (medium) führt beim Durchschnittsscore mit 8.7 vs 7.8. Claude Opus 4.7 (medium) hat die niedrigeren Benchmark-Kosten mit $1.477 vs $2.057. Claude Opus 4.7 (medium) ist schneller mit 7.61s vs 25.91s, mit Erfolgsraten von 83.3% vs 66.7%.

Empfohlenes ModellClaude Opus 4.7 (medium)Es hat hier die beste Punktzahl (8.7) und antwortet etwa 3.4x schneller als Claude Sonnet 4.6 (medium).

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-07-20

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Veröffentlichung: 2026-02-17

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Veröffentlichung: 2026-02-17
Punktzahl	8.7	7.8
Rang	#15	#40
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	9.2
Korrekte Tests
Erfolgsquote pro Versuch	83.3%	66.7%
Instabile Tests	1	2
Gesamtläufe	66	66
Kosten pro Ergebnis	8.201	14.692
Gesamtkosten	$1.477	$2.057
Eingabepreis	$5.000 / 1M	$3.000 / 1M
Ausgabepreis	$25.000 / 1M	$15.000 / 1M
Gesamte Eingabe-Token	145,252	106,292
Ausgabe-Token	24,948	80,748
Denk-Token	5,042	35,117
Antwortzeit (Durchschnitt)	7.61s	25.91s
Antwortzeit (Maximum)	65.40s	140.96s
Antwortzeit (Gesamt)	159.91s	362.78s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Claude Opus 4.7

medium

Kosten: $0.059
Zeit: 26.8s
Token: 2,475 tok

#40 Claude Sonnet 4.6

medium

Ungültiges SVG

Kosten: $0.000
Zeit: 300.0s
Token: 0 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586

Schnellvergleich

Vergleichspaar wechseln

Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh Claude Sonnet 4.6mediumvsKimi K3max Claude Sonnet 4.6mediumvsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsDeepSeek V4 Prohigh Claude Sonnet 4.6mediumvsGLM 5.2high Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsInklinghigh Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Sonnet 4.6mediumvsMuse Spark 1.1high Claude Opus 4.7mediumvsGrok 4.5low