Claude Opus 4.7 (medium) vs Gemini 3.5 Flash

Empfohlenes Modell Claude Opus 4.7 (medium)

Es hat die stärkste Punktzahl in diesem Vergleich (8.7) und die beste Gesamtbalance aus Kosten und Antwortzeit über alle 2 Modelle.

Detaillierter Vergleich

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash none Veröffentlichung: 2026-05-19

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash none Veröffentlichung: 2026-05-19
Punktzahl	8.7	7.0
Rang	#20	#87
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	8.9
Korrekte Tests
Erfolgsquote pro Versuch	83.3%	74.2%
Instabile Tests	1	3
Gesamtläufe	66	66
Kosten pro Ergebnis	8.201	7.190
Gesamtkosten	$1.477	$1.079
Eingabepreis	$5.000 / 1M	$1.500 / 1M
Ausgabepreis	$25.000 / 1M	$9.000 / 1M
Gesamte Eingabe-Token	145,252	13,843
Ausgabe-Token	24,948	117,518
Denk-Token	5,042	0
Antwortzeit (Durchschnitt)	7.61s	9.93s
Antwortzeit (Maximum)	65.40s	64.36s
Antwortzeit (Gesamt)	159.91s	178.68s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

Vergleichspaar wechseln