Claude Opus 4.7 (medium) vs Gemini 3.5 Flash (minimal)

Empfohlenes Modell Claude Opus 4.7 (medium)

Es hat die stärkste Punktzahl in diesem Vergleich (8.7) und die beste Gesamtbalance aus Kosten und Antwortzeit über alle 2 Modelle.

Detaillierter Vergleich

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19
Punktzahl	8.7	6.8
Rang	#20	#99
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	9.6
Korrekte Tests
Erfolgsquote pro Versuch	83.3%	65.2%
Instabile Tests	1	1
Gesamtläufe	66	66
Kosten pro Ergebnis	8.201	2.138
Gesamtkosten	$1.477	$0.300
Eingabepreis	$5.000 / 1M	$1.500 / 1M
Ausgabepreis	$25.000 / 1M	$9.000 / 1M
Gesamte Eingabe-Token	145,252	100,753
Ausgabe-Token	24,948	16,454
Denk-Token	5,042	0
Antwortzeit (Durchschnitt)	7.61s	2.65s
Antwortzeit (Maximum)	65.40s	25.26s
Antwortzeit (Gesamt)	159.91s	58.27s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

minimal

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0

Vergleichspaar wechseln