AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-16

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Veröffentlichung: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash none Veröffentlichung: 2025-06-17

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Veröffentlichung: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash none Veröffentlichung: 2025-06-17
Punktzahl	6.1	6.2
Rang	#63	#61
Konsistenz	8.1	9.2
Korrekte Tests
Erfolgsquote pro Versuch	50.0%	44.4%
Instabile Tests	4	2
Gesamtläufe	54	54
Kosten pro Ergebnis	0.226	0.184
Gesamtkosten	$0.016	$0.013
Eingabepreis	$0.260 / 1M	$0.300 / 1M
Ausgabepreis	$0.380 / 1M	$2.500 / 1M
Ausgabe-Token	8,384	1,726
Denk-Token	0	0
Antwortzeit (Durchschnitt)	12.09s	903ms
Antwortzeit (Maximum)	115.89s	4.39s
Antwortzeit (Gesamt)	217.56s	16.26s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Gemini 2.5 Flash	3.0	10.0	0.0%	0		582ms	102	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		1.16s	453	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemini 2.5 Flash	3.0	10.0	0.0%	0		4.39s	366	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		652ms	279	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
Gemini 2.5 Flash	5.9	7.2	55.6%	1		495ms	12	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Gemini 2.5 Flash	5.0	10.0	0.0%	0		615ms	78	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemini 2.5 Flash	8.0	6.8	66.7%	1		672ms	70	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Gemini 2.5 Flash	5.7	10.0	33.3%	0		576ms	132	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		1.91s	234	0

Schnellvergleich

Vergleichspaar wechseln

Gemini 2.5 FlashnonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsgpt-oss-120bmediumKostenlos verfügbar Gemini 2.5 Flashnonevsgpt-oss-120bmediumKostenlos verfügbar Gemini 2.5 FlashnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsMiniMax M2.5mediumKostenlos verfügbar DeepSeek V3.2nonevsMistral Small 4medium Gemini 2.5 FlashnonevsMiniMax M2.5mediumKostenlos verfügbar Gemini 2.5 FlashnonevsGrok 4.1 Fastmedium Gemini 2.5 FlashnonevsMistral Small 4medium DeepSeek V3.2nonevsGrok 4.1 Fastmedium