AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 31B

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-10

Metrik	DeepSeek V3.2 DeepSeek V3.2 medium Veröffentlichung: 2025-12-01	Gemma 4 31B Gemma 4 31B none Veröffentlichung: 2026-04-02 Kostenlos verfügbar

Metrik	DeepSeek V3.2 DeepSeek V3.2 medium Veröffentlichung: 2025-12-01	Gemma 4 31B Gemma 4 31B none Veröffentlichung: 2026-04-02 Kostenlos verfügbar
Punktzahl	7.2	6.9
Rang	#61	#66
Zuverlässigkeit	10.0	10.0
Konsistenz	7.5	10.0
Korrekte Tests
Erfolgsquote pro Versuch	72.8%	52.6%
Instabile Tests	6	0
Gesamtläufe	57	57
Kosten pro Ergebnis	0.278	0.025
Gesamtkosten	$0.031	$0.003
Eingabepreis	$0.252 / 1M	$0.130 / 1M
Ausgabepreis	$0.378 / 1M	$0.380 / 1M
Ausgabe-Token	7,035	1,371
Denk-Token	53,765	0
Antwortzeit (Durchschnitt)	46.06s	3.86s
Antwortzeit (Maximum)	180.92s	26.13s
Antwortzeit (Gesamt)	875.23s	65.57s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	9.2	10.0	100.0%	0		24.23s	3,247	6,953
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	45	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792
Gemma 4 31B	10.0	10.0	100.0%	0		26.13s	699	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	285	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	21	6,838
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	27	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.8	2.5	50.0%	1		58.29s	49	2,189
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	117	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	78	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	6.7	5.0	66.7%	2		36.87s	390	6,281
Gemma 4 31B	6.5	10.0	33.3%	0		2.95s	108	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	20	7,019
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	12	0

Schnellvergleich

Vergleichspaar wechseln

Claude Sonnet 4.6nonevsDeepSeek V3.2medium DeepSeek V4 ProhighvsGemma 4 31BnoneKostenlos verfügbar Gemma 4 31BnoneKostenlos verfügbarvsGrok 4.20medium Gemma 4 31BnoneKostenlos verfügbarvsGPT-5 Minimedium DeepSeek V3.2mediumvsRing 2.6 1tnoneKostenlos verfügbar DeepSeek V3.2mediumvsQwen3.6 Max Previewnone Gemma 4 31BnoneKostenlos verfügbarvsKimi K2.5medium Gemma 4 31BnoneKostenlos verfügbarvsQwen3.6 27Bmedium Gemma 4 31BnoneKostenlos verfügbarvsMiMo-V2-Omnimedium Gemma 4 31BnoneKostenlos verfügbarvsGPT-5.4 Minimedium Gemma 4 31BnoneKostenlos verfügbarvsGPT-5.2medium Gemma 4 31BnoneKostenlos verfügbarvsQwen3.5-35B-A3Bmedium