AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-22

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro none Veröffentlichung: 2026-04-24	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Veröffentlichung: 2026-05-08

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro none Veröffentlichung: 2026-04-24	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Veröffentlichung: 2026-05-08
Punktzahl	6.0	6.6
Rang	#95	#85
Zuverlässigkeit	8.1	10.0
Konsistenz	8.9	8.5
Korrekte Tests
Erfolgsquote pro Versuch	48.3%	55.0%
Instabile Tests	3	4
Gesamtläufe	60	60
Kosten pro Ergebnis	0.564	0.135
Gesamtkosten	$0.046	$0.013
Eingabepreis	$0.435 / 1M	$0.250 / 1M
Ausgabepreis	$0.870 / 1M	$1.500 / 1M
Ausgabe-Token	5,347	2,478
Denk-Token	0	0
Antwortzeit (Durchschnitt)	13.48s	1.09s
Antwortzeit (Maximum)	58.65s	2.97s
Antwortzeit (Gesamt)	269.56s	21.79s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	3.5	8.0	16.7%	1		14.02s	704	0
Gemini 3.1 Flash Lite	7.5	8.4	66.7%	1		1.07s	639	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	5.4	6.8	33.3%	1		8.27s	527	0
Gemini 3.1 Flash Lite	6.8	10.0	50.0%	0		1.13s	660	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	9.5	10.0	100.0%	0		25.49s	1,911	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.73s	357	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	8.8	10.0	100.0%	0		30.54s	170	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		843ms	279	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.17s	18	0
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		762ms	15	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	4.3	9.9	0.0%	0		3.75s	132	0
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		992ms	63	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	6.3	10.0	50.0%	0		8.23s	64	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		859ms	72	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	7.6	7.2	77.8%	1		19.72s	175	0
Gemini 3.1 Flash Lite	6.3	4.8	66.7%	2		720ms	150	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		5.92s	219	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.97s	234	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	3.0	10.0	0.0%	0		15.59s	1,427	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		733ms	9	0

Schnellvergleich

Vergleichspaar wechseln

Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V4 ProhighvsGemini 3.1 Flash Litenone DeepSeek V4 PrononevsNemotron 3 SupermediumKostenlos verfügbar Gemini 3.1 Flash LitenonevsKimi K2.5medium Gemini 3.1 Flash LitenonevsGrok 4.20medium DeepSeek V4 PrononevsOwl Alphamedium DeepSeek V4 PrononevsMercury 2medium CobuddymediumKostenlos verfügbarvsDeepSeek V4 Pronone Gemini 3.1 Flash LitenonevsMercury 2medium Gemini 3.1 Flash LitenonevsGPT-5 Minimedium Gemini 3.1 Flash LitenonevsMiMo-V2-Omnimedium