DeepSeek: DeepSeek V4 Flash vs Google: Gemini 2.5 Flash

Gemini 2.5 Flash (medium) führt beim Durchschnittsscore mit 8.2 vs 7.7. DeepSeek V4 Flash (high) hat die niedrigeren Benchmark-Kosten mit $0.041 vs $0.643. Gemini 2.5 Flash (medium) ist schneller mit 21.18s vs 49.75s, mit Erfolgsraten von 72.7% vs 71.2%.

Empfohlenes ModellDeepSeek V4 Flash (high)Die Punktzahl bleibt nah an der besten hier (7.7 vs 8.2) und es kostet etwa 16.0x weniger als Gemini 2.5 Flash (medium).

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-07-25

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24	Gemini 2.5 Flash Gemini 2.5 Flash medium Veröffentlichung: 2025-06-17

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24	Gemini 2.5 Flash Gemini 2.5 Flash medium Veröffentlichung: 2025-06-17
Punktzahl	7.7	8.2
Rang	#52	#31
Zuverlässigkeit	10.0	10.0
Konsistenz	8.2	9.6
Korrekte Tests
Erfolgsquote pro Versuch	72.7%	71.2%
Instabile Tests	5	1
Gesamtläufe	66	66
Kosten pro Ergebnis	0.402	4.286
Gesamtkosten	$0.041	$0.643
Eingabepreis	$0.094 / 1M	$0.300 / 1M
Ausgabepreis	$0.188 / 1M	$2.500 / 1M
Gesamte Eingabe-Token	108,392	132,498
Ausgabe-Token	14,478	12,739
Denk-Token	153,687	228,464
Antwortzeit (Durchschnitt)	49.75s	21.18s
Antwortzeit (Maximum)	218.13s	140.50s
Antwortzeit (Gesamt)	1094.41s	465.89s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Kosten: $0.003
Zeit: 93.1s
Token: 7,926 tok

#31 Gemini 2.5 Flash

medium

Ungültiges SVG

Kosten: $0.000
Zeit: 274.0s
Token: 0 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Gemini 2.5 Flash	8.4	10.0	75.0%	0		6.30s	492	255	10,233

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Gemini 2.5 Flash	7.8	10.0	66.7%	0		41.01s	6,669	543	32,303

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
Gemini 2.5 Flash	10.0	10.0	100.0%	0		84.47s	110,544	11,112	95,241

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Gemini 2.5 Flash	10.0	10.0	100.0%	0		4.06s	7,257	279	2,325

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Gemini 2.5 Flash	5.9	7.2	55.6%	1		37.34s	633	18	80,702

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Gemini 2.5 Flash	4.8	10.0	0.0%	0		4.86s	486	92	1,899

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Gemini 2.5 Flash	9.8	10.0	100.0%	0		2.62s	615	69	1,203

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Gemini 2.5 Flash	7.7	10.0	66.7%	0		3.18s	558	126	2,499

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Gemini 2.5 Flash	10.0	10.0	100.0%	0		6.20s	5,088	234	1,140

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Gemini 2.5 Flash	3.0	10.0	0.0%	0		2.76s	156	11	919

Schnellvergleich

Vergleichspaar wechseln

Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Gemini 2.5 FlashmediumvsMuse Spark 1.1low DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 FlashhighvsGrok Build 0.1medium Claude Opus 4.8lowvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGPT-5.6 Lunamedium DeepSeek V4 FlashhighvsNemotron 3 UltramediumKostenlos verfügbar Claude Opus 5nonevsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsKimi K2.7 Codemedium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium Gemini 2.5 FlashmediumvsMuse Spark 1.1high