Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-24

Metriek DeepSeek V4 Pro DeepSeek V4 Pro high Releasedatum: 2026-04-24 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Releasedatum: 2026-03-03
Score 8.2 8.1
Rang #20 #26
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 9.6 10.0
Correcte tests
Slaagpercentage per poging 74.1% 72.2%
Instabiele tests 1 0
Totaal runs 24 54
Kosten per resultaat 1.224 0.168
Totale kosten $0.160 $0.022
Invoerprijs $1.740 / 1M $0.250 / 1M
Uitvoerprijs $3.480 / 1M $1.500 / 1M
Uitvoer-tokens 671 2,247
Redeneer-tokens 39,383 8,058
Responstijd (gem.) 71.21s 3.22s
Responstijd (max) 351.99s 11.91s
Responstijd (totaal) 1281.73s 58.00s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.20s 630 372
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993

Snelle vergelijking

Vergelijkingspaar wisselen