Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Google: Gemini 3.1 Flash Lite

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-08

Metriek DeepSeek V4 Flash DeepSeek V4 Flash high Releasedatum: 2026-04-24 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Releasedatum: 2026-05-08
Score 7.6 7.9
Rang #48 #27
Betrouwbaarheid 10.0 10.0
Consistentie 7.9 9.1
Correcte tests
Slaagpercentage per poging 75.4% 71.9%
Instabiele tests 5 2
Totaal runs 57 57
Kosten per resultaat 0.299 0.452
Totale kosten $0.033 $0.059
Invoerprijs $0.140 / 1M $0.250 / 1M
Uitvoerprijs $0.280 / 1M $1.500 / 1M
Uitvoer-tokens 10,281 2,224
Redeneer-tokens 98,830 32,034
Responstijd (gem.) 45.88s 3.14s
Responstijd (max) 218.13s 10.87s
Responstijd (totaal) 871.76s 59.62s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
Gemini 3.1 Flash Lite 9.1 10.0 75.0% 0 2.39s 604 4,201
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.26s 429 2,712
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 10.87s 327 7,401
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 279 2,845
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 3.16s 15 5,165
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 84 1,142
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
Gemini 3.1 Flash Lite 9.9 10.0 100.0% 0 2.59s 75 3,320
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 6.4 4.4 77.8% 2 25.53s 193 2,597
Gemini 3.1 Flash Lite 7.6 7.2 77.8% 1 1.95s 165 2,450
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 4.55s 234 921
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 8,516 8,531
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 3.08s 12 1,877

Snelle vergelijking

Vergelijkingspaar wisselen