Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs DeepSeek: DeepSeek V4 Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek DeepSeek V3.2 DeepSeek V3.2 medium Releasedatum: 2025-12-01 DeepSeek V4 Pro DeepSeek V4 Pro high Releasedatum: 2026-04-24
Score 7.0 6.6
Rang #71 #80
Betrouwbaarheid 9.1 9.0
Consistentie 7.6 8.3
Correcte tests
Slaagpercentage per poging 69.2% 66.7%
Instabiele tests 6 4
Totaal runs 60 60
Kosten per resultaat 0.334 1.927
Totale kosten $0.037 $0.212
Invoerprijs $0.252 / 1M $0.435 / 1M
Uitvoerprijs $0.378 / 1M $0.870 / 1M
Uitvoer-tokens 7,049 12,211
Redeneer-tokens 68,203 53,774
Responstijd (gem.) 53.21s 58.93s
Responstijd (max) 189.03s 358.35s
Responstijd (totaal) 1064.26s 1119.75s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
DeepSeek V4 Pro 7.4 10.0 75.0% 0 16.53s 71 3,617
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 640 21,230
DeepSeek V4 Pro 2.8 5.0 25.0% 1 51.77s 105 2,641
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 465 5,914
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
DeepSeek V4 Pro 8.8 10.0 100.0% 0 23.62s 229 1,710
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
DeepSeek V4 Pro 3.0 6.9 16.7% 1 205.66s 10,529 28,089
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
DeepSeek V4 Pro 7.4 7.2 88.9% 1 34.92s 106 3,835
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 53 3,807

Snelle vergelijking

Vergelijkingspaar wisselen