Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-24

Metriek DeepSeek V4 Pro DeepSeek V4 Pro high Releasedatum: 2026-04-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 8.2 8.1
Rang #20 #27
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 9.6 8.8
Correcte tests
Slaagpercentage per poging 74.1% 75.9%
Instabiele tests 1 3
Totaal runs 24 54
Kosten per resultaat 1.224 1.674
Totale kosten $0.160 $0.201
Invoerprijs $1.740 / 1M $1.000 / 1M
Uitvoerprijs $3.480 / 1M $3.000 / 1M
Uitvoer-tokens 671 2,735
Redeneer-tokens 39,383 52,571
Responstijd (gem.) 71.21s 16.17s
Responstijd (max) 351.99s 84.22s
Responstijd (totaal) 1281.73s 291.09s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908

Snelle vergelijking

Vergelijkingspaar wisselen