Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2-Omni

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek DeepSeek V3.2 DeepSeek V3.2 medium Releasedatum: 2025-12-01 MiMo-V2-Omni MiMo-V2-Omni medium Releasedatum: 2026-03-18
Score 7.3 6.9
Rang #67 #81
Betrouwbaarheid 10.0 10.0
Consistentie 7.9 8.7
Correcte tests
Slaagpercentage per poging 67.5% 58.3%
Instabiele tests 5 3
Totaal runs 60 52
Kosten per resultaat 0.335 7.334
Totale kosten $0.037 $0.734
Invoerprijs $0.252 / 1M $0.400 / 1M
Uitvoerprijs $0.378 / 1M $2.000 / 1M
Uitvoer-tokens 7,177 1,952
Redeneer-tokens 68,297 357,306
Responstijd (gem.) 53.34s 41.16s
Responstijd (max) 189.03s 299.23s
Responstijd (totaal) 1066.71s 823.26s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.75s 269 1,701
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
MiMo-V2-Omni 3.4 4.8 16.7% 1 183.89s 292 174,314
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
MiMo-V2-Omni 10.0 10.0 100.0% 0 25.87s 380 8,673
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
MiMo-V2-Omni 10.0 10.0 100.0% 0 3.04s 155 591
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
MiMo-V2-Omni 3.0 10.0 0.0% 0 47.89s 155 68,398
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
MiMo-V2-Omni 5.4 2.5 66.7% 1 3.61s 136 492
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.99s 49 515
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
MiMo-V2-Omni 5.9 7.2 55.6% 1 2.38s 210 860
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
MiMo-V2-Omni 10.0 10.0 100.0% 0 13.98s 303 3,461
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
MiMo-V2-Omni 3.0 10.0 0.0% 0 234.19s 3 98,301

Snelle vergelijking

Vergelijkingspaar wisselen