Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 35B A3B vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-08

Metriek Qwen3.6 35B A3B Qwen3.6 35B A3B medium Releasedatum: 2026-04-20 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 8.0 8.1
Rang #21 #18
Betrouwbaarheid 9.8 10.0
Consistentie 9.1 9.2
Correcte tests
Slaagpercentage per poging 74.5% 74.1%
Instabiele tests 2 2
Totaal runs 57 54
Kosten per resultaat 0.959 1.661
Totale kosten $0.116 $0.200
Invoerprijs $0.150 / 1M $1.000 / 1M
Uitvoerprijs $1.000 / 1M $3.000 / 1M
Uitvoer-tokens 15,018 2,790
Redeneer-tokens 108,331 52,001
Responstijd (gem.) 13.22s 16.23s
Responstijd (max) 45.02s 84.22s
Responstijd (totaal) 224.66s 292.10s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 1,154 12,385
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 32.58s 3,294 15,116
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 2,591 9,968
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 6,193 39,116
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 129 4,569
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 219 7,404
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 7.9 7.5 77.8% 1 5.98s 676 9,447
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 762 10,326
MiMo-V2.5-Pro - - - - - - - -

Snelle vergelijking

Vergelijkingspaar wisselen