Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-04-20 vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-27

Metriek Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Releasedatum: 2026-04-20 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 8.1 8.1
Rang #32 #30
Betrouwbaarheid 9.7 n.v.t.
Consistentie 9.0 8.8
Correcte tests
Slaagpercentage per poging 77.8% 75.9%
Instabiele tests 2 3
Totaal runs 54 54
Kosten per resultaat 2.065 1.674
Totale kosten $0.269 $0.201
Invoerprijs $0.400 / 1M $1.000 / 1M
Uitvoerprijs $2.400 / 1M $3.000 / 1M
Uitvoer-tokens 2,179 2,735
Redeneer-tokens 103,832 52,571
Responstijd (gem.) 32.81s 16.17s
Responstijd (max) 92.41s 84.22s
Responstijd (totaal) 590.65s 291.09s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 215 7,748
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 7.6 10.0 100.0% 0 85.72s 248 11,081
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 483 17,490
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 270 14,668
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 63 28,414
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 125 4,792
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 103 7,689
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.58s 324 9,786
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 348 2,164
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908

Snelle vergelijking

Vergelijkingspaar wisselen