Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-22

Metriek Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 8.1 8.1
Rang #19 #23
Consistentie 8.6 8.8
Correcte tests
Slaagpercentage per poging 79.6% 75.9%
Instabiele tests 3 3
Totaal runs 54 54
Kosten per resultaat 4.060 1.674
Totale kosten $0.528 $0.201
Invoerprijs $0.260 / 1M $1.000 / 1M
Uitvoerprijs $2.080 / 1M $3.000 / 1M
Uitvoer-tokens 17,635 2,735
Redeneer-tokens 162,668 52,571
Responstijd (gem.) 31.38s 16.17s
Responstijd (max) 119.29s 84.22s
Responstijd (totaal) 564.84s 291.09s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 4.7 1.6 66.7% 1 70.98s 322 10,694
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908

Snelle vergelijking

Vergelijkingspaar wisselen