Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Xiaomi: MiMo-V2-Omni

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-21

Metriek Qwen3.5-Flash Qwen3.5-Flash medium Releasedatum: 2026-02-24 MiMo-V2-Omni MiMo-V2-Omni medium Releasedatum: 2026-03-18
Score 8.0 7.9
Rang #19 #22
Consistentie 7.6 10.0
Correcte tests
Slaagpercentage per poging 82.4% 64.7%
Instabiele tests 5 0
Totaal runs 51 17
Kosten per resultaat 0.688 0.763
Totale kosten $0.076 $0.084
Invoerprijs $0.065 / 1M $0.400 / 1M
Uitvoerprijs $0.260 / 1M $2.000 / 1M
Uitvoer-tokens 1,827 663
Redeneer-tokens 179,299 39,001
Responstijd (gem.) 67.96s 13.71s
Responstijd (max) 234.29s 158.78s
Responstijd (totaal) 1155.28s 233.06s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

Snelle vergelijking

Vergelijkingspaar wisselen