Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2.5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Claude Opus 4.6 Claude Opus 4.6 medium Releasedatum: 2026-02-05 MiMo-V2.5 MiMo-V2.5 medium Releasedatum: 2026-04-22
Score 7.2 7.4
Rang #63 #53
Betrouwbaarheid 10.0 10.0
Consistentie 9.1 8.4
Correcte tests
Slaagpercentage per poging 63.3% 70.0%
Instabiele tests 2 4
Totaal runs 60 60
Kosten per resultaat 15.798 2.877
Totale kosten $1.896 $0.346
Invoerprijs $5.000 / 1M $0.400 / 1M
Uitvoerprijs $25.000 / 1M $2.000 / 1M
Uitvoer-tokens 42,253 2,891
Redeneer-tokens 23,561 161,845
Responstijd (gem.) 25.44s 20.40s
Responstijd (max) 83.40s 97.49s
Responstijd (totaal) 330.70s 407.98s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 7.2 9.8 50.0% 0 29.37s 7,865 3,675
MiMo-V2.5 6.9 6.2 66.7% 1 64.48s 536 44,967
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 22 15,484

Snelle vergelijking

Vergelijkingspaar wisselen