Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Vergeleken modellen

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-26

Metriek MiMo-V2.5 MiMo-V2.5 medium Releasedatum: 2026-04-22 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22 MiMo-V2-Omni MiMo-V2-Omni medium Releasedatum: 2026-03-18 MiMo-V2-Pro MiMo-V2-Pro medium Releasedatum: 2026-03-18
Score 7.8 8.1 7.7 8.1
Rang #41 #27 #43 #28
Betrouwbaarheid n.v.t. n.v.t. n.v.t. n.v.t.
Consistentie 8.6 8.8 9.9 8.6
Correcte tests
Slaagpercentage per poging 74.1% 75.9% 61.1% 77.8%
Instabiele tests 3 3 0 3
Totaal runs 54 54 20 48
Kosten per resultaat 2.102 1.674 1.383 1.320
Totale kosten $0.253 $0.201 $0.153 $0.159
Invoerprijs $0.400 / 1M $1.000 / 1M $0.400 / 1M $1.000 / 1M
Uitvoerprijs $2.000 / 1M $3.000 / 1M $2.000 / 1M $3.000 / 1M
Uitvoer-tokens 2,840 2,735 928 2,360
Redeneer-tokens 116,242 52,571 72,661 38,320
Responstijd (gem.) 13.71s 16.17s 16.76s 12.27s
Responstijd (max) 86.93s 84.22s 158.78s 64.71s
Responstijd (totaal) 246.73s 291.09s 301.61s 208.56s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Snelle vergelijking

Vergelijkingspaar wisselen