AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

MiniMax: MiniMax M2.5

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek MiniMax: MiniMax M2.5
Rang#17
BedrijfMiniMax
Score 5.08
Consistentie 6.00
Kosten per resultaat 4.0276
Totale kosten $0.20138
Correcte tests 5/12
Slaagpercentage per poging 61.1%
Instabiele tests 6
Uitvoer-tokens 121,028
Redeneer-tokens 165,110

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Vergeleken modellen

Vergelijk MiniMax: MiniMax M2.5 met...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Redenering (medium)

Score: 5.42

Consistentie: 8.60

Slaagpercentage per poging: 55.5%

Instabiele tests: 2

Kosten per resultaat: 12.8695

Correcte tests: 6/12

Totale kosten: $0.77217

Vergelijken

#18 · Stepfun

StepFun: Step 3.5 Flash

Redenering (medium)

Score: 4.92

Consistentie: 7.34

Slaagpercentage per poging: 58.3%

Instabiele tests: 4

Kosten per resultaat: 0.0000

Correcte tests: 5/12

Totale kosten: $0.00000

Vergelijken

#15 · Z.ai

Z.ai: GLM 5

Zonder redenering

Score: 5.42

Consistentie: 10.00

Slaagpercentage per poging: 50.0%

Instabiele tests: 0

Kosten per resultaat: 0.0704

Correcte tests: 6/12

Totale kosten: $0.00423

Vergelijken

Snelle vergelijking

Vergelijk MiniMax: MiniMax M2.5 met...