AI BENCHY
Compară
❤️ Made by XCS

Nume model

MiniMax: MiniMax M2.5

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică MiniMax: MiniMax M2.5
Rang#17
CompanieMiniMax
Score 5.08
Consistență 6.00
Cost per rezultat 4.0276
Cost total $0.20138
Teste corecte 5/12
Rată de trecere pe încercare 61.1%
Teste instabile 6
Tokenuri de ieșire 121,028
Tokenuri de raționament 165,110

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Modele comparate

Compară MiniMax: MiniMax M2.5 cu...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Raționament (medium)

Score: 5.42

Consistență: 8.60

Rată de trecere pe încercare: 55.5%

Teste instabile: 2

Cost per rezultat: 12.8695

Teste corecte: 6/12

Cost total: $0.77217

Compară

#18 · Stepfun

StepFun: Step 3.5 Flash

Raționament (medium)

Score: 4.92

Consistență: 7.34

Rată de trecere pe încercare: 58.3%

Teste instabile: 4

Cost per rezultat: 0.0000

Teste corecte: 5/12

Cost total: $0.00000

Compară

#15 · Z.ai

Z.ai: GLM 5

Fără raționament

Score: 5.42

Consistență: 10.00

Rată de trecere pe încercare: 50.0%

Teste instabile: 0

Cost per rezultat: 0.0704

Teste corecte: 6/12

Cost total: $0.00423

Compară

Comparație rapidă

Compară MiniMax: MiniMax M2.5 cu...