AI BENCHY
Comparer
❤️ Made by XCS

Nom du modèle

MiniMax: MiniMax M2.5

Benchmarks générés à partir des suites de tests Aibenchy le : 19 févr. 2026

Métrique MiniMax: MiniMax M2.5
Rang#17
EntrepriseMiniMax
Score 5.08
Cohérence 6.00
Coût par résultat 4.0276
Coût total $0.20138
Tests corrects 5/12
Taux de réussite par tentative 61.1%
Tests instables 6
Jetons de sortie 121,028
Jetons de raisonnement 165,110

Répartition par catégorie

Catégorie Tests entièrement réussis Score Cohérence Taux de réussite par tentative Tests instables Score de raisonnement Coût
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Modèles comparés

Comparer MiniMax: MiniMax M2.5 à...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Raisonnement (medium)

Score: 5.42

Cohérence: 8.60

Taux de réussite par tentative: 55.5%

Tests instables: 2

Coût par résultat: 12.8695

Tests corrects: 6/12

Coût total: $0.77217

Comparer

#18 · Stepfun

StepFun: Step 3.5 Flash

Raisonnement (medium)

Score: 4.92

Cohérence: 7.34

Taux de réussite par tentative: 58.3%

Tests instables: 4

Coût par résultat: 0.0000

Tests corrects: 5/12

Coût total: $0.00000

Comparer

#15 · Z.ai

Z.ai: GLM 5

Sans raisonnement

Score: 5.42

Cohérence: 10.00

Taux de réussite par tentative: 50.0%

Tests instables: 0

Coût par résultat: 0.0704

Tests corrects: 6/12

Coût total: $0.00423

Comparer

Comparaison rapide

Comparer MiniMax: MiniMax M2.5 à...