AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

MiniMax: MiniMax M2.5

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica MiniMax: MiniMax M2.5
Rango#17
EmpresaMiniMax
Score 5.08
Consistencia 6.00
Costo por resultado 4.0276
Costo total $0.20138
Pruebas correctas 5/12
Tasa de aciertos por intento 61.1%
Pruebas inestables 6
Tokens de salida 121,028
Tokens de razonamiento 165,110

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Modelos comparados

Comparar MiniMax: MiniMax M2.5 contra...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Razonamiento (medium)

Score: 5.42

Consistencia: 8.60

Tasa de aciertos por intento: 55.5%

Pruebas inestables: 2

Costo por resultado: 12.8695

Pruebas correctas: 6/12

Costo total: $0.77217

Comparar

#18 · Stepfun

StepFun: Step 3.5 Flash

Razonamiento (medium)

Score: 4.92

Consistencia: 7.34

Tasa de aciertos por intento: 58.3%

Pruebas inestables: 4

Costo por resultado: 0.0000

Pruebas correctas: 5/12

Costo total: $0.00000

Comparar

#15 · Z.ai

Z.ai: GLM 5

Sin razonamiento

Score: 5.42

Consistencia: 10.00

Tasa de aciertos por intento: 50.0%

Pruebas inestables: 0

Costo por resultado: 0.0704

Pruebas correctas: 6/12

Costo total: $0.00423

Comparar

Comparación rápida

Comparar MiniMax: MiniMax M2.5 contra...