AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

xAI: Grok 4.1 Fast

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica xAI: Grok 4.1 Fast
Rango#8
EmpresaX Ai
Score 6.42
Consistencia 8.60
Costo por resultado 0.4800
Costo total $0.03360
Pruebas correctas 7/12
Tasa de aciertos por intento 66.7%
Pruebas inestables 2
Tokens de salida 437
Tokens de razonamiento 61,090

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 4.00 $0.00151
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.00 $0.00438
Domain specific 1/3 4.00 7.21 55.6% 1 5.00 $0.02064
Instructions following 1/2 5.50 10.00 50.0% 0 3.25 $0.00191
Puzzle Solving 1/3 4.67 7.20 44.4% 1 8.50 $0.00518

Modelos comparados

Comparar xAI: Grok 4.1 Fast contra...

#7 · Z.ai

Z.ai: GLM 5

Razonamiento (medium)

Score: 6.83

Consistencia: 7.86

Tasa de aciertos por intento: 80.6%

Pruebas inestables: 3

Costo por resultado: 1.3424

Pruebas correctas: 8/12

Costo total: $0.10740

Comparar

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

Razonamiento (medium)

Score: 6.42

Consistencia: 8.00

Tasa de aciertos por intento: 72.2%

Pruebas inestables: 3

Costo por resultado: 2.4097

Pruebas correctas: 7/12

Costo total: $0.16868

Comparar

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Razonamiento (medium)

Score: 7.00

Consistencia: 9.30

Tasa de aciertos por intento: 69.4%

Pruebas inestables: 1

Costo por resultado: 9.3797

Pruebas correctas: 8/12

Costo total: $0.75038

Comparar

Comparación rápida

Comparar xAI: Grok 4.1 Fast contra...