AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

MoonshotAI: Kimi K2.5

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica MoonshotAI: Kimi K2.5
Rango#9
EmpresaMoonshotAI
Score 6.42
Consistencia 8.00
Costo por resultado 2.4097
Costo total $0.16868
Pruebas correctas 7/12
Tasa de aciertos por intento 72.2%
Pruebas inestables 3
Tokens de salida 30,235
Tokens de razonamiento 53,179

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

Modelos comparados

Comparar MoonshotAI: Kimi K2.5 contra...

#8 · X Ai

xAI: Grok 4.1 Fast

Razonamiento (medium)

Score: 6.42

Consistencia: 8.60

Tasa de aciertos por intento: 66.7%

Pruebas inestables: 2

Costo por resultado: 0.4800

Pruebas correctas: 7/12

Costo total: $0.03360

Comparar

#10 · Google

Google: Gemini 3 Flash Preview

Sin razonamiento

Score: 6.25

Consistencia: 8.60

Tasa de aciertos por intento: 66.7%

Pruebas inestables: 2

Costo por resultado: 0.0754

Pruebas correctas: 7/12

Costo total: $0.00528

Comparar

#7 · Z.ai

Z.ai: GLM 5

Razonamiento (medium)

Score: 6.83

Consistencia: 7.86

Tasa de aciertos por intento: 80.6%

Pruebas inestables: 3

Costo por resultado: 1.3424

Pruebas correctas: 8/12

Costo total: $0.10740

Comparar

Comparación rápida

Comparar MoonshotAI: Kimi K2.5 contra...