Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 26B A4B vs xAI: Grok 4.20

Resumen

Comparación benchmark de Gemma 4 26B A4B vs Grok 4.20: Grok 4.20 lidera en puntuación media con 7.3 vs 7.2. Gemma 4 26B A4B tiene menor coste de benchmark con $0.045 vs $0.609. Grok 4.20 es más rápido con 27.68s vs 63.41s, con tasas de acierto de 69.8% vs 63.5%.

Modelo recomendado: Gemma 4 26B A4B - Su puntuación se mantiene cerca de la mejor aquí (7.2 vs 7.3) y cuesta aproximadamente 13.8x menos que Grok 4.20.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-02

Métrica Gemma 4 26B A4B Gemma 4 26B A4B medium Lanzamiento: 2026-04-03 Disponible gratis Grok 4.20 Grok 4.20 medium Lanzamiento: 2026-03-31
Puntuación 7.2 7.3
Rango #61 #55
Fiabilidad 10.0 10.0
Consistencia 9.2 8.8
Pruebas correctas
Tasa de aciertos por intento 69.8% 63.5%
Pruebas inestables 2 3
Ejecuciones totales 63 63
Costo por resultado 0.361 8.309
Costo total $0.045 $0.609
Precio de entrada $0.060 / 1M $1.250 / 1M
Precio de salida $0.330 / 1M $2.500 / 1M
Total de tokens de entrada 40,252 44,433
Tokens de salida 28,000 1,819
Tokens de razonamiento 100,490 219,524
Tiempo de respuesta (promedio) 63.41s 27.68s
Tiempo de respuesta (máximo) 369.32s 199.66s
Tiempo de respuesta (total) 1268.28s 581.26s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemma 4 26B A4B

medium
SVG inválido
Coste
$0.000
Tiempo
300.0s
Tokens
0 tok

#55 xAI: Grok 4.20

medium
Coste
$0.041
Tiempo
110.3s
Tokens
16,336 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

Comparación rápida

Cambiar par de comparación