Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Qwen: Qwen3.5-122B-A10B

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-28

Métrica Gemma 4 26B A4B Gemma 4 26B A4B medium Lanzamiento: 2026-04-03 Disponible gratis Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lanzamiento: 2026-02-24
Puntuación 7.8 7.7
Rango #32 #41
Fiabilidad 10.0 10.0
Consistencia 9.2 8.8
Pruebas correctas
Tasa de aciertos por intento 73.3% 71.7%
Pruebas inestables 2 3
Ejecuciones totales 60 60
Costo por resultado 0.317 5.031
Costo total $0.038 $0.509
Precio de entrada $0.060 / 1M $0.260 / 1M
Precio de salida $0.330 / 1M $2.080 / 1M
Tokens de salida 28,000 26,166
Tokens de razonamiento 82,045 213,524
Tiempo de respuesta (promedio) 50.92s 39.40s
Tiempo de respuesta (máximo) 369.32s 168.16s
Tiempo de respuesta (total) 967.47s 788.00s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 1,142 3,045
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 2.9 10.0 0.0% 0 258.40s 14,838 26,122
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 5,415 13,112
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 1,567 2,827
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 2,469 7,105
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 25 5,075
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 887 4,470
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 410 2,128
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 450 1,256
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 797 16,905
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

Comparación rápida

Cambiar par de comparación