AI BENCHY Compare

Google: Gemma 4 26B A4B vs Z.ai: GLM 4.7 Flash

Resumen

Comparación benchmark de Gemma 4 26B A4B vs GLM 4.7 Flash: Gemma 4 26B A4B lidera en puntuación media con 5.5 vs 4.9. Gemma 4 26B A4B tiene menor coste de benchmark con $0.004 vs $0.004. GLM 4.7 Flash es más rápido con 2.86s vs 5.91s, con tasas de acierto de 44.4% vs 36.5%.

Modelo recomendado: Gemma 4 26B A4B - Tiene la puntuación más alta en esta comparación (5.5) y el mejor equilibrio general entre coste y tiempo de respuesta en los 2 modelos.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-02

Métrica	Gemma 4 26B A4B Gemma 4 26B A4B none Lanzamiento: 2026-04-03 Disponible gratis	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19

Métrica	Gemma 4 26B A4B Gemma 4 26B A4B none Lanzamiento: 2026-04-03 Disponible gratis	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19
Puntuación	5.5	4.9
Rango	#125	#146
Fiabilidad	10.0	10.0
Consistencia	9.2	8.8
Pruebas correctas
Tasa de aciertos por intento	44.4%	36.5%
Pruebas inestables	2	3
Ejecuciones totales	63	63
Costo por resultado	0.068	0.056
Costo total	$0.004	$0.004
Precio de entrada	$0.060 / 1M	$0.060 / 1M
Precio de salida	$0.330 / 1M	$0.400 / 1M
Total de tokens de entrada	40,038	38,745
Tokens de salida	1,824	2,521
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	5.91s	2.86s
Tiempo de respuesta (máximo)	57.10s	7.05s
Tiempo de respuesta (total)	124.05s	40.04s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 Gemma 4 26B A4B

none

Coste: $0.001
Tiempo: 39.5s
Tokens: 790 tok

#146 GLM 4.7 Flash

none

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	8.3	10.0	75.0%	0		1.28s	852	230	0
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	555	438	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	3.7	7.2	22.2%	1		4.16s	7,736	476	0
GLM 4.7 Flash	4.3	10.0	0.0%	0		2.54s	7,256	650	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	3.0	10.0	0.0%	0		30.53s	13,650	309	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		3.22s	14,325	704	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	10.0	10.0	100.0%	0		1.70s	8,352	285	0
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	7,107	196	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	3.6	7.2	22.2%	1		2.49s	903	27	0
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	687	19	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	4.0	10.0	0.0%	0		3.54s	576	85	0
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	477	134	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	6.3	10.0	50.0%	0		690ms	795	75	0
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	636	62	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	6.2	10.0	33.3%	0		744ms	828	114	0
GLM 4.7 Flash	6.4	10.0	33.3%	0		1.20s	609	97	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	10.0	10.0	100.0%	0		57.10s	6,123	210	0
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	6,907	212	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemma 4 26B A4B	3.0	10.0	0.0%	0		778ms	223	13	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		692ms	186	9	0

Comparación rápida

Cambiar par de comparación

CobuddymediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGLM 4.7 Flashnone Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsGLM 4.7 Flashnone Gemma 4 26B A4BnoneDisponible gratisvsMiniMax M2.7medium MiniMax M2.7mediumvsGLM 4.7 Flashnone North Mini CodemediumDisponible gratisvsGemma 4 26B A4BnoneDisponible gratis Gemma 4 26B A4BnoneDisponible gratisvsMistral Small 4medium CobuddymediumvsGemma 4 26B A4BnoneDisponible gratis Gemma 4 26B A4BnoneDisponible gratisvsMiniMax M2.5medium Gemma 4 26B A4BnoneDisponible gratisvsQwen3 Coder Nextmedium Gemma 4 26B A4BnoneDisponible gratisvsQwen3.5-35B-A3Bmedium