AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 4.7 Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash low Lanzamiento: 2026-05-19	GLM 4.7 Flash GLM 4.7 Flash medium Lanzamiento: 2026-01-19

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash low Lanzamiento: 2026-05-19	GLM 4.7 Flash GLM 4.7 Flash medium Lanzamiento: 2026-01-19
Puntuación	9.6	4.5
Rango	#2	#143
Fiabilidad	10.0	10.0
Consistencia	10.0	6.5
Pruebas correctas
Tasa de aciertos por intento	94.7%	36.8%
Pruebas inestables	0	8
Ejecuciones totales	57	57
Costo por resultado	1.359	1.139
Costo total	$0.245	$0.046
Precio de entrada	$1.500 / 1M	$0.060 / 1M
Precio de salida	$9.000 / 1M	$0.400 / 1M
Tokens de salida	2,003	39,759
Tokens de razonamiento	20,245	73,598
Tiempo de respuesta (promedio)	2.84s	30.57s
Tiempo de respuesta (máximo)	6.44s	174.55s
Tiempo de respuesta (total)	54.00s	366.78s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	209	2,536
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	1,122	6,110

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		5.49s	428	3,146
GLM 4.7 Flash	3.6	2.1	33.3%	1		21.26s	969	6,936

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	351	3,050
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	2,585	20,648

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	279	1,164
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	584	2,755

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	12	4,538
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	33,000	25,394

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	119	916
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	18	2,138

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	71	1,652
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	388	2,181

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	288	2,150
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.90s	798	5,225

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	234	403
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	12	690
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	71	1,197

Comparación rápida

Cambiar par de comparación

MiMo-V2-FlashnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Ling-2.6-1TnonevsGLM 4.7 Flashmedium Grok 4.1 FastnonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium MiMo-V2.5nonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium GPT-5.4 MininonevsGLM 4.7 Flashmedium