AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-15

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lanzamiento: 2026-03-03	GLM 5 GLM 5 medium Lanzamiento: 2026-02-12

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lanzamiento: 2026-03-03	GLM 5 GLM 5 medium Lanzamiento: 2026-02-12
Rango	#16	#13
Puntuación	8.0	8.2
Consistencia	10.0	8.0
Costo por resultado	0.443	0.933
Costo total	$0.049	$0.103
Pruebas correctas
Tasa de aciertos por intento	68.8%	83.3%
Pruebas inestables	0	4
Ejecuciones totales	48	48
Tokens de salida	1,731	19,773
Tokens de razonamiento	25,821	36,459
Tiempo de respuesta (promedio)	3.83s	16.16s
Tiempo de respuesta (máximo)	14.93s	28.96s
Tiempo de respuesta (total)	61.25s	129.26s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	8.8	10.0	66.7%	0		2.53s	564	3,780
GLM 5	10.0	10.0	100.0%	0		22.26s	420	4,992

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
GLM 5	10.0	10.0	100.0%	0		15.64s	1,694	4,983

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone GPT-5.2 ChatnonevsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium GPT-5.3 ChatnonevsGLM 5medium Gemini 3 Flash PreviewlowvsGLM 5medium Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Claude Sonnet 4.6nonevsGLM 5medium Gemini 3.1 Flash Lite PreviewmediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewmediumvsGLM 5none