Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-03

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lanzamiento: 2026-03-03	Z.ai: GLM 5 medium Lanzamiento: 2026-02-12
Rango	#10	#13
Puntaje prom.	7.70	7.29
Consistencia	9.54	8.18
Costo por resultado	0.116	1.196
Costo total	$0.011	$0.120
Pruebas correctas
Tasa de aciertos por intento	69.1%	83.3%
Pruebas inestables	1	3
Tokens de salida	4,307	15,923
Tokens de razonamiento	0	42,557

Mejores modelos por puntuación

Puntuación vs costo total

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		420	4,992

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
Z.ai: GLM 5	5.00	5.62	83.3%	1		567	3,734

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
Z.ai: GLM 5	1.00	4.41	33.3%	2		14,404	24,570

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
Z.ai: GLM 5	9.50	9.99	100.0%	0		140	2,740

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		159	5,527

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		233	994

Comparación rápida

Cambiar par de comparación

GPT-5.3 ChatnonevsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewhighvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponible gratis DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium