Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Z.ai: GLM 5.1

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-07

Métrica Gemini 3 Flash Preview Gemini 3 Flash Preview none Lanzamiento: 2025-12-17 GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07
Puntuación 8.0 8.0
Rango #22 #23
Consistencia 9.0 9.0
Pruebas correctas
Tasa de aciertos por intento 76.5% 76.5%
Pruebas inestables 2 2
Ejecuciones totales 51 51
Costo por resultado 0.156 1.270
Costo total $0.019 $0.153
Precio de entrada $0.500 / 1M $1.000 / 1M
Precio de salida $3.000 / 1M $3.200 / 1M
Tokens de salida 1,417 6,666
Tokens de razonamiento 0 35,313
Tiempo de respuesta (promedio) 1.66s 18.23s
Tiempo de respuesta (máximo) 3.56s 43.11s
Tiempo de respuesta (total) 16.61s 291.73s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 8.3 10.0 75.0% 0 1.25s 214 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 4.7 1.6 66.7% 1 3.56s 350 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.41s 279 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 963ms 18 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.13s 104 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 6.4 5.8 66.7% 1 1.58s 74 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 1.06s 144 0
GLM 5.1 8.2 7.2 88.9% 1 23.85s 899 5,627
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.35s 234 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0

Comparación rápida

Cambiar par de comparación