Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Elephant Alpha vs Z.ai: GLM 4.7 Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica Elephant Alpha Elephant Alpha none Lanzamiento: 2026-04-14 GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19
Puntuación 5.2 5.6
Rango #136 #118
Fiabilidad N/D 10.0
Consistencia 9.6 8.7
Pruebas correctas
Tasa de aciertos por intento 29.8% 38.3%
Pruebas inestables 1 3
Ejecuciones totales 60 60
Costo por resultado 0.000 0.053
Costo total $0.000 $0.004
Precio de entrada $0.000 / 1M $0.060 / 1M
Precio de salida $0.000 / 1M $0.400 / 1M
Tokens de salida 2,573 2,515
Tokens de razonamiento 0 0
Tiempo de respuesta (promedio) 1.22s 3.01s
Tiempo de respuesta (máximo) 3.81s 7.05s
Tiempo de respuesta (total) 22.03s 39.12s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 6.6 10.0 50.0% 0 963ms 610 0
GLM 4.7 Flash 5.2 7.9 41.7% 1 5.51s 438 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 4.7 6.7 33.3% 1 1.39s 375 0
GLM 4.7 Flash 5.0 10.0 0.0% 0 3.35s 644 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 3.0 10.0 0.0% 0 3.81s 731 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 3.22s 704 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 6.5 10.0 50.0% 0 1.04s 246 0
GLM 4.7 Flash 7.3 5.8 83.3% 1 4.82s 196 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 3.0 10.0 0.0% 0 927ms 24 0
GLM 4.7 Flash 7.7 10.0 66.7% 0 744ms 19 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 4.0 10.0 0.0% 0 854ms 106 0
GLM 4.7 Flash 4.0 10.0 0.0% 0 1.59s 134 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 9.8 10.0 100.0% 0 1.03s 81 0
GLM 4.7 Flash 6.5 10.0 50.0% 0 888ms 62 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 4.2 10.0 0.0% 0 807ms 170 0
GLM 4.7 Flash 6.4 10.0 33.3% 0 1.20s 97 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 3.0 10.0 0.0% 0 2.79s 230 0
GLM 4.7 Flash 2.8 1.6 33.3% 1 7.05s 212 0
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Elephant Alpha 0.0 0.0 0.0% 0 0ms 0 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 692ms 9 0

Comparación rápida

Cambiar par de comparación