AI BENCHY Compare
Elephant vs Z.ai: GLM 5.1
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-14
| Métrica | Elephant Elephant medium | GLM 5.1 GLM 5.1 none |
|---|---|---|
| Puntuación | 5.2 | 5.6 |
| Rango | #77 | #71 |
| Consistencia | 9.6 | 8.2 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 29.6% | 37.0% |
| Pruebas inestables | 1 | 4 |
| Ejecuciones totales | 54 | 54 |
| Costo por resultado | 0.000 | 1.046 |
| Costo total | $0.000 | $0.053 |
| Precio de entrada | $0.000 / 1M | $0.950 / 1M |
| Precio de salida | $0.000 / 1M | $3.150 / 1M |
| Tokens de salida | 2,596 | 3,720 |
| Tokens de razonamiento | 0 | 0 |
| Tiempo de respuesta (promedio) | 1.27s | 4.33s |
| Tiempo de respuesta (máximo) | 3.70s | 32.57s |
| Tiempo de respuesta (total) | 22.82s | 78.02s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
ElephantmediumvsGrok 4.20noneMistral Small 4nonevsElephantmediumgpt-oss-120bnoneDisponible gratisvsElephantmediumMistral Small 4mediumvsGLM 5.1noneTrinity Large PreviewnoneDisponible gratisvsElephantmediumMiniMax M2.5mediumDisponible gratisvsGLM 5.1noneGPT-5.4 MininonevsElephantmediumElephantmediumvsQwen3 Coder NextnoneNemotron 3 SupernoneDisponible gratisvsElephantmediumgpt-oss-120bmediumDisponible gratisvsGLM 5.1noneElephantmediumvsGLM 5 TurbononeKimi K2.5nonevsElephantmedium